Wir haben einen technologischen Punkt erreicht, an dem unsere digitalen Ökosysteme gleichermaßen unverzichtbar wie verletzlich sind. Tatsächlich ist Disruption durch KI chronisch geworden. Jedes Glied der Kette – von den Drittanbietern bis zu den KI-Agenten – ist eine potenzielle Schwachstelle. Das Resultat: eine Dauerkrise in der ein einziger Ausfall nicht mehr nur ein technischer Ausrutscher ist, sondern seine Kosten die Existenz des gesamten Unternehmens bedrohen.
Aber wie hoch sind die jährlichen Gesamtkosten von Ausfallzeiten im Jahr 2026 überhaupt?
Für die jüngste Splunk-Studie „Die versteckten Kosten von Ausfallzeiten“ haben wir 2.000 Führungskräfte aus Global-2000-Unternehmen befragt. Das Ergebnis: Die Gesamtkosten durch Ausfallzeiten sind auf $ 600 Milliarden pro Jahr gestiegen. Das bedeutet einen Zuwachs von 50 % in nur zwei Jahren. Für ein einzelnes Unternehmen sind das umgerechnet $ 300 Millionen pro Jahr bzw. $ 900.000 pro Stunde – Umsatzverluste, Bußgelder, Lösegeldzahlungen und mehr.
Und das sind nur die direkten Kosten eines Ausfalls. Versteckte Kosten wie Imageschäden und Produktverzögerungen schaden dem Wachstum und der Stellung im Markt auch dann noch, wenn der Incident längst behoben ist.
Ein Ausfall kann also nur kurz sein – doch die Folgen dauern an.
Führungskräfte können es sich nicht mehr leisten, nur zu reagieren. Die resilientesten Unternehmen gehen über die bloße Wiederherstellung hinaus und legen proaktiv die Grundlagen für eine vorausschauende Widerstandsfähigkeit. Sie machen Stabilität zu einem Wettbewerbsvorteil. Hier sind die wichtigsten Ergebnisse der Befragung:
Die direkten Kosten liegen 2026 in vielen Kategorien höher als noch 2024. Bußgelder ($ 51 Mio.) und Ransomware-Zahlungen ($ 40 Mio.) haben sich z. B. fast verdreifacht. Diese Eskalation ist offenbar auf die strengere Durchsetzung von gesetzlichen Vorgaben wie DSGVO und DORA sowie auf die Zunahme hochkomplexer Ransomware-Angriffe zurückzuführen.
Die Folgen von Ausfällen sind aber nicht nur finanzieller Art. Wie wirken sich Ausfallzeiten auf die Integrität der Marke und auf den Börsenkurs eines Unternehmens aus?
Erschreckende 90 % der Technologieverantwortlichen nennen einen gestiegenen Bedarf an Kundensupport im Nachgang eines Incidents. Wenn Services ausfallen, nehmen der Ärger und die Support-Anfragen sprunghaft zu. Die direkten Auswirkungen auf Menschen, Kundschaft und Beschäftigte sind der Auslöser der Geschäftskrise. Kein Wunder, dass fast 20 % der befragten Marketing-Fachleute angeben, dass es nach einem Incident ein ganzes Quartal dauert, bis sich Marke wieder erholt hat.
Fast 20 % der Marketing-Fachleute sagen, dass es nach einem Incident ein ganzes Quartal dauert, bis sich die Marke wieder erholt hat.
Vielleicht werden Ausfallzeiten gerade deshalb immer mehr als handfestes finanzielles Risiko gesehen. Die Befragung zeigt, dass der Börsenwert nach einem Ausfall im Durchschnitt um 3,4 % nachgibt. Ausfallzeiten werden mittlerweile als Indikator tiefer wurzelnder Unternehmensprobleme gelesen, etwa als Zeichen veralteter Infrastruktur und mangelhaften Risikomanagements.
Interne Schwachstellen, externe Bedrohungen sowie Abhängigkeiten von Drittanbietern machen Ausfälle zu einem allgegenwärtigen Risiko im gesamten Technologie-Stack. Aus diesem Grund lässt sich Downtime immer schwerer vermeiden. Im Durchschnitt erleiden die Unternehmen 60 Störungen pro Jahr. Diese Störungen können ihre Ursprünge überall haben: bei Sicherheit, Anwendungen, Infrastruktur und/oder Netzwerken.

Aus den Daten ergibt sich, dass menschliches Versagen die Hauptursache von Ausfallzeiten bleibt. Probleme wie fehlkonfigurierte Software, Fehler im Anwendungscode etc. treten immer häufiger auf, weil die IT-Umgebungen immer komplexer werden, woraus sich neue blinde Flecken und zusätzliche Fehlerquellen ergeben.
Ein domänenübergreifender Ansatz, der auf einheitlichen Daten, KI-gestützter Automatisierung und Plattformen zur Zusammenarbeit basiert, verändert nicht nur die Art und Weise, wie Unternehmen Incidents erkennen, untersuchen und beheben, sondern kann auch dazu beitragen, menschliches Versagen zu minimieren. Durch die Kombination von menschlicher Kontrolle mit klarem Kontext schaffen die Unternehmen dann auch Observability in der KI selbst. Ein solcher Ansatz fördert die nahtlose Zusammenarbeit der SecOps-, der ITOps- und der NetOps-Teams und bietet übergreifende Transparenz und gemeinsamen Kontext. Fehlkonfigurationen lassen sich dann leichter verhindern, die Entscheidungsfindung wird präziser und schneller, außerdem stärken die Unternehmen dadurch ihre digitale Resilienz und werden operativ agiler.
Insgesamt zeigt die Befragung, dass Ausfälle nach wie vor sehr konstant auftreten. Unternehmen sollten ihre Resilienzstrategien entsprechend überdenken. Grund zur Hoffnung gibt es dennoch: 72 % der Verantwortlichen aus den Bereichen ITOps und Engineering sagen, dass End-to-End-Observability ihr wichtigster Investitionsschwerpunkt zum Aufbau von infrastruktureller Resilienz ist.
Beachtliche 44 % der Befragten aus dem Technologiebereich geben an, dass sie ungeplante Downtime mithilfe von KI-Agenten angehen. Die Technologie erweist sich bereits als Kraftverstärker bei der Vorfallreaktion, da agentenbasierte KI selbstständig Probleme diagnostiziert und gängige Korrekturen vornimmt. Im Vergleich zu manuellen Untersuchungen wird so wertvolle Zeit gespart.
Nun sagen zwar 56 % aller KI-Anwender, dass die Technologie das Risiko von Ausfallzeiten verringert hat, doch ausnahmslos alle befragten Technologieverantwortlichen sagen, dass sie im vergangenen Jahr eine Form von KI-bedingtem Ausfall erlebt haben, die in irgendeiner Weise auf KI zurückzuführen ist; hierzu zählen u. a. fehlerhafte KI-gesteuerte Automatisierung (50 %), Modell-Drift (50 %) sowie Adversarial Attacks wie Prompt-Injections und Datenmanipulation (26 %).
Zwar sagen 56 % der Anwender, dass KI das Ausfallrisiko insgesamt verringert hat, doch einmal mehr erweist sich KI als zweischneidiges Schwert: Alle befragten Technologieverantwortlichen sagen, dass ihr Unternehmen bereits Ausfälle erlebt hat, die in irgendeiner Weise mit KI zu tun haben.
Unternehmen werden mit Bedacht vorgehen müssen. Eine Lösung, der man nicht vertrauen kann, ist nicht brauchbar. Auch wenn KI im Kampf gegen Ausfallzeiten eine Rolle spielen wird, bringt die Technologie von Natur aus Unsicherheiten mit sich. Tatsächlich befürchten 68 % der Technologieverantwortlichen, dass ihre KI-Agenten sich unvorhersehbar verhalten und Ausfallzeiten verursachen könnten. Für echte digitale Resilienz bleiben daher menschliche Aufsicht, KI-Observability und belastbare, anpassungsfähige Systeme unerlässlich.
Ausfallzeiten sind letztlich unvermeidlich. Doch wie häufig sie sind und welche Folgen sie haben, das haben die Unternehmen selbst in der Hand. Mit dem Eintritt ins Zeitalter der KI-Agenten wird Stabilität zu einem wahren Wettbewerbsvorteil. Wer über rein reaktive Wiederherstellung hinausgeht und vorausschauende Widerstandskraft direkt in die operativen Prozesse einbindet, kann seine Marke schützen, für zufriedene Kunden sorgen und den KI-Einsatz von einer latenten Gefahr zum Vorteil verwandeln: von Störungen und Ausfallzeiten zu nachhaltigem Wachstum.
Im kompletten Report „Die versteckten Kosten von Ausfallzeiten 2026“ gibt es noch mehr Befragungsergebnisse sowie Empfehlungen, wie Unternehmen ihre Verluste minimieren und für operative Stabilität sorgen können.
Die führenden Unternehmen der Welt vertrauen auf Splunk, einem Unternehmen von Cisco, um ihre digitale Resilienz mit der einheitlichen Sicherheits- und Observability-Plattform, unterstützt durch branchenführende KI, kontinuierlich zu stärken.
Unsere Kunden setzen auf die preisgekrönten Sicherheits- und Observability-Lösungen von Splunk, um die Zuverlässigkeit ihrer komplexen digitalen Umgebungen zu sichern und zu optimieren – in jeder Größenordnung.