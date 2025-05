Der 7. Jahresbericht analysiert Daten zu IT- und Rechenzentrumsausfällen, einschließlich Ursachen, Kosten und Folgen

Das Uptime Institute hat heute die Veröffentlichung seines 7. Jahresberichts zur Ausfallanalyse 2025 bekannt gegeben. Die Vermeidung von Ausfällen in Rechenzentren hat für Eigentümer und Betreiber von Rechenzentren weiterhin strategische Priorität. Die Infrastruktur ist zwar verbessert worden, doch die Komplexität moderner Architekturen und die sich ständig weiterentwickelnden externen Bedrohungen bringen neue Risiken mit sich, denen Betreiber aktiv begegnen müssen.

Zum vierten Mal in Folge kommt Uptime Intelligence Research zu dem Ergebnis, dass die Gesamtfrequenz der Ausfälle und der allgemeine Schweregrad der gemeldeten Ausfälle weiter zurückgehen. Allerdings nehmen Cybersicherheitsvorfälle zu und haben oft schwerwiegende, lang anhaltende Auswirkungen.

"Insgesamt haben sich die Ausfälle verlangsamt", sagte Andy Lawrence, Gründungsmitglied und Executive Director von Uptime Intelligence. "Betreiber von Rechenzentren sehen sich einer wachsenden Zahl externer Risiken gegenüber, die außerhalb ihrer Kontrolle liegen, darunter Einschränkungen des Stromnetzes, extreme Wetterbedingungen, Ausfälle von Netzbetreibern und Probleme mit Software von Drittanbietern. Und trotz einer volatileren Risikolandschaft sind Verbesserungen zu verzeichnen."

Die jährliche Ausfallanalyse von Uptime ist einzigartig in der Branche und stützt sich auf mehrere Umfragen, Informationen von Mitgliedern und Partnern des Uptime Institute sowie auf die Datenbank des Unternehmens mit öffentlich gemeldeten Ausfällen.

Zu den wichtigsten Ergebnissen gehören:

Ausfälle werden im Verhältnis zum rasanten Wachstum der digitalen Infrastruktur seltener und weniger schwerwiegend. Dieser Trend hält seit mehreren Jahren an und unterstreicht die Fortschritte der Branche im Bereich Risikomanagement und Zuverlässigkeit.

Stromausfälle sind nach wie vor die häufigste Ursache für schwerwiegende Ausfälle. Ausfälle aufgrund von IT- und Netzwerkproblemen nahmen 2024 zu und machten insgesamt 23 der Ausfälle mit erheblichen Auswirkungen aus. Dieser Trend spiegelt die langfristige Entwicklung hin zu Colocation-Anbietern, Cloud- und anderen Drittanbieterdiensten wider. Durch Outsourcing kann zwar das Risiko für einige Unternehmen verringert werden, dennoch kommt es nach wie vor zu schwerwiegenden Ausfällen, die manchmal schwerwiegende Folgen haben. Dieser Anstieg ist wahrscheinlich auf die zunehmende Komplexität der IT- und Netzwerke zurückzuführen, die zu Problemen beim Änderungsmanagement und zu Fehlkonfigurationen führt.

Softwarebasierte und verteilte Resilienz-Tools sind auf dem Vormarsch. Diese Systeme verbessern die Verfügbarkeit, können aber auch neue Risiken und Komplexitäten mit sich bringen. Der Einsatz softwarebasierter Resilienz-Strategien in Verbindung mit physischer Ausfallsicherung/Redundanz trägt zweifellos zur allgemeinen Verbesserung der Verfügbarkeit bei. Die zusätzliche Komplexität bringt jedoch eigene Herausforderungen mit sich und kann die Verantwortlichkeiten für Ausfälle verwischen, was die Ursachenanalyse und die Klassifizierung von Ausfällen erschwert.

Das Tempo des industriellen Wandels beschleunigt sich. Die steigende Nachfrage nach KI belastet bestehende Infrastrukturkonzepte insbesondere in den Bereichen Stromversorgung und Kühlung -, während Einschränkungen des Stromnetzes und globale Handelsspannungen neue Unsicherheiten in Lieferketten und Expansionsplänen mit sich bringen. Zusammen könnten diese Belastungen letztendlich die Stabilität der aktuellen Zuverlässigkeitstrends beeinträchtigen.

Für 2025 stieg der Anteil der Ausfälle aufgrund menschlicher Fehler, die auf die Nichteinhaltung von Verfahren zurückzuführen sind, im Vergleich zu 2024 um zehn Prozentpunkte. Die Nichteinhaltung von Verfahren durch Mitarbeiter ist zu einer noch größeren Ursache für Ausfälle geworden als im Vorjahr, was auf ein großes Potenzial für die Reduzierung von Vorfällen durch Schulungen und Prozessüberprüfungen hindeutet. Die überwiegende Mehrheit der Ausfälle aufgrund menschlicher Fehler ist auf ignorierte oder unzureichende Verfahren zurückzuführen. Fast 40 der Unternehmen haben in den letzten drei Jahren einen größeren Ausfall aufgrund menschlicher Fehler erlebt. 85 dieser Vorfälle sind auf die Nichteinhaltung von Verfahren durch Mitarbeiter oder auf Mängel in den Prozessen und Verfahren selbst zurückzuführen. Der Grund für diesen Anstieg ist unklar, könnte jedoch eine Folge des raschen Wachstums der Branche und des damit verbundenen Personalmangels in vielen Regionen sein. Die Verbesserung der Dokumentation und der Prozesse bleibt zwar wichtig, doch könnte eine stärkere Fokussierung auf Mitarbeiterschulungen und Echtzeit-Support im Betrieb die Risiken wirksamer verringern.

In den neun Jahren, in denen Uptime öffentlich gemeldete Ausfälle erfasst hat, entfielen etwa zwei Drittel der gemeldeten Ausfälle auf externe IT- und Rechenzentrumsdienstleister, darunter Cloud- und Internetgiganten, Telekommunikationsunternehmen und Colocation-Anbieter.

Für 2024 stieg die Zahl der Ausfälle, die auf digitale Dienstleister zurückzuführen sind, während die Zahl der Ausfälle bei Cloud-/Internetgiganten zurückging, was möglicherweise auf die Investitionen der Hyperscaler in verteilte Ausfallsicherheit und regionale Failover zurückzuführen ist. Im Finanzsektor war im dritten Jahr in Folge ein Rückgang der Ausfallhäufigkeit im Vergleich zum langfristigen Durchschnitt seit 2020 zu verzeichnen. Diese Verbesserung könnte auf strengere Vorschriften und eine verstärkte Aufsicht nach mehreren schwerwiegenden, öffentlichkeitswirksamen Ausfällen vor 2021 zurückzuführen sein.

Weitere Informationen: Wenn Sie mehr über die neuesten Forschungsergebnisse von Uptime zu Ausfällen digitaler Infrastrukturen erfahren möchten, registrieren Sie sich für das Webinar "2025 Annual Outage Analysis" am Mittwoch, 7. Mai, um 9:00 Uhr PDT hier. Eine 9-seitige Zusammenfassung, ein Auszug aus einem wesentlich ausführlicheren 26-seitigen Bericht, steht hier zum Download bereit.

Um den gesamten Bericht "Annual Outage Analysis 2025" und Uptime Intelligence auf Evaluierungsbasis zu erhalten, besuchen Sie bitte https://intelligence.uptimeinstitute.com/request-evaluation. Der vollständige Bericht ist für Mitglieder des Uptime Network und Abonnenten von Uptime Intelligence verfügbar. (Presse: E-Mail publicrelations@uptimeinstitute.com)

