Moneycab: Herr Siebold, Sie leiten das Team zur Entwicklung von CurIX (Cure Infrastructure in Xaas), einer Software, die helfen soll, Ausfälle von IT-Komponenten und Diensten zu verhindern. Wie genau soll das geschehen?

Uli Siebold: CurIX ist ein Produkt, das bestehende Monitoring-Werkzeuge um zusätzliche Funktionen zur Alarmierung und Ausfallprävention erweitert. CurIX identifiziert sehr früh mögliche Ausfälle aus einer Menge an Anomalien, die existierende Tools zwar finden, jedoch sind diese Meldungen oft mit Falschalarmraten behaftet. Weil CurIX so frühzeitig aktiv ist, bestehen bei einer Alarmierung noch viele Möglichkeiten für die Systemverantwortlichen, einen bevorstehenden Ausfall zu verhindern. Der Schlüssel liegt hier im rechtzeitigen Warnen und im Bereitstellen ausreichender Information, mit Hilfe derer schnell gehandelt werden kann.

Die Überwachung von Systemen mit Frühwarnfunktionen ist oft schon Bestandteil bestehender IT-Lösungen. Wie unterscheidet sich CurIX von diesen?

CurIX ist weit mehr als ein klassisches Monitoring Tool. CurIX versteht sich als Zusatz, der bestehende Monitoring Tools veredelt. Der wesentliche Unterschied, den CurIX damit erreicht, liegt im Aktivitätsniveau: Die uns bekannten Werkzeuge stellen automatisierte Auswertungen vorwiegend in den reaktiven Phasen bereit - das heisst, erst nachdem ein Ausfall geschehen ist. Mit CurIX ist es ein Leichtes, gängige Tools mit proaktiven Funktionen auszustatten. CurIX analysiert die vom Monitoring Tool gesammelten Daten und löst Alarme aus, wenn Ausfälle bevorstehen. Dies geschieht in einer für den Benutzer sehr einfach zu handhabenden Weise. Es ist nicht nötig - wie bei bisherigen Frühwarnsystemen - selbst dutzende Diagramme und Zeitreihen ständig zu beobachten und bei Auffälligkeiten den Alarmknopf zu drücken. Genau das übernimmt CurIX für den Systemverantwortlichen. Somit wird dieser entlastet und ein kontinuierlicher 24×7 Betrieb einfacher möglich. CurIX arbeitet also proaktiv.

Sie sehen CurIX als Zusatzmodul zu bestehenden System-Überwachungslösungen. Wie stellen Sie die Kompatibilität zu den bestehenden Systemen sicher, wie gross ist der Implementationsaufwand?

Für das Erreichen der Kompatibilität zu bestehenden Systemen nutzen wir zwei Ansätze: Auf technischer Seite entwickeln wir für bestehende Systeme Schnittstellenkomponenten. Wenn nötig entwickeln wir auch kundenspezifische Schnittstellen, die an bestehende Lösungen beim Kunden anknüpfen.

Auf der konzeptionellen Seite verfolgen wir den Ansatz sogenannter Key Performance Indikatoren (KPI). Diese KPIs lassen sich aus nahezu allen Rohdaten extrahieren und für viele Zwecke individuell erstellen. Meist liefern bestehende Überwachungslösungen bereits KPIs, oder man kann sie über Schnittstellen auslesen. Dieser Ansatz ist per Design so generisch, dass wir uns an jede Überwachungslösung anknüpfen können, die grundsätzlich erlaubt, Daten auszulesen. Wir haben in unseren Trainingsdatensätzen auch Daten anderer Domänen, beispielsweise von EKGs oder Flugzeugverspätungen, um die Flexibilität der Algorithmen schon während der Entwicklung sicherzustellen.

Im Gegensatz zu bekannten Lösungen, bei denen Schwellwerte eingestellt werden, deren Überschreitung dann zu einem Alarm führen, arbeiten Sie mit einer so genannten "Baseline". Was ist der Unterschied, worin liegen die Vorteile?

Schwellwerte sind ein sehr robustes Mittel, um vor gefährlichen Zuständen gewarnt zu werden. Nicht ohne Grund werden sie vielerorts eingesetzt. Sie haben jedoch einige Grenzen, die wir mit CurIX überwinden. Zum Beispiel müssen Schwellwerte definiert werden, bevor sie zum Einsatz kommen. Hierbei können Fehler gemacht werden, die im schlimmsten Fall erst bemerkt werden, wenn sie gebraucht werden. Darüber hinaus erlaubt der Schwellwertbasierte Ansatz keine Zuordnung zum Fehlertyp.

Ein weiterer Grund für uns, mit Baselines zu arbeiten, ist die Sensitivität von Baselines. Lassen Sie mich anhand eines Beispiels erklären, worin die Stärken der Nutzung von Baselines liegen: Stellen Sie sich beispielsweise einen typischen Emailverkehr in einem Büro vor. Wenn wir nun überwachen ...

