DEVOPS

Ohne Training ist AIOps einfach nur...Ops

Algorithmen sind das Kernstück der Technologien, die wir praktisch in allen Facetten unseres Alltags nutzen. Diese Formeln und Prozesse, helfen uns, Verbindungen herzustellen, Probleme zu lösen und fantastische Ideen umzusetzen. Dinge wie bessere Spracherkennung oder das Landen einer autonomen Rakete auf einem Drohnenschiff oder wirklich gute Netflix-Empfehlungen. Doch ein Algorithmus ist nichts anderes als eine Reihe von Regeln bzw. eine Reihe von Aufgaben, die bei einem bestimmten Input ausgeführt werden. Das wahre Potenzial von Algorithmen und Systemen mit künstlicher Intelligenz – von Machine Learning gestützten Systemen – kommt erst zum Tragen, wenn sie trainiert und mit einer Vielzahl von Daten gefüttert werden.

Normalerweise denkt man nicht unbedingt daran, Computersysteme zu trainieren, insbesondere wenn es sich um Systeme mit fortschrittlichen Funktionen wie AIOps-Plattformen handelt. Tatsächlich lässt sich das volle Potenzial von IT-Systemen jedoch nur ausschöpfen, wenn sie von geduldigen Trainern sorgfältig angeleitet werden.

Es klingt vielleicht paradox, dass ein System zusätzliches Training erfordert, das die Kapazität hat, eine Million Ereignisse zu deduplizieren, Systemverfügbarkeitsprobleme mindestens 30 Minuten im Voraus vorherzusagen und erkannte Probleme automatisch zu beheben – doch nur mit Algorithmen allein stoßen diese Plattformen schnell an ihre Grenzen. AIOps-Systeme sind, wie bereits erwähnt, ausgesprochen leistungsstark, doch ihre Stärke liegt in der Fähigkeit, zu lernen und sich anzupassen. Dieses Lernen beruht auf mehreren Quellen.

Daten sind die Lebensader hocheffektiver AIOPs-Plattformen

Je mehr Daten, desto genauere Erkenntnisse können geliefert werden. Allerdings geht es nicht darum, das System mit einer Masse beliebiger Altdaten zu füttern. Vielmehr wird das System genauer, wenn ihr ihm Daten zur Verfügung stellt, die denen ähneln, die es bereits kennt. Diese Daten werden vermutlich aus ähnlichen Quellen stammen, doch die größere Vielfalt ermöglicht es dem System, seine Algorithmen anzuwenden und Anpassungen vorzunehmen, die für bestimmte Anwendungen oder Services erforderlich sein können.

Administratoren (die Trainer) können der Plattform mit ihrem Feedback weitere Anweisungen dazu geben, wie sie sich in dem entsprechenden Umfeld verhalten und was sie melden soll. Für Early Adopter von AIOps-Systemen ist es nicht ungewöhnlich, dass auf Momente der Begeisterung auch immer wieder Momente der Verwunderung folgen, weil das System Warnmeldungen zu Elementen schickt, die das Team lieber protokolliert hätte. Dafür gibt es einen einfachen Grund: Feedback von den Administratoren ist entscheidend für das System, denn es muss lernen, welche Elemente sofortige Aufmerksamkeit erfordern und welche ohne Meldungen protokolliert werden können. Die Mitarbeiter der IT-Abteilung müssen nicht von jeder fehlgeschlagenen Aktion in Kenntnis gesetzt werden, doch sie wollen wissen, ob die Fehlerquote steigt oder ob Fehler nur in eingegrenzten Bereichen der Umgebung auftreten.

Unternehmen haben unterschiedliche Schwellenwerte und Service-Level-Objectives (SLOs). AIOPs-Plattformen müssen lernen, wie sie reagieren sollen, wenn diese Schwellenwerte überschritten werden oder SLOs in Gefahr sind. Häufig orientieren sich die Schwellenwerte an der Kundenzufriedenheit oder anderen geschäftlichen Auswirkungen, die für Computer uninteressant sind. Das System muss daher auf Grundlage der erwarteten Ergebnisse auf die richtige Vorgehensweise hin trainiert werden.

Letztlich sind AIOPs-Systeme auch in der Lage, auf der Grundlage der vorliegenden Daten und erkannten Trends eine Vielzahl von Funktionen auszuführen. Die Reaktion kann dabei von der einfachen Protokollierung der Häufigkeit eines Szenarios über das Anstoßen eines Incident Response-Runbooks zur Einbindung der richtigen Teammitglieder in die Problemlösung bis hin zur unabhängigen Behebung des Problems mit Skripten oder Automatisierung reichen. Dabei ist es die Rolle des Administrators oder Entwicklers, dem System basierend auf einer Vielzahl von Szenarien die jeweils beste Reaktion anzutrainieren.

Das Training von Computersystemen sollte niemandem Angst machen. Wir machen das beispielsweise ständig. Jeder der beim Verfassen von Texten die Autokorrektur verwendet, weiß, dass das System anfangs manchmal kleine Aussetzer haben kann (hoffentlich nicht allzu peinliche – wir kennen ja alle die entsprechenden Screenshots). Auch die Autokorrektur muss trainiert werden. Sie muss die Wörter erlernen, die ihr regelmäßig verwendet. Sie eignet sich eure Sprachmuster und typische Kommunikationsweise an. Nach einer Weile lässt sich damit beim Schreiben viel wertvolle Zeit sparen – mindestens aber erspart sie euch den einen oder anderen peinlichen Tippfehler.

AIOps-Plattformen sind zwar erheblich leistungsstärker und komplexer als eine einfache Autokorrektur, doch in einem Punkt unterscheiden sich beide nicht: Sie funktionieren am besten, wenn sie von erfahrenen IT-Fachleuten trainiert werden, die in der Lage sind, die Bedürfnisse einer Abteilung oder eines Unternehmens auf die von der Plattform unterstützten Ergebnisse anzuwenden.

Wollt ihr noch ein bisschen mehr? Unser E-Book 6 Mythen um AIOps – Widerlegt hilft euch, dem Hype auf den Grund zu gehen und herauszufinden, was AIOps wirklich ist und was nicht.

^{*Dieser Artikel wurde aus dem Englischen übersetzt und editiert. Den Originalblogpost findet ihr hier: AIOps Without Training is Just...Ops (10. April 2020).}

----------------------------------------------------
Thanks!
Splunk

September 09, 2020

Posted by

Ohne Training ist AIOps einfach nur...Ops

Daten sind die Lebensader hocheffektiver AIOPs-Plattformen

Splunk

Related Posts