Data Insider

Was ist Artificial Intelligence for IT Operations (AIOps, Künstliche Intelligenz für IT Operations)?

AIOps ist ein Verfahren, bei dem Analysen und Machine Learning auf große Datenmengen angewendet werden, um den IT-Betrieb (IT Operations) zu automatisieren und zu verbessern. KI kann automatisch riesige Mengen von Netzwerk- und Maschinendaten analysieren, um Muster mit dem Ziel auszumachen, sowohl die Ursache bestehender Probleme zu ermitteln als auch künftige Probleme vorherzusagen und zu verhindern.

Der Begriff AIOps wurde 2016 von Gartner geprägt. Im Marktleitfaden für AIOps-Plattformen (Market Guide for AIOps Platforms) beschreibt Gartner AIOps-Plattformen als „Softwaresysteme, die große Datenmengen und künstliche Intelligenz (KI) oder Machine Learning-Funktionen kombinieren, um ein breites Spektrum von IT-Betriebsprozessen und -aufgaben zu verbessern und teilweise zu ersetzen, einschließlich Verfügbarkeits- und Performance-Monitoring, Event-Korrelation und -Analyse, IT-Service-Management und Automatisierung“.

Was ist AIOps: Inhalt

AIOps-Grundlagen
AI for Operations

Wie wird künstliche Intelligenz im IT Operations-Management eingesetzt?

AIOps ist darauf ausgelegt, die Geschwindigkeit und Genauigkeit von KI in IT Operations einzubringen. Das IT Operations-Management ist mit zunehmender Netzwerkgröße und -komplexität immer anspruchsvoller geworden. Traditionelle Operations-Management-Tools und -Verfahren haben in komplexen und vielfältigen Netzwerkumgebungen Mühe, mit den ständig wachsenden Datenmengen aus unterschiedlichsten Quellen Schritt zu halten. Zum Bewältigen dieser Herausforderungen führt AIOps folgende Schritte aus:

  • Daten werden aus verschiedenen Quellen zusammengeführt: Herkömmliche Ansätze, Tools und Lösungen wurden nicht in Erwartung des Volumens, der Vielfalt und der Geschwindigkeit von Daten entwickelt, die von den heutigen komplexen und vernetzten IT-Umgebungen erzeugt werden. Stattdessen konsolidieren und aggregieren sie Daten und berechnen daraus Durchschnittswerte, was die Datentreue beeinträchtigt. Ein fundamentales Merkmal einer AIOps-Plattform ist ihre Fähigkeit, große Datensets jeglicher Art aus der gesamten Umgebung zu erfassen und gleichzeitig die Datentreue für eine umfassende Analyse zu gewährleisten.
  • Datenanalyse vereinfachen: Eines der großen Alleinstellungsmerkmale einer AIOps-Plattform ist die Fähigkeit, alle Datenformate in unterschiedlicher Geschwindigkeit und Menge zu erfassen. Die Plattform wendet dann eine automatisierte Analyse auf diese Daten an, um künftige Probleme vorherzusagen und zu verhindern sowie die Ursache für bestehende Probleme auszumachen.

Was ist eine AIOps-Plattform?

Laut Gartner kombiniert eine AIOps-Plattform große Datenmengen und Machine Learning, um IT Operations durch die skalierbare Erfassung und Analyse der erzeugten Daten zu unterstützen. Die Plattform ermöglicht die gleichzeitige Nutzung mehrerer Datenquellen, Datenerfassungsmethoden sowie Analyse- und Präsentationstechnologien.

Im 2018 veröffentlichten Marktleitfaden für AIOps-Plattformen stellt Gartner fest, dass „AIOps-Plattformen wichtige Funktionen hinzufügen, die über das hinausgehen, was ein Monitoring-Tool mit integriertem AIOps bieten kann“. Eine echte AIOps-Plattform ist in der Lage, „große Datenmengen und Machine Learning-Funktionen zu kombinieren, um alle primären IT Operations-Funktionen durch die skalierbare Erfassung und Analyse des ständig wachsenden Volumens, der Vielfalt und der Geschwindigkeit der von der IT erzeugten Daten zu unterstützen“.

Eine AIOps-Plattform muss in der Lage sein, sowohl gespeicherte Daten zu analysieren als auch Echtzeitanalysen zum Zeitpunkt der Erfassung durchzuführen.

Laut Gartner sind die zentralen Aufgaben einer AIOps-Plattform wie folgt:

  • Erfassen von Daten aus verschiedenen Quellen unabhängig von Quelle oder Anbieter
  • Durchführen von Analysen in Echtzeit zum Zeitpunkt der Erfassung
  • Ausführen einer historischen Analyse gespeicherter Daten
  • Nutzen von Machine Learning
  • Auslösen einer Aktion oder eines Folgeschritts auf der Grundlage von Erkenntnissen und Analysen
Details zu AIOps

Was sind Hauptanwendungsfälle für AIOps?

Laut Gartner gibt es fünf primäre Anwendungsfälle für AIOps, mit denen wir uns im Folgenden näher befassen werden:

  1. Big Data Management (Volumen, Vielfalt, Veränderlichkeit und Geschwindigkeit)
  2. Performance-Analyse
  3. Erkennung von Anomalien
  4. Event-Korrelation und -Analyse
  5. IT-Service-Management
Application of AI powered by Machine Learning
  1. Performance-Analyse: AIOps ist ein wichtiger Anwendungsfall für die Performance-Analyse, bei dem KI und Machine Learning eingesetzt werden, um schnell große Mengen von Event-Daten zu sammeln und zu analysieren, um die Ursache eines Problems festzustellen. Als wichtige IT-Aufgabe ist die Performance-Analyse mit zunehmendem Datenvolumen und immer mehr Datentypen komplexer geworden. Für IT-Experten wird es immer schwieriger, ihre Daten mit herkömmlichen IT-Methoden zu analysieren, selbst wenn Machine Learning-Technologien in diese Methoden eingebunden wurden. AIOps hilft, das Problem von zunehmendem Volumen und verstärkter Datenkomplexität zu lösen, indem ausgefeiltere KI-Techniken zur Analyse größerer Datensätze angewendet werden. Wahrscheinliche Probleme können vorhergesagt werden und eine schnelle Ursachenanalyse kann erfolgen, wodurch Probleme oft schon im Ansatz unterbunden werden.
  2. Erkennung von Anomalien: Anomalieerkennung (auch „Ausreißererkennung“ oder „Outlier Detection“) in der IT ist die Ermittlung von Datenausreißern – d.h. von Ereignissen und Aktivitäten in einem Datensatz, die sich so weit von bisherigen Daten abheben, dass ein potenzielles Problem vorliegen kann. Diese Ausreißer bzw. Outlier werden als anomale Ereignisse (Anormalous Events) bezeichnet.

    Die Anomalieerkennung basiert auf Algorithmen. Ein Trendalgorithmus überwacht eine einzelne KPI, indem er ihr aktuelles mit ihrem bisherigen Verhalten vergleicht. Wenn der Wert anomal groß wird, löst der Algorithmus eine Benachrichtigung aus. Ein kohäsiver Algorithmus untersucht eine Gruppe von KPIs, von denen ein ähnliches Verhalten erwartet wird, und löst Benachrichtigungen aus, wenn sich das Verhalten von mindestens einer ändert.

    Durch AIOps erfolgt die Erkennung von Anomalien schneller und effektiver. Sobald ein bestimmtes Verhalten festgestellt wurde, kann AIOps die Differenz zwischen dem tatsächlichen Wert der entsprechenden KPI und dem, was das Machine Learning-Modell vorhersagt, überwachen und auf signifikante Abweichungen achten.
  3. Event-Korrelation und -Analyse: Die Korrelation und Analyse von Events ist die Fähigkeit, eine Ereignisflut aus mehreren, zusammengehörigen Warnungen in Bezug auf die eigentliche Ursache der Ereignisse zu sichten und festzustellen, wie das Problem gelöst werden kann. Das Problem herkömmlicher IT-Tools besteht jedoch darin, dass sie keine Einsicht in das Problem gewähren, sondern nur in die Flut von Warnmeldungen.

    AIOps nutzt KI-Algorithmen, um relevante Ereignisse automatisch nach Ähnlichkeit zu gruppieren. Dadurch verringert sich der Aufwand von IT-Teams für die kontinuierliche Verwaltung von Ereignissen. Außerdem werden unnötiger (und lästiger) Event Traffic und irrelevante Events reduziert. AIOps nutzt KI, um zusammengehörige Ereignisse zu gruppieren, sich auf wichtige Ereignisgruppen zu konzentrieren und regelbasierte Aktionen durchzuführen. Dazu gehören die Konsolidierung duplizierter Ereignisse, die Unterdrückung von Benachrichtigungen oder das Schließen relevanter Ereignisse, wenn ein Ereignis empfangen wird.
  4. IT-Service-Management: IT-Service-Management (ITSM) ist ein Oberbegriff für alles, was mit Planung, Aufbau, Bereitstellung, Support und Verwaltung von IT-Services innerhalb eines Unternehmens zu tun hat. ITSM umfasst die Richtlinien, Prozesse und Verfahren zur Bereitstellung von IT-Services für Endbenutzer innerhalb eines Unternehmens.

    AIOps ist für ITSM genauso nützlich wie für andere IT-Bereiche. Durch die Anwendung von KI auf Daten können Probleme ermittelt und schnell behoben werden, was IT-Abteilungen hilft, effizienter und effektiver zu agieren. AIOps für ITSM kann auf diverse Daten angewendet werden – vom Monitoring des IT-Servicedesks bis hin zu einzelnen Geräten und mehr.

    AIOps für ITSM kann IT-Abteilungen bei folgenden Aufgaben unterstützen:
    • Verwalten der Infrastruktur-Performance in einer Multi-Cloud-Umgebung
    • Treffen genauerer Vorhersagen für die Kapazitätsplanung
    • Optimieren der Nutzung von Speicherressourcen durch automatische Anpassung der Kapazität
    • Verbessern der Ressourcenauslastung auf Grundlage von Erfahrungswerten und Vorhersagen
    • Erkennen, Vorhersagen und Verhindern von IT-Service-Problemen
    • Verwalten vernetzter Geräte in einem Netzwerk
  5. Automatisierung: Bei älteren Tools ist es oft erforderlich, Informationen aus verschiedenen Quellen manuell zusammenzufassen, bevor Incidents verstanden, behandelt und behoben werden können. AIOps bietet einen wesentlichen Vorteil dadurch, dass Daten aus mehreren Quellen automatisch erfasst und korreliert werden können, was zu deutlich mehr Tempo und Genauigkeit führt. Durch den AIOps-Ansatz werden diese Prozesse in den IT Operations eines Unternehmens automatisiert, einschließlich:
    • Server, Betriebssystem und Netzwerke: Sammeln Sie für Such-, Korrelations-, Benachrichtigungs- und Berichtszwecke alle Protokolle, Metriken, Konfigurationen, Nachrichten und Traps auf mehreren Servern.
    • Container: Sammeln, durchsuchen und korrelieren Sie Containerdaten mit anderen Infrastrukturdaten, um Servicekontext, Monitoring und Reporting zu verbessern.
    • Cloud-Monitoring: Überwachen Sie die Performance, Nutzung und Verfügbarkeit der Cloud-Infrastruktur.
    • Virtualisierungs-Monitoring: Verschaffen Sie sich Einblick in den gesamten Virtual Stack, beschleunigen Sie die Korrelation von Events und durchsuchen Sie Transaktionen, die über virtuelle und physische Komponenten erfolgen.
    • Speicher-Monitoring: Machen Sie sich mit Ihrem Speichersystem im Kontext der zugehörigen Anwendungs-Performance, Server Response Times und des Aufwands für die Virtualisierung vertraut.

Was sind die wesentlichen Geschäftsvorteile von AIOps?

Durch die Automatisierung von IT Operations-Aufgaben und die Nutzung der Leistungsfähigkeit von KI zur Verbesserung der Systemleistung kann AIOps einem Unternehmen erhebliche Geschäftsvorteile bieten. Zum Beispiel:

key business benefits of AIOps

Durch das Verbessern der Performance von IT-Infrastruktur und -Anwendungen optimiert AIOps die KPIs, mit denen Geschäftserfolg definiert wird.

  • Durch Vermeiden von Downtime verbessert sich die Kundenzufriedenheit.
  • Die Zusammenführung von Datenquellen, die zuvor in Silos isoliert waren, ermöglicht eine umfassendere Analyse und Erkenntnisgewinnung.
  • Durch die beschleunigte Ursachenanalyse und -behebung lassen sich Zeit, Geld und Ressourcen sparen.
  • Durch Optimierung der Reaktionszeit und der Konsistenz der Reaktion verbessert sich die Service Delivery.
  • Durch das Auffinden und Beheben von Fehlern – etwas, für das Mitarbeiter viel Mühe und Zeit aufwenden müssten – steigt die Zufriedenheit am Arbeitsplatz. IT-Teams können sich so auf die Analyse und Optimierung von wirklich wichtigen Inhalten und Aufgaben konzentrieren.
  • Indem der IT-Leitung mehr Zeit für die Zusammenarbeit mit Kollegen aus anderen Fachbereichen eingeräumt wird, verdeutlicht sich der strategische Wert der IT-Organisation.

Viele der Herausforderungen, denen IT Operations gegenüber stehen, sind branchenübergreifend vergleichbar und können mithilfe von AIOps gelöst werden. Es gibt jedoch Probleme, die in bestimmten Branchen – darunter Gesundheitswesen, Einzelhandel, Fertigung und Finanzdienstleistungen – weitaus häufiger oder bedrohlicher sind.

Wie AIOps für IT im Gesundheitswesen nützlich sein kann:

Durch die Automatisierung von IT Operations-Aufgaben und die Nutzung der vollen Kraft von KI zur Verbesserung der System-Performance, kann AIOps einem Unternehmen erhebliche Geschäftsvorteile bieten. Zum Beispiel:

  • Sicheres Speichern elektronischer Patientenakten in Übereinstimmung mit geltenden Gesetzen und Vorschriften (z. B. dem US Health Insurance Portability and Accountability Act, HIPAA)
  • Reduzieren der Gefahren durch mobile Netzwerke und BYOD-Praktiken (Bring-Your-Own-Device) seitens des medizinischen Fachpersonals
  • Verhindern von Ransomware-Angriffen, die überproportional auf Organisationen im Gesundheitswesen abzielen
  • Bereitstellen großer interner und externer Datenbestände für Forschungs- und Diagnosezwecke

Wie AIOps für IT im Einzelhandel nützlich sein kann:

  • Mobile POS-Systeme (Point-of-Sale) und mobiles Bezahlen im stationären Handel
  • Synchronisieren von Daten auf allen Vertriebskanälen und -plattformen, einschließlich Filialen, mobilen Endgeräten und Desktops
  • Schützen von Kundendaten und -informationen, während Sie diese gleichzeitig für eine personalisierte Customer Experience nutzen.
  • Sicherstellen einer flexiblen Infrastruktur, in der es einfach ist, neue Technologien hinzuzufügen, sobald das Unternehmen wächst und sich verändert
  • Aufrechterhalten eines effektiven Betriebs bei gleichzeitiger Kostensenkung angesichts des finanziellen Drucks auf den Einzelhandel im Allgemeinen
  • Verwalten der wachsenden Anzahl vernetzter Geräte in Einzelhandelsfilialen
  • Implementieren neuer intelligenter Technologien (z. B. Smart Home-Geräte), Augmented/Virtual Reality-Tools und kassenloser Lösungen, bei denen ein Kunde durch Scannen eines Barcodes mit einer Smartphone-App bezahlen kann

Wie AIOps für IT in der Fertigung nützlich sein kann:

  • Automatisieren der Erfassung und Analyse heterogener Datenquellen, die durch die Integration von Lieferkette, Fertigungsbetrieb und Life-Cycle-Management von Produkten und Services entstehen
  • Verfolgen jeder Maschine im Fertigungsbereich durch Echtzeit-Monitoring, Zusammenführung von Daten wie Fertigungszykluszeiten, Qualitätsausbeute nach Maschine und Fertigungslauf, Kapazitätsauslastung und Qualitätsniveau der Lieferanten
  • Vermeiden von Produktionsverzögerungen mithilfe historischer Daten in Kombination mit KI-gesteuerten Predictive Analytics (Prädiktiven Analysen), um so Umsatzströme zu schützen und die Kundenzufriedenheit zu erhöhen
  • Nutzen von Maschinendaten, um Predictive Maintenance zu ermöglichen, sodass Maschinen vor einem etwaigen Ausfall repariert werden
  • Bessere Datennutzung zur Schaffung effizienterer Supply Chain Management-Systeme

Wie AIOps für IT im Finanzdienstleistungssektor nützlich sein kann:

  • Verhindern von immer ausgefeilteren Datenschutzverletzungen und Cyber-Kriminalität
  • Bereitstellen von Kundendaten zur Umsetzung von Marketing- und Wachstumszielen
  • Analysieren bereits erfasster Kundendaten zur Erstellung genauerer Umsatzwachstumsprognosen
  • Sicherstellen von Datensicherheit und Compliance
  • Bereitstellen eines Frameworks für die Integration mehrerer, großer Datensätze, um neue Technologien wie Blockchain zu ermöglichen
  • Erfüllen von Verbrauchererwartungen an mobile und digitale Bankgeschäfte
  • Verbessern der Netzwerkgeschwindigkeit und -Performance

Wie finden Sie die besten AIOps-Tools und -Produkte?

Mit zunehmendem Interesse an AIOps bündeln einige Anbieter herkömmliche IT Operations-Tools, fügen grundlegende KI-Funktionen hinzu und nennen das Ergebnis „AIOps-Plattform“. Aber eine echte AIOps-Plattform ist mehr als bloß eine Zusammenstellung von Tools. Dies sollte Ihnen beim Einstieg klar sein, denn die von Ihnen gewählte Plattform ist ausschlaggebend für Ihren Erfolg. Gartner empfiehlt Unternehmen, „diejenigen Anbieter zu priorisieren, die Datenerfassung, -speicherung und -zugriff unabhängig von den übrigen AIOps-Komponenten ermöglichen“.

Schauen Sie sich die jeweils verfügbaren Features sowie einige Fallstudien (Case Studys) von anderen Kunden und AIOps-Anwendungsfälle an. Die einfachste Möglichkeit zu beurteilen, ob eine AIOps-Plattform Ihre Anforderungen erfüllt, besteht darin, Case Studys zu finden, die verdeutlichen, wie ein ähnliches Unternehmen wie das Ihre AIOps für seine Geschäftsanforderungen eingesetzt hat. Suchen Sie nach Anbietern, die auf ihrer Website mit ihren Kunden werben, und fragen Sie nach entsprechenden Referenzen. Wenn ein AIOps-Tool oder eine AIOps-Plattform großartige Ergebnisse verspricht, das Unternehmen aber keine Belege liefern kann, sollten Sie sich vielleicht woanders umsehen.

Einstieg

Wie steigen Sie am besten in das Thema AIOps ein?

Der beste Ansatz für den Einstieg in AIOps ist ein schrittweises Vorgehen. Es ist empfehlenswert, klein anzufangen, indem Sie Ihre IT-Bereiche nach Datenquelle neu organisieren. Erfahren Sie, wie Sie mit großen, beständigen Datensätzen aus einer Vielzahl von Quellen arbeiten können. Geben Sie Ihrem IT Operations-Team die Möglichkeit, sich mit den Big Data-Aspekten von AIOps vertraut zu machen. Beginnen Sie mit einem Data Set historischer Daten und fügen Sie schrittweise neue Datenquellen hinzu, während Sie zugleich Ihre Abläufe verbessern.

Konzentrieren Sie sich zuerst auf die Datenerfassung: Die Inbetriebnahme von AIOps erfordert Zugriff auf alle Arten von Daten: unstrukturierte Maschinendaten und Metriken sowie relationale Daten zur Informationsanreicherung. Diese verschiedenen Datentypen ermöglichen Ihnen, eine ganzheitliche Sicht auf alle Silos zu entwickeln und Maßnahmen zu ergreifen, die je nach Situation und Datentyp sinnvoll sind.

Die effektive und schnelle Erfassung und Analyse aller Daten kann sehr aufwendig sein. Beginnen Sie stattdessen mit dem Zugriff auf und der Analyse von historischen rohen Maschinen- und Metrikdaten, um so ein grundlegendes Verständnis zu gewinnen, und setzen Sie Clustering-Algorithmen und Analyseverfahren ein, um Trends und Muster auszumachen. Rohdaten sind die beste Art von Daten, wenn Sie eine wirkliche Erkennung in Echtzeit wünschen. Anschließend können Sie mit der Analyse von Streamingdaten beginnen, um zu prüfen, wie sie zu diesen Mustern passen. Dazu wenden Sie durch Machine Learning gestützte KI an, um eine Automatisierung und schließlich Predictive Analytics einzuführen.

Erfassen und analysieren Sie so viele Datentypen wie möglich: Bei Ihrem Einstieg in AIOps sind historische Daten äußerst nützlich. Wenn Sie zunächst bisherige Zustände Ihrer Systeme analysieren und verstehen, können Sie das Gelernte mit der Gegenwart in Beziehung setzen.

Um das zu erreichen, müssen Unternehmen Zugriff auf eine breite Palette von Typen von historischen Daten und Streaming-Daten bereitstellen. Der von Ihnen gewählte Datentyp – ob Protokoll-, Metrik-, Text-, Nachrichten- oder Social-Media-Daten – hängt vom Problem ab, das Sie lösen möchten. So können Sie beispielsweise Metrikdaten aus Ihrer Infrastruktur zum Monitoring der Kapazität oder Anwendungsprotokolle verwenden, um sicherzustellen, dass Sie Ihren Kunden ein erstklassiges Erlebnis bieten.

Viele AIOps-Plattformen konzentrieren sich bislang ausschließlich auf eine einzige Datenquelle. Die Beschränkung auf einen einzigen Datentyp limitiert Ihre Erkenntnisse zum Systemverhalten, und zwar unabhängig davon, ob diese Erkenntnisse von einem IT-Administrator oder Algorithmus stammen. Daher sollten Unternehmen Plattformen wählen, die in der Lage sind, Daten aus mehreren Quellen zu erfassen und zu analysieren.

Versuchen Sie nicht alles auf einmal: Konzentrieren Sie sich darauf, die Ursache Ihres Problems mit der höchsten Priorität zu finden. Fahren Sie dann mit dem Daten-Monitoring fort. Erst nachdem dies erfolgt ist, sollten Sie sich der KI zuwenden. Gehen Sie auch dann schrittweise vor:

  • Beginnen Sie mit der Implementierung einer AIOps-Plattform, die Ihnen eine effektive Grundlage für die Organisation großer Datenmengen bietet. Diese erleichtert Ihnen das Ergreifen von Maßnahmen und Nutzen von Monitoring-Funktionen zur Aufdeckung von Mustern.
  • Erkunden Sie als Nächstes, inwieweit diese Muster Ihnen die Vorhersage von Incidents und eine proaktivere IT ermöglichen. Dadurch können Sie nicht nur Ihre MTTR (Mean-Time-To-Resolution, durchschnittliche Dauer der Problembehebung), sondern auch die Anzahl der geschäftskritischen Incidents reduzieren, mit denen Sie konfrontiert sind.
  • Machen Sie schließlich Gebrauch von Machine Learning-gestützter Kernursachenanalyse, um einen „prädiktiven Zustand“ zu erreichen, in dem Sie den Incident und seine Auswirkungen bestimmen können, bevor er sich überhaupt auf Ihre wichtigsten Unternehmensservices und die Customer Experience auswirkt.
Fazit: Los geht's!

Wenn Sie ein IT- und Netzwerkexperte sind, wurde Ihnen immer wieder gesagt, dass Daten das wichtigste Kapital Ihres Unternehmens seien und dass Big Data Ihre Welt für immer verändern werde. KI ist eine Revolution, die kein Zurück mehr kennt – und AIOps bietet eine konkrete Möglichkeit, den Hype um KI und Big Data in die Realität umzusetzen. Von der Verbesserung der Sicherheit über die Optimierung von Betriebsabläufen bis hin zur Steigerung der Produktivität ist AIOps ein praktisches, leicht zugängliches Instrument, das Ihnen hilft, Ihre IT Operations weiterzuentwickeln, um künftigen Herausforderungen zu begegnen und die Rolle der IT als strategischer Impulsgeber für das Unternehmenswachstum zu stärken.