IT

Ein Leitfaden für Einsteiger in Event Analytics

Egal ob ihr erst seit zwei oder schon seit zwanzig Jahren in der IT tätig seid, ihr wisst mit ziemlicher Sicherheit, dass Event-Management keine neue Entwicklung ist. Aber die Begriffe und Konzepte, die mit Event-Management verbunden sind, haben sich weiterentwickelt, und so ist es nun langsam an der Zeit, ein paar nähere Erläuterungen dazu zu geben. Event-Management, d.h. der technische Vorgang der Behebung und Selektierung in einer IT-Umgebung, beinhaltet das Sicherstellen von Verfügbarkeit und Uptime in einer Service-Umgebung, für die euer Team zuständig ist.

Tauchen wir nun ein bisschen tiefer in die Begriffe ein, mit denen die Branche heute über Event-Management spricht, und in die Schwerpunkte, die derzeit mit Event-Management verbunden sind. Ein Hinweis vorab: Es geht hier nicht um das ABC sämtlicher IT-Definitionen. Es geht vielmehr darum, besser zu verstehen, wie Splunk und der Rest der Branche von Events und Event-Management sprechen.

  • Was ist ein Event?
    Ein Event ist eine Statusänderung einer bestimmten „Sache“. Es handelt sich um eine Zeitreihenmeldung (time-series message), die eine Änderung des Zustands für eine Zielentität beschreibt. Ein Event bedeutet also nicht unbedingt etwas Negatives. Es beinhaltet normalerweise eine Zielkomponente. Beispielsweise „Server 5 ist ausgefallen“, „Das Dateisystem ist voll“ oder „Das Auto brennt“!
    The essential guide to machine data
  • Was sind Zeitreihendaten (time-series data)?
     Das sind genau die Sachen, die von Splunk indiziert werden. Das schließt alle Datentypen ein, einschließlich Logdaten, Metrikdaten und Leitungsdaten. Möchtet ihr weitere Beispiele kennenlernen? Dann lest unser englisches E-Book "Essential Guide to Machine Data".
  • Was ist ein relevantes Ereignis (notable event)?
    Ein relevantes Ereignis bzw. notable event ist eine Meldung, deren Zweck die Benachrichtigung eines menschlichen Bedieners ist, der sich um etwas kümmern soll, das sofortige Aufmerksamkeit verlangt. Relevante Ereignisse stellen eine in Splunk IT Service Intelligence (ITSI) und Splunk Enterprise Security (ES) integrierte Funktionalität dar.
  • Was sind Incidents?  
    Ein Incident ist eine außerplanmäßige Unterbrechung eines IT- oder Business Service oder ein nicht planmäßiges Nachlassen seiner Qualität. Es stellt ein übergeordnetes Konzept für die Behandlung von Ausfällen oder Dienstunterbrechungen dar. Mit unserem Rechner für kritische IT-Incidents könnt ihr die Kosten ermitteln, die euch durch kritische IT-Incidents entstehen.
  • Was ist ein Event-Manager, Element-Manager oder Monitor?
    Unabhängig von der Berufsbezeichnung sind diese Personen die unbesungenen Helden der IT – diejenigen, die den Betrieb überwachen und große Mengen von Events bearbeiten müssen.
  • Was verbirgt sich hinter dem neuen Ausdruck „Event Analytics“ bzw. Ereignisanalyse?
    Ereignisanalyse bzw. Event-Analytics beschreibt die Vision von Splunk, das herkömmliche Event-Management zu revolutionieren.

Was macht Splunk anders als die alteingesessene Konkurrenz?

Dazu ein paar Hintergrundinformationen: Ursprünglich war ein Event eine Nachricht von einem Computer. Jedes Event sollte von einem menschlichen Bediener gesehen werden, der darauf reagierte. Aber als mehr und mehr Anwendungen hinzukamen, erhöhte sich auch die Zahl der Computer und Netzwerkgeräte. Diese komplexere Infrastruktur hatte zur Folge, dass alle diese Events zu einer Überforderung führten.

So wurde der Event-Manager geboren, und mit ihm kamen die IT-Silos – damit sich die Manager auf einen bestimmten Bereich konzentrieren konnten. Schließlich bekamen die Manager ihrerseits Manager, um durch Reduktion, Deduplizierung und Regel-Engines die Zahl der zu bearbeitenden Events weiter zu reduzieren. Aber unsere schnell wachsenden IT-Umgebungen sind äußerst extrem geworden, und die Zahl der Ereignisse steigt weiterhin exponentiell an.

KIDie Ereignisanalyse kann all diese Schmerzen lindern. Es ermöglicht euch den übergreifenden Blick über alle IT-Silos auf einer einizigen Plattform, wodurch ihr die Kernursache eines Incidents leicht bestimmen könnt. Ach ja, und diese kleine Neuerung namens Machine Learning ist ebenfalls darin integriert. Diese einzigartigen Algorithmen analysieren eure Events, um zu bestimmen, ob sie einen schlagenden Beweis für etwas liefern oder eben nicht – das spart euch die Zeit durch die überwältigende Flut von Events zu navigieren. Und das Beste: All das baut auf der skalierbaren Splunk-Plattform auf.

Erfahrt, wie ihr die Flut an Events mit Hilfe von Machine Learning reduziert und hört euch außerdem die .conf17-Präsentation "Event-Management is Dead" vom Splunk ITOA-Experten David Millis. Natürlich könnt ihr auch einfach auf eigene Faust Event Analytics in unserer Splunk ITSI-Sandbox ausprobieren.

----------------------------------------------------
Vielen Dank
Taylor Crump

*Dieser Artikel wurde aus dem Englischen übersetzt und kann im Original hier gelesen werden.

Splunk
Posted by

Splunk

TAGS
Show All Tags
Show Less Tags