Data Insider

Was ist IT-Monitoring?

IT-Monitoring umfasst ein breites Spektrum von Produkten, mit denen Analysten feststellen, ob die IT-Systeme online sind und das erwartete Service Level erfüllen, während sie zudem gleichzeitig erkannte Probleme beheben. IT-Monitoring-Tools reichen von einfachen Überprüfungs-Tools bis hin zu anspruchsvolleren Tools, die die Performance eines Produkts detailliert untersuchen oder sogar Korrekturmaßnahmen automatisieren, wenn Probleme vermutet werden.

Bei der Verwendung mit einem Webserver könnte ein IT-Monitoring-Tool beispielsweise Trends bei der CPU- und RAM-Auslastung analysieren, feststellen, ob der Festplattenspeicher knapp wird, oder ermitteln, wie oft das System im letzten Jahr abgestürzt ist.

Das IT-Monitoring, zu dem auch das Netzwerk- und Anwendungs-Monitoring gehören, hat sich seit 2010 dramatisch weiterentwickelt, um mit der zunehmenden Komplexität von IT-Umgebungen mitzuhalten. Hier ist besonders hervorzuheben, dass IT-Monitoring-Tools jetzt sowohl lokale als auch Cloud-basierte Systeme überwachen können. Das Angebot umfasst Hunderte von Monitoring-Produkten und -Tools, die sich in Komplexität und Ansatz deutlich unterscheiden. Es kann also sein, dass ein IT-Monitoring-Tool oder eine Monitoring-Software für ein Unternehmen perfekt geeignet ist, zu einem anderen Unternehmen aber überhaupt nicht passt.

Bei den im IT-Monitoring geltenden Konzepten gibt es große Überschneidungen mit anderen Disziplinen, einschließlich IT Operations Management (ITOM), SIEM (Security Information and Event Management), SOAR (Security Orchestration, Automation and Response), Operational Intelligence (OI) und vielen anderen.

In diesem Artikel werden die grundlegenden Typen von IT-Monitoring und die verschiedenen Arten von Tools vorgestellt. Außerdem wird beschrieben, wie IT-Monitoring in Zusammenhang mit der Netzwerkverwaltung und -performance sowie DevOps und Automatisierung funktioniert, und erläutert, wie man eine effektive IT-Monitoring-Strategie wählt.

Analystenbericht | Splunk liegt laut IDC-Bericht zu ITOA-Marktanteilen auf Platz 1

IT-Monitoring – Überblick

Was sind die grundlegenden Arten von IT-Monitoring?

Zu den grundlegenden Arten von IT-Monitoring gehören das Verfügbarkeits-Monitoring, das Web-Performance-Monitoring, Anwendungs-Management und Anwendungs-Performance-Management, die API-Verwaltung, das Real-User-Monitoring (RUM), das Sicherheits-Monitoring und das Monitoring von Geschäftsaktivitäten.

Da es keine offizielle Liste der verschiedenen Arten von Tools für das IT-Monitoring gibt und viele Begriffe mehrere Monitoring-Arten beinhalten, ist in diesem Segment keine klare Abgrenzung möglich. Im Folgenden sehen wir uns die allgemeinen Arten von Tools an, die zu IT-Monitoring zählen:

  • Verfügbarkeits-Monitoring: Verfügbarkeits-Monitoring wird oft auch als System-Monitoring bezeichnet und ist wohl die ausgereifteste Art von IT-Monitoring-Tool. Verfügbarkeits-Monitoring beinhaltet Kategorien wie Serververwaltung, Infrastruktur-Monitoring/-Verwaltung und Netzwerk-Monitoring/-Verwaltung und soll Benutzern Informationen über Uptime und Performance des Monitoring-Ziels bereitstellen.
  • Web-Performance-Monitoring: Als Teilbereich des Verfügbarkeits-Monitoring ist Web-Performance-Monitoring darauf ausgelegt, die Verfügbarkeit eines Webservers oder Webservice zu überwachen, liefert aber auch genauere Details über das System. Diese Tools können Informationen wie die Ladezeit einer Seite, den Ursprung erzeugter Fehler und individuelle Ladezeiten verschiedener Web-Elemente erfassen und Analysten damit bei der Feinabstimmung der Performance einer Website oder einer webbasierten App unterstützen.
  • Anwendungs-Management/Anwendungs-Performance-Management (APM): APM-Tools ähneln Tools für das Web-Performance-Monitoring, sind jedoch auf kundenorientierte Anwendungen ausgerichtet. Sie ermöglichen es Analysten, die Performance einer Anwendung zu verfolgen und Probleme zu erkennen, bevor sich diese gravierend auf die Benutzerbasis auswirken. Modernere APM-Tools enthalten eventuell automatisierte Routinen, um diese Probleme ohne menschliches Eingreifen zu beheben.
  • API-Monitoring: Für Unternehmen, die APIs für Entwickler von Drittanbietern bereitstellen, ist es von entscheidender Bedeutung, die Uptime dieser Services sicherzustellen. Tools und Software für das API-Monitoring liefern Erkenntnisse darüber, ob eine API ordnungsgemäß funktioniert, und sorgen für minimale Ausfallzeiten.
  • Real-User-Monitoring: Das Real-User-Monitoring wurde entwickelt, um die tatsächlichen Interaktionen der Endbenutzer mit einer Website oder Anwendung aufzuzeichnen. Durch das Monitoring der realen Ladezeiten und des Benutzerverhaltens können Probleme auf der Grundlage „realer“ (im Gegensatz zu simulierten) Herausforderungen für die Benutzererfahrung identifiziert werden. Dieses Monitoring ist rückwärtsgerichtet und nicht prädiktiv – Analysten erkennen Probleme also erst, nachdem sie aufgetreten sind.
  • Sicherheits-Monitoring: Sicherheits-Monitoring ist eine sehr spezifische Art von IT-Monitoring, die darauf ausgelegt ist, ein Netzwerk auf Sicherheitsverletzungen oder andere ungewöhnlichen Aktivitäten zu überwachen. Sicherheits-Monitoring ist eine weit gefasste, übergeordnete Kategorie, die zahlreiche Untergruppen von Sicherheitsanalyse-Tools umfasst.
  • Monitoring von Geschäftsaktivitäten:Diese Art von Monitoring-Tool erfasst die wichtigsten Performance-Metriken eines Unternehmens und verfolgt sie über einen bestimmten Zeitraum. Diese Metriken könnten zum Beispiel Informationen über Einzelhandelsumsätze, Downloads von Anwendungen oder das Volumen von Finanztransfers enthalten.

Beachten Sie, dass alle diese Tools für das Monitoring von Geräten oder Anwendungen vor Ort, in Verbindung mit Cloud-basierten Systemen oder für beides verwendet werden können.

Security monitoring dashboard

Sicherheits-Monitoring wird für die Überwachung auf Bedrohungen und verdächtige Aktivitäten im Netzwerk eingesetzt.

Welche Arten von Tools werden für das IT-Monitoring verwendet?

Die Tools für das Monitoring der IT-Infrastruktur können in drei allgemeine Kategorien oder Arten von Netzwerkgeräten unterteilt werden, je nachdem, wie sie eingesetzt werden: Tools für die Beobachtung, für die Analyse und für Maßnahmen:

  • Tools für die Beobachtung: Dies sind die grundlegendsten Tools im IT-Monitoring. Sie werden für die Beobachtung von Hardware, Software oder Services und die Rückmeldung von Erkenntnissen über deren operative Effizienz eingesetzt. Zu dieser Kategorie zählen die meisten Tools für das Verfügbarkeits-Monitoring, einschließlich Tools für Infrastruktur-Monitoring und -Management sowie Tools für das Web-Performance-Monitoring.
  • Tools für die Analyse: Diese Art von IT-Monitoring-Tool dient dem Zweck, Beobachtungsdaten zu erfassen und weiter zu analysieren. Durch die weitere Analyse dieser Daten kann festgestellt werden, wo Probleme ihren Ursprung haben, und, was noch wichtiger ist, eventuell herausgefunden werden, warum die Probleme auftreten. Fortschrittliche Analyse-Tools, wie z. B. AIOps-Systeme, haben die Aufgabe, auf der Grundlage historischer Trends und Muster zu prognostizieren, wo Probleme wahrscheinlich auftreten werden.
  • Tools für Maßnahmen: Als IT-Monitoring-Tools dieser letzten Kategorie sind Tools für Maßnahmen darauf ausgelegt, auf Informationen zu reagieren, die sowohl von Analyse- als auch Beobachtungstools erzeugt wurden. Die Reaktion kann dabei ganz einfache Formen annehmen, wie beispielsweise im Fall von Service-Tickets oder Benachrichtigungen, die intelligent an den entsprechenden Analysten oder Business Manager weitergeleitet werden. Häufiger sieht der Eingriff jedoch so aus, dass ein zusätzlicher Service gestartet wird, Fehler verursachende Hardware oder Software neu gestartet wird oder Backups ausgeführt werden.

Wie arbeiten das IT-Monitoring und das Management zusammen

IT-Monitoring-Tools liefern die Informationen, auf die Führungskräfte reagieren können. IT-Monitoring hat Relevanz für die Geschäftsleitung, da dabei Performance-Informationen erfasst und bereitgestellt werden, die dann in taktische und wirtschaftliche Entscheidungsprozesse einfließen können.

Die von IT-Monitoring-Tools bereitgestellten Informationen ermöglichen Business-Managern, tiefere Einblicke in die Auswirkungen der IT-Infrastruktur auf Umsatz und Geschäftsergebnis zu erhalten. Eine Ausfallzeit von 0,11 % bedeutet 11 Minuten Nichtverfügbarkeit pro Woche. Während der Hauptgeschäftszeiten können 11 Minuten, in denen das System keine Zahlungen verarbeiten kann, erhebliche Kosten verursachen. Wie verhält sich das im Vergleich zu den Kosten für den Austausch einer Speicherkarte im Server oder die Aufrüstung des Netzwerks, mit denen diese Ausfallzeit vermieden werden kann? Oder gibt es einen Prozessfehler, der behoben werden sollte, um das Problem zu lösen? Nehmen die Ausfallzeiten zu, schließt ein erfahrener Manager eventuell daraus, dass noch größere Probleme bevorstehen, und nutzt dann die Daten aus dem IT-Monitoring, um den Austausch oder die Aufrüstung der vorhandenen Hardware zu rechtfertigen.

Wie funktioniert IT-Monitoring im Bereich DevOps?

IT-Monitoring spielt eine zunehmend wichtige Rolle im Bereich DevOps. Dies liegt hauptsächlich daran, dass es bei DevOps um die Zusammenarbeit zwischen mehreren Teams geht, und zwar besonders zwischen Entwicklungs- und Operations-Teams. Doch immer öfter haben Unternehmen festgestellt, dass es noch größere Vorteile bringt, wenn andere Abteilungen in diese Kombination einbezogen werden. Hier sind beispielsweise Security- und QA/Testing-Teams zu nennen. Nur wenn alle diese Gruppen wirklich als Team zusammenarbeiten, kann eine Software oder ein Service erfolgreich auf den Markt gebracht werden.

IT-Monitoring ist eine natürliche Ergänzung dieses Konzepts und besonders bei Produkten relevant, bei denen hohe Verfügbarkeit zählt, wie z. B. ein Cloud-basierter Service oder eine App, die auf die API Ihres Unternehmens angewiesen ist. Wenn solche Services langsam werden oder ganz ausfallen, kann die Kundenzufriedenheit und möglicherweise auch der Umsatz darunter leiden. Es ist daher für DevOps-Teams von entscheidender Bedeutung, dafür zu sorgen, dass kritische Systeme betriebsbereit und verfügbar bleiben, und diese Performance-Messungen von Anfang an direkt in den Entwicklungsprozess einzubauen.

Eine weitere Schnittmenge von DevOps und IT-Monitoring ist die zunehmende Geschwindigkeit von Produktaktualisierungen, da Anwendungen manchmal mehrmals am Tag aktualisiert werden. Monitoring ist in solchen Umgebungen unerlässlich, da das rasante Entwicklungstempo oft nur wenig Zeit für die Qualitätssicherung lässt, bevor ein neues Update live geschaltet wird. In manchen Fällen gelangt so ein unentdeckter Fehler in das Produktionssystem und kann dazu führen, dass ein wichtiges System zu langsam wird oder ganz abstürzt. Ist eine solide Lösung für Echtzeit-IT-Monitoring implementiert, können solche Fehler oftmals in Sekundenschnelle erkannt werden, sodass das DevOps-Team das Problem sofort beheben oder den Code auf einen bekannten, fehlerfreien Zustand zurücksetzen kann, um Ausfallzeiten zu minimieren.

In der Welt von DevOps ist das IT-Monitoring allerdings auch zukunftsorientiert. DevOps-Monitoring-Systeme können genutzt werden, um genau die Tools zu überwachen, die Entwickler bei ihrer eigenen Arbeit verwenden. So können Führungskräfte Bereiche erkennen, die ineffizient sind oder von einer Automatisierung profitieren könnten.

Security monitoring dashboard

IT-Monitoring ist ein zunehmend wichtiger Bestandteil von DevOps, da DevOps die Zusammenarbeit mehrerer Teams erfordert.

In welcher Beziehung stehen IT-Monitoring und Automatisierung?

Im Bereich Automatisierung erfolgt IT-Monitoring hauptsächlich durch Maßnahme-Tools. Wie bereits erwähnt, kann die Automatisierung in Form von automatisierten Service-Tickets oder Benachrichtigungen erfolgen. Es kann aber auch eine komplexe Abfolge von Aktionen durchgeführt werden, die ein vom Monitoring-Tool erkanntes Problem ohne menschliches Zutun beheben.

Je komplexer die Infrastruktur ist, desto notwendiger wird die Automatisierung. Selbst in Unternehmen von bescheidener Größe gibt es schlicht zu viele bewegliche Teile, als dass sie von Menschen verwaltet werden könnten. Und bei hybriden Systemen, die Cloud-basierte und lokale Netzwerke kombinieren, ist dies sogar noch komplizierter.

IT-Monitoring-Tools mit integrierten Automatisierungsfunktionen wurden dafür entwickelt, all dies zu erleichtern. Wenn ein Server als Reaktion auf einen plötzlichen Anstieg der Kundenaktivität langsamer wird, kann das Tool das Problem als überlastete CPU diagnostizieren und automatisch einen anderen Server (real oder virtuell) anweisen, zu übernehmen. Nimmt der Netzwerkverkehr dann ab, kann das Tool entscheiden, den zweiten Server wieder herunterzufahren. Außerdem hat das Tool die Möglichkeit, einen Bericht über die Kernursache des Incidents zu erstellen, damit das Management entscheiden kann, ob ein Upgrade notwendig ist.

Wie setzen Analysten IT-Monitoring ein?

Analysten nutzen IT-Monitoring-Tools auf unterschiedlichste Weise und es gibt keine festgeschriebenen Regeln dafür, wie solche Tools genau eingesetzt werden sollten. Im Großen und Ganzen verwenden Analysten IT-Monitoring-Tools, um ein ganzes Spektrum kritischer Funktionen auszuführen, wie z.B:

  • Monitoring und Troubleshooting physischer und virtueller Infrastrukturknoten, einschließlich Server, Netzwerkhardware und Cloud-basierte Systeme, damit Probleme schnell behoben werden können
  • Monitoring in Echtzeit laufender Anwendungen, um die Uptime sicherzustellen und die Entwicklung in einer DevOps-Umgebung zu beschleunigen
  • Verbessern des IT-Entscheidungsprozesses durch einfachere Identifizierung von Engpässen, exzessiven Bandbreitennutzern und anderen potenziellen Problemkreisen in der Netzwerkumgebung
  • Steigern der Transparenz bei Cloud-basierten Systemen und Integration von Monitoring bei lokalen Systemen
  • Prognostizieren und Analysieren der Auswirkungen von IT-Abläufen auf das Geschäft – finanzielle Auswirkungen eingeschlossen
  • Automatisieren des Incident Managements, um die Notwendigkeit für menschliche Überwachung zu reduzieren, Probleme schnell zu beheben und Over-Alerting zu vermeiden
  • Verfolgen des Endbenutzerverhaltens innerhalb einer Anwendung, um Verbesserungsmöglichkeiten zu erkennen
IT monitoring tools are used in a variety of ways by analysts.

Analysten nutzen IT-Monitoring-Tools auf vielfältige Weise.

Erste Schritte

Wie gehe ich bei der Auswahl einer IT-Monitoring-Strategie vor?

Die folgende schrittweise Anleitung beschreibt den Einstieg bei der Umsetzung Ihrer eigenen IT-Monitoring-Strategie.

  1. Definieren Sie Ihre Ziele: Möchten Sie nur benachrichtigt werden, wenn ein einzelner Server ausfällt, oder müssen Sie eine hybride Umgebung mit lokaler Hardware und Cloud-Services überwachen? Möchten Sie Ihr Monitoring-Tool mit anderen Services integrieren? Möchten Sie Transparenz bei bestimmten Performance-Daten erreichen? Möchten Sie Machine Learning-Technologie nutzen, um Korrekturmaßnahmen zu automatisieren? Die Antworten auf diese Fragen haben einen großen Einfluss auf die Komplexität der Monitoring-Tools, die Sie in Betracht ziehen sollten.
  2. Holen Sie die Geschäftsleitung ins Boot: In Verbindung mit Schritt 1 sollten Sie Personen außerhalb der IT-Abteilung einbeziehen, um auch ihre IT-Monitoring-Ziele in Erfahrung zu bringen und sich ihre Unterstützung zu sichern. Konsolidieren Sie diese Anforderungen mit den Monitoring-Zielen der IT-Abteilung in einer Liste mit Zielen.
  3. Identifizieren Sie wichtige Funktionen, die Sie benötigen: Die meisten Monitoring-Tools bieten grundlegende Funktionen wie Reporting und Dashboards, variieren jedoch in Entwicklungsstand und Komplexität. Wenn Sie besonderen Wert auf Datenspeicherung legen oder auf Machine Learning gestützte Echtzeiterkenntnisse benötigen, tragen diese Arten von Funktionen ebenfalls dazu bei, die Auswahl der geeigneten Lösungen einzugrenzen.
  4. Identifizieren Sie Datenquellen, die genutzt werden können: Diese Datenquellen können von servlogs über Maschinendaten bis hin zu Datenquellen von Drittanbietern reichen. Ganz gleich, was Sie überwachen möchten, es sollte mindestens eine relevante Datenquelle geben, die damit in Zusammenhang steht. Listen Sie alle diese Quellen auf, damit Sie sicherstellen können, dass die Tools, die Sie in Betracht ziehen, die gewünschten Informationen auch unterstützen.
  5. Beurteilen Sie die potenziellen Tools mithilfe von Tests: Wenn Sie alle diese Informationen zusammengetragen haben, müssen Sie nicht gleich das erstbeste IT-Monitoring-Tool kaufen, das geeignet scheint. Die meisten Tools können getestet werden, sodass Sie vor der Kaufentscheidung prüfen können, wie gut sie in Ihrer Umgebung funktionieren. Dies gilt ganz besonders für Tools, die als Service auf Abonnementbasis angeboten werden.

Was sind Best Practices für das IT-Monitoring?

Genauso wichtig wie die Auswahl des Tools ist die Art und Weise, wie Sie es einsetzen. Zu einigen Best Practices, die es sich zu beachten lohnt, zählen der clevere Umgang mit Warnmeldungen, die Berücksichtigung der Dringlichkeit und des Mediums für Benachrichtigungen, die Optimierung von Dashboards, die Erstellung eines Eskalationsplans, Redundanz und die Überwachung von Ausreißern.

  • Cleverer Umgang mit Warnmeldungen: Ein Übermaß an Benachrichtigungen und Warnmeldungen führt schnell zu Over-Alerting und, was noch schlimmer ist, dazu, dass Warnmeldungen ignoriert werden. Achten Sie darauf, eine Benachrichtigungslogik zu erstellen, die wirklich nur ausgelöst wird, wenn menschliches Eingreifen notwendig ist.
  • Berücksichtigung der Dringlichkeit von Benachrichtigungen: Warnungen zu einfachen Abstürzen oder kurzen Ausfallzeiten können an Low-Level-Analysten weitergeleitet werden, schwerwiegendere Probleme müssen jedoch schnell an Führungskräfte eskaliert werden. Weisen Sie Problemen eine Dringlichkeit zu, um diese Kategorisierung und Eskalation zu erleichtern.
  • Berücksichtigung des Mediums: Wann ist eine Benachrichtigung per E-Mail akzeptabel und wann muss eine SMS oder eine andere mobile Benachrichtigung verwendet werden? Denken Sie daran, dass zu viele SMS-Nachrichten schnell zu Over-Alerting und ignorierten Benachrichtigungen führen können.
  • Optimieren von Dashboards: Das Dashboard ist der Ort, an dem die meisten Analysten den größten Teil ihres Arbeitstages verbringen. Es lohnt sich daher, einen gewissen Aufwand zu betreiben, um sicherzustellen, dass das Dashboard die wichtigsten Informationen in den Vordergrund stellt und leicht auf sekundäre Informationen zugegriffen werden kann.
  • Erstellen eines vom Benachrichtigungssystem getrennten Eskalationsplans: Selbst wenn ihr Benachrichtigungssystem über einfache Eskalationsroutinen verfügt, kann ein scheinbar simples Problem mit einem Server schnell zu einem großen Problem eskalieren. Eventuell meldet Ihr IT-Monitoring-Tool beispielsweise nur, dass ein nicht Offsite-Server offline ist, ohne zu wissen, dass ein Wirbelsturm der Stärke 5 auf das Rechenzentrum zurollt. Dies sind Probleme mit ganz unterschiedlicher Tragweite, die ganz unterschiedliche Antworten erfordern.
  • Redundanz ist gut: Vermeiden Sie es möglichst, sich beim Monitoring des Zustands eines bestimmten Knotens auf eine einzige Datenquelle zu verlassen. Wenn Ihr Monitoring-Tool den Zugriff auf ein Serverprotokoll verliert, kann das bedeuten, dass der Server ausgefallen ist oder dass ein Netzwerkkabel durchtrennt wurde. Sie können die tatsächliche Ursache nur ermitteln, wenn Sie über eine zweite Datenquelle verfügen, die den Netzwerkverkehr überwachen kann. Dies kann dazu beitragen, diese Art von Problemen schneller zu beheben.
  • Überwachen von Ausreißern: Eine durchschnittliche Webseiten-Antwortzeit von 0,3 Sekunden ist großartig, solange das nicht bedeutet, dass ein kleiner Prozentsatz Ihrer Benutzer tatsächlich Antwortzeiten von 30 Sekunden oder mehr erlebt, und dies nicht erfasst wird. Eine intelligente Monitoring-Strategie muss alle Daten berücksichtigen, nicht nur Mittelwerte. Bei der Fehlerbehebung müssen zudem oft die spezifischen Variablen betrachtet werden, die bei einem kleinen Teil der Endbenutzer Probleme verursachen könnten.

Fazit

IT-Monitoring kann über den Erfolg Ihres Unternehmens entscheiden

Beim IT-Monitoring geht es nicht nur darum, einen Techniker zu benachrichtigen, wenn ein Server abstürzt, sondern auch darum, solche Probleme im Voraus intelligent vorherzusagen. Immer häufiger werden IT-Monitoring-Tools auch eingesetzt, um Reaktionen zu automatisieren, damit solche Probleme behoben werden, bevor sie sich auf Benutzer auswirken können.

Da IT-Infrastrukturen immer komplexer werden, müssen IT-Manager unbedingt Systeme implementieren, durch die sie Schritt halten können. Durch die formale Integration von IT-Monitoring in Ihr gesamtes Ökosystem können Sie operative Prozesse im Hinblick auf zahlreiche Metriken dramatisch verbessern – von der einfachen Serviceverfügbarkeit bis hin zur Sicherstellung einer hohen Performance und der Gesamtrentabilität des Unternehmens.