DEVOPS

Neue Splunk Observability-Innovationen ermöglichen schnelleres Troubleshooting für Engineering-Teams

Gute Nachrichten für technische Teams, die Splunk Observability Cloud nutzen: Wir haben mehrere neue Verbesserungen vorgenommen, die euch die Fehlersuche und -behebung erleichtern, transparentere Einblicke in eure Umgebungen bieten und für eine einheitlichere Incident Response sorgen. Wenn ihr als Techniker an vorderster Front arbeitet, wisst ihr, dass sich digitale Ressourcen nur warten und schützen lassen, wenn ihr sie beobachten könnt. Und genau hier setzen unsere Innovationen an: Sie bieten zusätzlichen Kontext zum Endnutzererlebnis, zum Cloudnetzwerk und zu jeder einzelnen Transaktion. Dadurch könnt ihr Problemursachen schnell eingrenzen, sobald ihr eine interne Service-Anfrage erhaltet, dank präziserer Warnmeldungen effizienter auf Probleme reagieren und bringt so über nur eine einzige Benutzeroberfläche Ordnung ins On-call-Chaos. 

Außerdem haben wir unsere branchenführenden Logging- und Incident-Response-Funktionen nun auch auf Splunk Observability Cloud erweitert. Damit erhalten jetzt alle Teams den nötigen Kontext, den sie für das Troubleshooting ihrer gesamten Produktionsumgebung brauchen.

Dank mehr Transparenz Problemen schneller auf den Grund gehen

Die vielen verbesserten Funktionen geben euch tiefergehende Transparenz und mehr Kontext, sodass ihr Probleme – angefangen bei eurem Tech-Stack bis hin zur User Experience – schneller erkennt und behebt. Egal, ob ihr eine monolithische oder Microservices- Architektur betreibt, ihr erhaltet Kontext zu jedem technischen Problem im Cloud-Netzwerk oder in Kubernetes-Clustern, beispielsweise bei fehlerhaften User-Sessions oder Tags. Damit könnt ihr schnell Kernursachen auf den Grund gehen und entsprechende Folgen auf Kundenseite nachvollziehen.

  • Splunk Application Performance Monitoring (APM) Trace Analyzer: Dieses Tool macht es möglich, in Milliarden von Transaktionen zuverlässig Muster zu erkennen und konkrete Probleme bei Tags, Benutzern oder Services welcher Art auch immer aufzuspüren. Der Splunk APM Trace Analyzer hilft euch, unbekannte Ursachen für Fehler in endlosen Tag- und Metadaten-Kombinationen zu ermitteln, bei bestimmten Usern auftretende Probleme zu beheben und die Auswirkungen eines Fehlers auf Kundengruppen zu verstehen.

  • Splunk Infrastructure Monitoring Network Explorer: Der Network Explorer ist ein neues Feature in Splunk Infrastructure Monitoring, das umfassende Einblicke in Cloud-Netzwerke bietet. Technische Teams können dadurch Fehlerursachen im Netzwerk schneller aufspüren und den Netzwerkzustand leicht überwachen und beurteilen. Außerdem haben sie die Cloud-Umgebung und Netzwerktopologie jederzeit im Blick. Darüber hinaus lassen sich mit dem Network Explorer kostenintensive Services und Traffic-Muster identifizieren, sodass ihr Investitionen in euer Cloud-Netzwerk optimieren könnt.

  • Integriertes Digital Experience Monitoring (DEM) in Splunk Observability Cloud: Hiermit könnt ihr auf einem einzelnen Bildschirm RUM-Kennzahlen (Real User Monitoring) aus dem Browser visualisieren, die mit Performance-Kennzahlen auf Seitenebene aus synthetischen Testläufen korrelieren. Dank dieser integrierten Darstellung seht ihr schnell, ob Probleme systemweit oder nur regional auftreten und ob es sich dabei um Testanomalien oder konkrete Beeinträchtigungen für Endbenutzer handelt. Dementsprechend könnt ihr die Fehlerbehebung priorisieren und beschleunigen, damit eure digitalen Services schnell wieder reibungslos funktionieren. 

  • Log Timelines in Splunk Observability Cloud: Log Timelines baut auf den leistungsstarken Logging-Funktionen von Splunk und dem Log-Views-Feature auf. Mit Log Timelines könnt ihr euren Observability-Dashboards Log-basierte Zeitdiagramme hinzufügen. Dies ermöglicht die Analyse von Trends anhand von Log-Daten und beschleunigt die Problembehebung. 

  • Splunk Infrastructure Monitoring Metrics Pipeline Management: Metrics Pipeline Management ist ein Feature in Splunk Infrastructure Monitoring, mit dem ihr eure Monitoring-Leistung steigern könnt. So habt ihr alle Daten zur Hand, die ihr für ein schnelles Troubleshooting braucht, ohne dass die Monitoring-Kosten in die Höhe schnellen. Ihr könnt große Mengen an Kennzahlen leicht überblicken und zusammenfassen sowie weniger wichtige Daten anhand dynamisch definierter Richtlinien und Regeln herausfiltern. Unterm Strich werden nur noch die Daten erfasst, gespeichert und analysiert, die für euch tatsächlich relevant sind.

 

  • APM AlwaysOn Profiling, Memory Profiling für .NET und Node.js: Die Memory-Profiling-Funktionen von AlwaysOn Profiling stehen nun in weiteren Sprachen zur Verfügung. Außerdem wurde Support für .NET und Node.js hinzugefügt. Ab sofort könnt ihr messen, wie sich Programmiercode auf die Prozessor- und Arbeitsspeicherauslastung von .NET-, Node.js- und Java-Anwendungen auswirkt. Dazugehörige Kontextinformationen einschließlich aller Trace-Daten sind verlinkt, was die Fehlersuche erleichtert – und all dies mit nur minimalem Zusatzaufwand.

 

Mehr Übersicht im Service-Fall dank eines einheitlichen Incident-Response-Ansatzes

Mit Splunk-Incident-Intelligence- und AutoDetect-Funktionen habt ihr nun die Möglichkeit, die Effizienz eurer On-call-Teams deutlich zu steigern. Diese neuen Funktionen sorgen mit aussagekräftigeren Warnmeldungen und optimierten Abläufen für eine bessere Koordination und mehr Effizienz eurer Teams, was die MTTD, MTTA und MTTR verkürzt. Sprich: Gemessen ab dem Zeitpunkt der Warnmeldung ist das Problem schneller gelöst. 

  • Splunk Incident Intelligence in Observability Cloud: Diese in Splunk Observability Cloud verfügbare Incident-Response-Lösung liefert technischen Bereitschaftsteams alle nötigen Daten, um Diagnosen stellen, Fehler beheben und Services wiederherzustellen zu können, bevor der Kunde etwas merkt. Dank Warnmeldungen mit umfassenden Full-Stack-Kontextinformationen lassen sich ungeplante Ausfallzeiten verhindern. Außerdem ermöglichen Funktionen zur Einsatzplanung und Eskalation sowie benutzerdefinierte Benachrichtigungen ein einheitliches Vorgehen aller Incident-Response-Teams.

  • Splunk Application Performance Monitoring (APM) AutoDetect: Das auf Machine Learning (ML) basierende Feature APM AutoDetect verbessert die Genauigkeit erheblich und reduziert den manuellen Aufwand zur Einrichtung von Service-Warnmeldungen. Mit AutoDetect könnt ihr spielend leicht Performance-Vorgaben für einzelne Services festlegen sowie automatische Detektoren, Warnmeldungen und Benachrichtigungen für den Fall erstellen, dass sich Latenzzeiten oder Abfrageraten plötzlich ändern oder Fehler auftreten. In der Folge spart ihr euch das häufige Neukonfigurieren von Warnmeldungen und erhaltet immer hochpräzise Meldungen für alle cloud-nativen Umgebungen.

Möchtet ihr mehr über die neuen Features von Splunk Observability erfahren? Dann empfehlen wir euch unser Webinar Splunk Observability Innovations Showcase: Increased Visibility & A Unified Approach to Incident Response. Klickt einfach auf einen der verlinkten Termine, um euch für die Live-Session zu registrieren (Sessions zu EMEA-freundlicheren Zeiten sind in Arbeit!):

Ausfallzeiten und kritische Systemfehler können euer Geschäft erheblich beeinträchtigen. So fand das Uptime Institute in seiner Outage Analysis 2022 heraus, dass Unternehmen bei 60 % der Ausfälle Verluste in Höhe von mindestens 100.000 USD erlitten. Damit euch das nicht passiert und ihr eure digitale Resilienz ausbauen könnt, setzt Splunk mit seiner Plattform für einheitliche Sicherheit und Observability alles daran, die Performance und Zuverlässigkeit eurer Systeme zu gewährleisten. 

Kostenlos testen: Splunk Observability Cloud ist jetzt noch besser

Möchtet ihr euch gerne selbst von den neuen Features der Splunk Observability Cloud überzeugen? Dann habt ihr zwei Möglichkeiten, unser Tool zu testen: 

  • Mit euren eigenen Daten – durch Instrumentierung per OpenTelemetry 
  • Mit Beispieldaten – für den Schnellstart in weniger als 1 Minuten

Ladet euch jetzt eure kostenlose 14-tägige Testversion herunter!

*Dieser Artikel wurde aus dem Englischen übersetzt und editiert. Den Originalblogpost findet ihr hier.

Spiros Xanthos
Posted by

Spiros Xanthos

Spiros Xanthos ist General Manager of Observability bei Splunk und leitet das Observability- und IT-Produktportfolio des Unternehmens. Zuvor war er CEO und Gründer von Omnition, einer Observability-Plattform für Cloud Native Applications, die als Pionier für No-Sample-Tracing gilt und OpenTelemetry mitentwickelt hat. Omnition wurde im September 2019 von Splunk akquiriert. Vor Omnition gründete und leitete Spiros das Unternehmen Pattern Insight, das Log Insight (eine Log-Analyseplattform) entwickelte und 2012 an VMware verkauft wurde. Darüber hinaus leitete er bis September 2017 das Unternehmen ezhome. Spiros hat einen Master-Abschluss in Computer Science und ist PhD-Drop-Out der UIUC.

TAGS
Show All Tags
Show Less Tags