DEVOPS

Application Performance Monitoring neu definiert – mit dem neuen SignalFx Microservices APM

Heute hat Splunk eine neue Version von SignalFx Microservices APM bekanntgegeben, die unter anderem folgende bahnbrechende Innovationen beinhaltet: Full-Fidelity Tracing, AI-Driven Directed Troubleshooting (gezielte, KI-gesteuerte Fehlerbehebung) und auf offenen Frameworks basierende Instrumentierung.

Nach der vollendeten Übernahme von SignalFx und Omnition durch Splunk freuen wir uns nun, euch ein neues, revolutionäres Release von SignalFx Microservices APM vorstellen zu können. Durch die Kombination der Funktionen von SignalFx und Omnition bieten wir die innovativste und fortschrittlichste Lösung für Distributed Tracing, einschließlich einer auf offenen Standards basierenden Datenerfassung für AI-Driven Directed Troubleshooting. Diese neuen Features bringen uns unserem Ziel ein großes Stück näher: Wir möchten erstklassige Observability bieten, die es DevOps- und SRE-Teams ermöglicht, die MTTD und MTTR zu senken, die Uptime von Anwendungen zu verbessern und einwandfreie Kundenerfahrungen bereitzustellen – und zwar unabhängig von der Größe und Komplexität ihrer auf Microservices basierenden Anwendungen.

Die Anwendungslandschaft verändert sich

In den letzten Jahren hat die Rolle von Software zunehmend an Bedeutung gewonnen und sie ist von einem einfachen weiteren Rädchen im Unternehmen zu einem bedeutenden Faktor geworden, der das Bild des Unternehmens prägt. Heutzutage gibt es fast keinen Bereich im Leben, in dem Software keine Rolle spielt. Parallel dazu hat sich die Softwareentwicklung als solche weiterentwickelt: mit neuen Technologien wie Cloud, Container und KI, aber auch mit neuen Methoden, die die Zeit zwischen Releases von Jahren auf Minuten verkürzen. Bedingt durch die Änderungen im Bereich Software müssen sich auch APM-Lösungen (Application Performance Monitoring) anpassen:

Lückenlose Beobachtung: Die Größe und Kurzlebigkeit moderner Umgebungen – in Kombination mit einem beispiellosen Innovationstempo und der zunehmenden Bedeutung der Software-Performance – bringen es mit sich, dass einfach nicht bekannt ist, wo das nächste Problem auftreten könnte, und dass eine verzögerte Reaktion bei der Lösung dieses Problems negative Auswirkungen auf User Experience, die Marke und das Geschäftsergebnis haben wird. Um eine hohe Anwendungs-Performance und -verfügbarkeit zu gewährleisten, müssen ALLE Daten erfasst werden.
KI-gesteuerte Analysen: Die Verarbeitung und Auswertung aller Daten, die von moderner Software erzeugt werden, sind von Menschen allein schlichtweg nicht zu bewältigen. In der modernen Welt, in der schlechte Software-Performance gleichbedeutend mit schlechter Kundenerfahrung ist, reichen alte manuelle Prozesse, die auf Troubleshooting nach dem Prinzip „Trial and Error“ basieren, einfach nicht mehr aus. Um Probleme zu erkennen und die ihnen zugrunde liegende Kernursache innerhalb von Sekunden zu finden, ist ein KI-gesteuerter Ansatz erforderlich.
Offene, flexible Instrumentierung: Um den Anforderungen des modernen Innovationstempos gerecht zu werden, benötigen DevOps-Teams möglichst flexible und schlanke Tools sowie Programming-Frameworks und die Kreativität der breiten Software-Community. Anders ausgedrückt: Open Source Frameworks sind ein Muss.

Die Grenzen bestehender Ansätze

Herkömmliche APM-Tools sind Relikte der Vergangenheit. Sie sind auf einfache, statische, monolithische Systeme ausgerichtet und haben sich nicht ausreichend weiterentwickelt, um für Monitoring-, Untersuchungs- und Fehlerbehebungsaufgaben in komplexen modernen Anwendungen mit Microservices, containerisierten Workloads oder serverlosen Funktionen eingesetzt werden zu können. Die marktführenden Lösungen der alten APM-Landschaft bleiben in Bezug auf Observability in jedem Aspekt hinter modernen Anwendungen zurück. Sie weisen besonders in drei Bereichen Mängel auf, die für effektives Monitoring, Untersuchen und Troubleshooting von entscheidender Bedeutung sind:

Partielle Informationen: Herkömmliche APM-Lösungen wurden zur Ermittlung von Durchschnittswerten erstellt und verwenden ein auf der Benutzerzahl basierendes, probabilistisches Stichprobenverfahren. Das bedeutet, dass sie nur einen geringen Bruchteil der Daten erfassen und ihnen dadurch die meisten interessanten Ausfall- und Latenzfälle entgehen, die auf eine erforderliche Fehlerbehebung hinweisen. Dazu kommt, dass herkömmliche Lösungen in Silos organisiert sind und Metriken, Tracing-Daten und Protokolle daher nicht effektiv verknüpfen können. Ohne den für die heutigen verteilten Anwendungen erforderlichen Kontext können Betreiber die Performance ihrer Services nicht mit den zugrunde liegenden Infrastruktur- und Geschäfts-KPIs korrelieren.
Manuelle Fehlerbehebung: Herkömmliche APM-Lösungen sind nicht auf die Größe und Komplexität Cloud-nativer Anwendungen ausgelegt. Wenn ein Problem festgestellt wird, müssen die Verantwortlichen daher manuell die einzelnen, als Stichprobe genommenen Tracing-Daten analysieren und versuchen, Muster zu finden, die sinnvoll erscheinen. Solche manuellen Prozesse lassen sich nicht auf Umgebungen mit Hunderten von Services, Tausenden von Containern und Millionen von Datenpunkten skalieren, was zu einer MTTR (Mean-Time-To-Resolution) führt, die dramatisch ansteigt oder bei der überhaupt keine Lösung stattfindet.
Proprietäre Lösungen: Bei herkömmlichen APM-Lösungen ist der Benutzer an schwerfällige, proprietäre Datenerfassungs-Agents gebunden, die wartungsaufwändig sind, Performance-Probleme verursachen und keine Interoperabilität bieten. Außerdem unterstützen diese Lösungen meist nicht die neuesten Programmiersprachen und Frameworks, sodass Entwickler wenig Auswahl und Flexibilität bei der Erstellung ihrer Anwendungen haben.

Die Zukunft von APM und Distributed Tracing

Indem wir SignalFx und Omnition in einer Lösung kombinierten, haben wir haben einen völlig anderen, neuen APM-Ansatz erschaffen, der auf Stichproben verzichtet und KI-gesteuerte Analysen und offene Standards einsetzt.

Die vorhergehende APM-Generation von SignalFx Microservices bot zum ersten Mal die Funktion „NoSample™ Distributed Tracing“, mit der jede einzelne Transaktion beobachtet und analysiert, Tracing- und Datenbereichsmetriken dargestellt und sämtliche Ausreißer und Anomalien erfasst werden konnten. Außerdem war dies die erste moderne APM-Lösung, die KI-gesteuerte Analysen und gezieltes Troubleshooting ermöglichte, damit DevOps-Teams den verursachenden Service bzw. das Problem schnell identifizieren konnten. Zur gleichen Zeit wurde mit der Omnition-Lösung für Distributed Tracing die Full Fidelity-Erfassung eingeführt, bei der 100 % der Tracing-Daten verarbeitet und in der Cloud gespeichert wurden sowie feinste Details (Untersuchungen mit unbeschränkter Kardinalität) den Benutzern ermöglichten, differenzierte Analysen zu allen interessanten Aspekten durchzuführen.

Die beiden Lösungen von SignalFx und Omnition bieten bereits die nötige Performance und Skalierbarkeit für sowohl komplexe, moderne Anwendungen als auch einen aussagekräftigen Kontext, der Distributed Tracing-Daten nahtlos mit Metriken und Protokollen verknüpft. Sie bieten ebenso volle Unterstützung für flexible, auf offenen Standards basierende Datenerfassung, einschließlich OpenCensus und OpenTracing – welche in OpenTelemetry zusammengeführt wurden.

Mit dem neuen Release führen wir die besten Funktionen dieser beiden richtungsweisenden Produkte in einer einzigen APM-Lösung zusammen, die wie weiter unten näher erläutert, für die Anforderungen moderner, Cloud-nativer Anwendungen optimiert ist. Das Ergebnis ist die flexibelste, umfassendste und intelligenteste APM-Lösung auf dem Markt.

Nutzt ALLE Daten:

Mit NoSample™ Full-Fidelity Tracing erweitern wir unsere NoSample-Datenerfassung, um alle Tracing-Daten zu analysieren und in unserer Cloud zu speichern. Dieser Ansatz, der dem Prinzip der „Lückenlosen Beobachtung“ folgt, kombiniert Informationen mit hohem Detaillierungsgrad und korreliert sie mit der zugrunde liegenden Infrastruktur, wodurch sichergestellt wird, dass euch kein Fehler und keine Transaktion mit hoher Latenz entgehen.

SignalFX Dashboard

SignalFX Kubernetes Cluster Map

Wertet eure Daten aus – in Sekundenschnelle:

Wir setzen AI-Driven Directed Troubleshooting ein, um euch zu helfen schnell und genau festzustellen, was zu einem Problem beiträgt oder es verursacht. Mit SignalFx Microservices APM könnt ihr schnell analysieren, ob ein nachgeschalteter abhängiger Service oder eine zugrunde liegende Infrastrukturkomponente in Zusammenhang mit einer Benachrichtigung zu einem Service-Endpunkt steht, und den Wirkungsradius eines Problems feststellen.

Request Rate Overview

Free Your Code:
Damit unsere Kunden nicht an einen einzigen Anbieter gebunden sind, stehen wir als Gründungsmitglieder und Förderer von OpenTelemetry zu 100 % hinter einer auf offenen Standards basierenden Datenerfassung. Weitere Informationen über unsere jüngsten Beiträge zur Open Source-Community findet ihr hier. Darüber hinaus bieten wir umfassende Unterstützung für die automatische Instrumentierung in den meisten gängigen Programmiersprachen und -Frameworks, damit ihr mit minimalem Aufwand eurer Entwickler schnell startbereit seid.

In der folgenden Tabelle werden die wichtigsten Funktionen und Vorteile des neuen Release von SignalFx Microservices APM zusammengefasst:

Funktionen

Vorteile

Nutzt ALLE Daten

NoSample Full-fidelity Tracing

- Erfassung, Verarbeitung und Speicherung von 100 % der Tracing-Daten.

- Es werden keine Ausreißer oder Anomalien übersehen.

- Erhaltung der vollen Dimensionalität von Tracing-Daten.

- Extrahierung von Full Fidelity-Metriken.

Untersuchungen mit unbeschränkter Kardinalität

- Untersuchung aller Tracing-Daten und Datenbereiche mit hochgranularen Details sowie Aufschlüsselung nach Ausführungscontainer, Version, Benutzer oder einer anderen Geschäftslogik.

- Schnelle Identifizierung von Kernursachen von Problemen.

- Leichte Nachvollziehbarkeit der Auswirkungen jeder Code-Integration.

Korrelation des gesamten Software-Stacks mit Infrastrukturmetriken

- Nahtlose Korrelation zwischen Infrastruktur/Integrationslösungen & Microservices

- Schnellere Fehlerbehebung bei Service Level-Problemen, die von Infrastrukturproblemen verursacht werden

Kernursachenanalyse mit Kontextberücksichtigung durch Splunk-Logs

- Zugriff mit Kontextberücksichtigung auf Splunk-Logs und -Events für tiefergreifende Fehlerbehebung und Kernursachenanalysen

- Kontextbezogene Workflows über Metriken, Tracing-Daten und Logs hinweg, zur schnellen Fehlerbehebung bei Performance-Problemen

Wertet eure Daten aus - in Sekundenschnelle

AI-Driven Directed Troubleshooting

- Abhängigkeitsanalyse für abhängigkeitsbezogene Incident-Sichtung

- Trace Navigator & Waterfall Visualization

- Tracing-Muster

- Senken der MTTR durch KI-gesteuerte Echtzeitanalysen und einen präskriptiven Ansatz bei der Fehlerbehebung

- Schnelle Ermitteln des Wirkungsradius eines Problems und Korrelieren nachgeschalteter Abhängigkeiten sowie der zugrunde liegende Infrastruktur

Anwendungs-Monitoring und Warnmeldungen in Echtzeit

- Automatisch mit Daten gefüllte Dashboards zu Services, Endpunkten oder Performance

- Dynamische Service-Maps

- Service Level-Benachrichtigungen mit geringer Latenz, die auf mehreren oder komplexen Bedingungen basieren

- Direkte Visualisierung und interaktive visuelle Untersuchung

- Schneller, einfacher Drilldown in Datenbereiche

- Korrelierte Services und Infrastruktur

- Kürzeste MTTD mit exakten, aussagekräftigen Benachrichtigungen in Echtzeit mit Zugriff auf repräsentative Tracing-Daten

- Vermeidung unnötiger Benachrichtigungen und Alarmfluten

Darstellung von Tracing- und Datenbereichsmetriken mit benutzerdefinierter Dimensionalisierung

- „RED“ Metriken für jede eindeutige Transaktion und Aufgliederung

- Schnellere, genauere Benachrichtigungen auf der Grundlage zuverlässiger historischer Basiswerte mit höherem Detaillierungsgrad

Free Your Code

Auf offenen Standards basierende Datenerfassung und automatische Instrumentierung

- Automatische Instrumentierung für Java, Kotlin, Python, Ruby, Node.js, Go, PHP, .Net Core (Beta)

- Benutzerdefinierte Instrumentierung

- Unterstützung für Open Source und offene Standards: OpenTracing, OpenCensus, Zipkin und Jaeger; Hauptförderer von OpenTelemetry

- Unterstützung für Service Mesh (Istio & Envoy)

- Schnelle Time-to-Value bei den meisten gängigen Programmiersprachen und -Frameworks

- Flexible Wahl der Datenerfassungsmethoden

- Keine Anbieterbindung

Einstieg in SignalFx Microservices APM

Das neue Release von SignalFx Microservices APM bietet ein ganz neues Maß an Observability, da ALLE Tracing-Daten durch offene Standards erfasst und durch die Nutzung von KI in Sekundenschnelle ausgewertet werden. Dadurch können DevOps-Teams schneller Innovationen entwickeln, sich in kürzester Zeit auf veränderte Marktbedingungen einstellen und eine exzellente User Experience sicherstellen.

Möchtet ihr mehr über SignalFx Microservices APM erfahren? Besucht unsere Website, registriert euch für unsere zweiwöchentliche Demo oder kontaktiert uns.

*Dieser Artikel wurde aus dem Englischen übersetzt und editiert. Den Originalblogpost findet ihr hier: Application Performance Redefined: Meet the New SignalFx Microservices APM (31. März 2020).

----------------------------------------------------
Thanks!
Splunk

April 09, 2020

Posted by