DEVOPS

Nutzt den Mehrwert von Google Cloud mit Observability-Lösungen von Splunk

Wir freuen uns, eine strategische Partnerschaft mit Google Cloud bekannt geben zu können, durch die unsere gemeinsamen Kunden auch bei Google Cloud Services und modernen Anwendungen von Echtzeit-Observability profitieren können. Bei der Modernisierung von IT-Umgebungen und den Digitalisierungsprogrammen kleiner wie großer Unternehmen führt kein Weg mehr an der Cloud vorbei. Unternehmen modernisieren ihre IT (Umstellung auf die Cloud eingeschlossen), um Innovationen zu beschleunigen und die operative Effizienz zu steigern, während sie gleichzeitig die Geschwindigkeit ihrer IT optimieren. Nach Angaben von Gartner1 ist seit fast einem Jahrzehnt „Cloud First“ der vorherrschende Ansatz bei Initiativen zur Cloud-Nutzung, mit denen Unternehmen ihre digitale Transformation und Modernisierung vorantreiben möchten. Bei einer Studie von McKinsey gaben allerdings 80% der CIOs an, dass die Modernisierung in ihren Unternehmen trotz der Migration in die Cloud nicht das erwartete Maß an Agilität und unternehmerischen Vorteilen gebracht habe.

Durch das reine „Umschichten“ von Anwendungen und Daten aus lokalen, on-prem Services in Cloud-Plattformen bei einer großangelegten Cloud-Migration lässt sich das volle Potenzial der Cloud nicht ausschöpfen. Auch in Bezug auf Plattformen müssen Unternehmen neue Wege gehen. Werden beispielsweise Managed Cloud-Services wie Google Datastore genutzt, anstatt eine eigene NoSQL-Datenbank in der Cloud zu unterhalten, profitiert das Unternehmen davon, da es keine Ressourcen für undifferenzierte Overhead-Aufgaben aufwenden muss. Wenn Unternehmen auf ihrem Weg in die Cloud dann noch versierter handeln und sie die Architektur ihrer Anwendungen auf Microservices umstellen sowie moderne Infrastrukturen wie Container, Kubernetes und serverlose Ansätze nutzen, bringt dies weitere Vorteile.

Moderne Cloud-native Umgebungen bieten zwar Vorteile wie Agilität und Effizienz, bringen jedoch auch mehr Komplexität mit sich. Während Unternehmen ihren Weg zu Cloud-nativen Umgebungen fortsetzen, nimmt das Volumen der operativen Daten, die sie bearbeiten müssen, erheblich zu. Die schnelllebige Infrastruktur und die naturgemäß verteilten Cloud-nativen Anwendungen führen außerdem zu einem exponentiellen Anstieg der Kardinalität von Performance-Metriken.

Zusätzlich verschärft wird das Ganze dadurch, dass die Erwartungen der End-User noch nie so hoch waren wie heute. Anwendungen müssen dem Endbenutzer eine einwandfreie User Experience bieten – und zwar unabhängig von den Herausforderungen, denen das System durch unterschiedliche Lasten, plötzliche Änderungen der Traffic-Muster oder andere Variablen bei der Skalierung über Geräte, Standorte usw. ausgesetzt ist. Laut einer kürzlich von Akamai durchgeführten Studie kann eine Erhöhung der Latenz um 100 Millisekunden einen Rückgang der Conversion-Rates um 7% nach sich ziehen. Häufig bekommen Unternehmen Probleme, wenn sie „kleckern statt klotzen“ und versuchen, herkömmliche Monitoring-Tools und -Strategien in modernen Cloud-Umgebungen weiter zu nutzen. Statt herkömmlicher Lösungen brauchen sie Observability (oder wie es im deutschen Sprachraum auch genannt wird: „Beobachtbarkeit“) in Echtzeit, um Erkenntnisse über die Performance des Gesamtsystems zu gewinnen, bevor sich etwaige Probleme auf den Endbenutzer auswirken.

Echtzeit-Observability mit Splunk

Observability ermöglicht DevOps-Teams, verteilte Cloud-Systeme zu verstehen: welche Prozesse sind langsam, wo liegen Fehler vor und vor allem, warum verhält sich das System auf eine bestimmte Weise und was muss getan werden, um die Performance zu verbessern. Die Datenquellen, die häufig als die drei Säulen der Observability bezeichnet werden, sind Metriken, Tracing-Daten und Logs. Metriken zeigen, ob es ein Problem gibt, Tracing-Daten führen uns an die Stelle, an der das Problem im verteilten System möglicherweise auftritt, und Logs helfen, die Kernursache des Problems festzustellen. Splunks erstklassige Observability basiert auf der Kombination aus SignalFx Infrastructure Monitoring, SignalFx Microservices APM und Splunk Cloud und liefert damit in Echtzeit datengestützte, umsetzbare Erkenntnisse, die als Grundlage für jede Frage, Entscheidung und Handlung genutzt werden können. In den folgenden Abschnitten sehen wir uns an, welchen Mehrwert die Metrik- und Tracing-Lösungen von Splunk unseren Kunden in Google Cloud bieten. Informationen darüber, wie ihr Daten aus Google Cloud-Quellen zu Splunk Cloud übertragt, um End-to-End-Transparenz bei Logs zu erreichen, findet ihr in diesem Blog.

Echtzeiteinblicke mit Streaming-Architektur

SignalFx Infrastructure Monitoring ist die Lösung für Echtzeitmetriken, die speziell für die Anforderungen schnelllebiger Cloud-, Container- und serverloser Umgebungen mit hoher Kardinalität und riesigen Datenmengen konzipiert wurde. Unser Ansatz für die Erfassung, Speicherung und den Abruf von Daten basiert auf unserer patentierten Streaming-Architektur und unterscheidet sich grundlegend von herkömmlichen Batch- und Abfragelösungen.

SignalFX Streaming Monitoring

Während Metrikdatenströmen in SignalFx einfließen, werden Metadaten von den Metrikwertdaten getrennt, da sie anderen Use Cases dienen – denn für Menschen lesbare Metadaten sind in Cloud-nativen Umgebungen ein zentraler Mandant für Such-, Filter-, Sortier- und Gruppierungsvorgänge. Metrikwerte werden dagegen von der SignalFlow™ Engine analysiert und direkt an die Elemente gestreamt, die diese benötigen, wie z. B. Dashboards, Warnmeldungen und Automatisierungsprozesse. Dank unserer Streaming-Architektur erhalten unsere Kunden Einblicke in Echtzeit und können entsprechend handeln: In Sekundenschnelle werden Dashboards aktualisiert, Warnmeldungen ausgegeben und Automatisierungsaufgaben ausgelöst – bei anderen Lösungen dauert dies mehrere Minuten.

Google Cloud Services einfach verbinden, automatisch erkennen und sofort überwachen

Unsere Kunden können ganz flexibel wählen, wie sie Daten instrumentieren und erfassen. Oftmals entscheiden sie sich für eine Kombination aus den folgenden Komponenten:

SignalFx Smart Agent: Schlanker Open Source-Node-Agent auf der Basis von collectd, der automatisch Performance-Metriken für Hosts, Container, Kubernetes, bereitgestellte Anwendungen und Services erkennt. Der Smart Agent kann Metriken von Services, die Prometheus-Metriken aussenden (wie Kubernetes, Google Cloud Run oder benutzerdefinierte Anwendungen), automatisch extrahieren und erfassen.

Google Operations Suite (früher Stackdriver): Stabile Integration mit Google Cloud Monitoring (früher Stackdriver) für die Erfassung von Metriken in Google Cloud Services

Istio in GKE und Anthos: Sofort verfügbare Transparenz mittels eines Open Source-Telemetrieadapters für das Service Mesh Istio

Wrapper-Funktionen: Für Services, bei denen ein Agent-basierter Ansatz nicht funktioniert (z. B. Google Cloud Functions), bietet SignalFx Wrapper-Funktionen zur Visualisierung von Ausführungen, Fehlern, Einschränkungen, Kaltstarts, Dauer und Ressourcenauslastung in Echtzeit.

Cloud Data Collection

Sofort einsetzbare Dashboards 

Um sofortigen Mehrwert zu liefern, bietet SignalFx vordefinierte Dashboards für Google Cloud Services wie Compute Engine, App Engine, GKE, Cloud Bigtable, Cloud Functions, Cloud Spanner, Cloud Storage, Cloud Pub/Sub Subscriptions, Cloud Pub/Sub Topics und mehr. 

SignalFX Dashboard

Ihr könnt ganz leicht benutzerdefinierte Diagramme für kombinierte Metriken zu diesem Dashboard hinzufügen – dazu sind nur ein paar Klicks nötig.

Echtzeit-Monitoring und KI-gesteuerte Analysen für die Google Kubernetes Engine 

Unser seit kurzem verfügbarer Kubernetes Navigator bietet DevOps- und SRE-Teams eine neue Möglichkeit, die Performance containerisierter Anwendungen zu verstehen und zu verwalten, und stellt ihnen hierfür eine intuitive, sofort einsatzbereite out-of-the-box Benutzeroberfläche bereit, die durch die gesamte GKE-Umgebung navigiert. KI-gesteuerte Analysen schlagen automatisch Filter im Zusammenhang mit Performance-Anomalien vor, um die Fehlerbehebung zu beschleunigen.

Kubernetes

Verwalten der Anwendungs-Performance mit SignalFx Microservices APM

SignalFx Microservices APM bietet dezentrales NoSample™ Full-Fidelity Tracing, mit dem jede einzelne Transaktion beobachtet und analysiert und sämtliche Ausreißer und Anomalien erfasst werden können. KI-gesteuerte Analysen und gezieltes Troubleshooting erleichtern es DevOps-Teams, Performance-Anomalien schnell zu identifizieren und zu beheben. Darüber hinaus bietet SignalFx Microservices APM Analysen mit feinsten Details, um Untersuchungen mit unbeschränkter Kardinalität zu ermöglichen. Benutzer können differenzierte Analysen zu allen interessanten Aspekten durchführen.

SignalFX Dashboard

Das im neuesten Gartner Magic Quadrant für APM als visionär eingestufte SignalFx Microservices APM nutzt eine schlanke, anbieterneutrale Instrumentierung auf der Grundlage von OpenTracing und OpenTelemetry. Dies befreit DevOps-Teams von den schwerfälligen, proprietären, Agent-basierten Ansätzen herkömmlicher Lösungen.

Einfacher Einstieg

Die Observability-Lösungen von Splunk sind SaaS-Services, die in Google Cloud bereitgestellt werden, um unseren Kunden, die ihre Observability-Daten in Google Cloud belassen möchten, die entsprechende Flexibilität zu geben. Splunk und Google Cloud sind strategisch aufeinander abgestimmt, um euren Cloud-Erfolg zu beschleunigen. Macht eure Observability-Investition zukunftssicher und nutzt eine professionelle Lösung, auf die Unternehmen für komplexeste Use Cases jeden Umfangs vertrauen.

Holt euch gleich heute eure 14-tägige, kostenlose Testversion. Und wenn ihr die Lösungen mal live in Aktion sehen wollt, nehmt einfach an unserer wöchentlichen Live-Demo teil.

Seht euch an, wie das Planet-Team bei seiner Google Cloud-Migration vorging, und wie SignalFx dazu beiträgt, den konsistenten, zuverlässigen Betrieb der Cloud und Kubernetes für die Container-Orchestrierung sicherzustellen.

.


1 Gartner, „Move From Cloud First to Cloud Smart to Improve Cloud Journey Success“, Henrique Cecci, 25. Februar 2020.

*Dieser Artikel wurde aus dem Englischen übersetzt und editiert. Den Originalblogpost findet ihr hier: Unlock the Value in Google Cloud with Splunk Observability Solutions (05.05.2020).

Amit Sharma ist Product Marketing Director bei Splunk. Er verfügt über mehr als zwölf Jahre Erfahrung in den Bereichen Softwareentwicklung, Produktmanagement und Produktmarketing. Vor seinem Wechsel zu Splunk leitete Amit das Produkt-Marketing bei SignalFx, AppDynamics und Cisco. Er besitzt einen Master of Science-Abschluss von der Arizona State University und einen Master of Business Administration von der UC Berkeley Haas School of Business.