In der sich schnell entwickelnden Landschaft der Fertigungsindustrie von heute ist Observability zum Eckpfeiler eines resilienten und effizienten Anlagenbetriebs geworden. Produktionsanlagen, die meist eine Mischung aus Bestandsanlagen und komplexen vernetzten Systeme sind, stehen vor besonderen Herausforderungen, wenn es darum geht, hohe Verfügbarkeit und Zuverlässigkeit aufrechtzuerhalten. Und es steht viel auf dem Spiel. Denn ungeplante Ausfallzeiten können die Fertigung bis zu $ 255 Millionen pro Jahr kosten – das geht aus dem Splunk-Studienbericht „Die versteckten Kosten von Ausfallzeiten“ hervor. Betroffen sind dann nicht nur die Umsätze, sondern auch das Kundenvertrauen und die Verpflichtungen in der Lieferkette.
Null Ausfallzeit war stets das anvisierte Ziel, doch da der Anlagenbetrieb zunehmend komplexer geworden ist, sind erweiterte Observability und durchgängige Transparenz auf allen Ebenen unverzichtbar geworden. Dazu braucht es mehr als das klassische Monitoring; es braucht eine proaktive Identifizierung von Problemen und schnelle Reaktionen bei Anomalien, bevor diese zu teuren Unterbrechungen eskalieren.
Mit der zunehmenden Verbreitung von modernen digitalen Technologien – namentlich IoT, KI/ML und Cloud Computing – verändern sich in den Fabriken die Arbeitsweise und die Art der Reaktion auf dynamische Herausforderungen. Die Fortschritte bringen allerdings auch neue Schwachstellen und Sicherheitsfragen mit sich. Die Konvergenz von IT- und OT-Systemen führt durch die stärkere Vernetzung dazu, dass die Angriffsfläche zunimmt, sodass Sicherheit zu einem entscheidenden Bestandteil jedes Observability-Projekts wird.
Bereit für eine Observability-Strategie auf neuem Niveau und für mehr digitale Resilienz? Sehen wir uns an, wie die Lösungen von Cisco und Splunk den Anlagenbetrieb grundlegend verändern.
Splunk AppDynamics zeichnet sich als eine leistungsstarke Observability-Plattform aus, die sich besonders für die speziellen Anforderungen von Fertigungsanlagen eignet. Einerseits steigen immer mehr Unternehmen auf moderne Architekturen wie Microservices oder Service-oriented Architecture (SOA) um oder erwägen eine solche Migration, andererseits wird in vielen industriellen Umgebungen nach wie vor mit einem Mix aus eigenentwickelten Lösungen und handelsüblichen COTS-Standardanwendungen gearbeitet, die als monolithische Systeme aufgebaut sind, was Monitoring und Optimierungen erschwert. In solchen komplexen Anwendungslandschaften schafft Splunk AppDynamics umfassende Echtzeit-Transparenz, sodass die Operations-Teams Leistungsengpässe und Sicherheitsprobleme rechtzeitig lokalisieren können, ehe die Produktion darunter leidet. Splunk AppDynamics bringt eigene AIOps-Funktionen mit und kann damit Performance-Probleme in Anwendungen und Infrastruktur automatisch erkennen. Fehlerursachen lassen sich dann schnell identifizieren und beheben. Hier eine Übersicht über die verfügbaren Funktionen:
In Kombination mit Cisco Secure Application minimiert Splunk AppDynamics das Risiko von Sicherheitslücken, ohne die Anwendungsbereitstellung auszubremsen. Herkömmliche Schwachstellenscans werden in der Regel vor der Produktionsbereitstellung und in festen Intervallen durchgeführt, sodass frisch ausgerollte Anwendungen anfällig für aktuelle Bedrohungen und Zero-Day-Exploits sind. Cisco Secure Application ermöglicht kontinuierliche Schwachstellenbewertung und Schutz – durch das Monitoring der Code-Ausführung in Echtzeit, sodass mögliche Exploits sofort erkannt und verhindert werden können. Mit dem Schwachstellen-Monitoring in Echtzeit und der Bewertung nach Geschäftsrisiko können Fertigungsunternehmen Sicherheitsrisiken proaktiv priorisieren und beheben. Das sorgt für einen resilienten und sicheren Betrieb ohne Unterbrechungen.
In diesem Abschnitt wollen wir am Beispiel untersuchen, wie sich AIOps für die Observability in einem MES (Manufacturing Execution System) einsetzen lässt. Sehen wir uns zunächst die eigenentwickelte MES-Plattform für die Versandmaschinen an, die an die Stationen entlang der Fertigungslinien angeschlossen sind. Die Maschinen selbst und ihre SPS-Ebene liegen zwar außerhalb dieses Szenarios, doch mehr Transparenz auf Steuerungsebene kann gleichwohl wertvolle Erkenntnisse liefern. Mit einem Monitoring der Steuerungslogik und der Kommunikation innerhalb des MES kann das Anlagenbetriebsteam bestimmte potenzielle Probleme proaktiv identifizieren, die Versandprozesse optimieren und vorbeugende Maßnahmen ergreifen, um das Risiko von Ausfallzeiten zu minimieren. Zu berücksichtigen ist freilich, dass MES-Transparenz allein nicht alle Probleme zeigt, die auf Maschinen- oder SPS-Ebene auftreten können und unter Umständen – trotz offenbarer MES-Verfügbarkeit – die Prozesse der Linie beeinträchtigen.
Unsere MES-Beispielanwendung ist komplett für Splunk AppDynamics instrumentiert, sodass wir eine umfassende Flow Map als Visualisierung und dazu alle wesentlichen KPIs bekommen. Mit dieser Instrumentierung können die Teams Anwendungsabläufe kontrollieren, Performance-Metriken überwachen und Engpässe oder Anomalien einfach, schnell und in Echtzeit erkennen. Die visuelle Flow Map zeigt anschaulich, wie die einzelnen MES-Komponenten zusammenwirken, was es einfacher macht, Probleme zu lokalisieren und die Versandabläufe auf ganzer Linie zu optimieren.

Jede Maschine wird über eine separate Geschäftstransaktion innerhalb der MES-Anwendung gemanagt, wobei meist mehrere verbundene Komponenten beteiligt sind. Zu diesen Transaktionen können Interaktionen mit Cache-Systemen, Datenbanken und anderen wichtigen Unternehmensanwendungen (QMS, SAP-ERP, CRM etc.) gehören. Durch die durchgängige Nachverfolgung dieser Geschäftstransaktionen bietet Splunk AppDynamics umfassenden Einblick in die Prozesse und die Performance jedes Vorgangs; das macht es einfacher, Abhängigkeiten zu erkennen, potenzielle Engpässe zu identifizieren und eine nahtlose Integration über alle Systeme hinweg sicherzustellen.

Das Monitoring des Gesamtzustands der Geschäftstransaktionen anhand von Statusregeln kann die Teams zwar auf potenzielle Fehler hinweisen, doch kleinere Probleme, die sich letztlich zu großen auswachsen könnten, werden manchmal übersehen. Hier erweist sich die Anomalieerkennung von Splunk AppDynamics als unschätzbarer Vorteil. Durch die kontinuierliche Analyse der Performance-Daten und die Erkennung geringster Abweichungen vom Normalverhalten kann diese Funktion auf Frühwarnsignale hinweisen, die ansonsten vielleicht unbemerkt geblieben wären. Mit diesem proaktiven Ansatz kann das Operations-Team kleine Unregelmäßigkeiten sofort beheben, ehe sie sich zu größeren, disruptiven Problemen aufschaukeln. Das stärkt wiederum die Resilienz des Anlagenbetriebs.
Sehen wir uns ein Beispiel für die Anomalieerkennung in der Praxis an. Um 10:19 Uhr erhält das für den Anlagenbetrieb zuständige Team eine E-Mail-Benachrichtigung, die es auf eine in der MES-Anwendung erkannte Anomalie aufmerksam macht. Nach der Anmeldung beim Splunk AppDynamics Controller kann das Team sofort bestätigen, dass ein Anomalie-Event verzeichnet ist.

Das Anlagenbetriebsteam untersucht den Incident, und Splunk AppDynamics zeigt schnell eine mutmaßliche Ursache der Anomalie auf: längere Reaktionszeiten bei einer bestimmten Maschine. Dadurch, dass Splunk AppDynamics die Ursache eingrenzt, kann das Team seine Untersuchungen sinnvoll auf einen bestimmten Bereich konzentrieren, was den gesamten Prozess der Identifizierung und Behebung des zugrunde liegenden Problems beschleunigt. Zu einer gründlichen Fehler-Ursachen-Analyse gehört unter Umständen allerdings auch, dass die Fachleute sich Daten aus der Maschinen- und der Netzwerkebene vornehmen, weil sie wissen, dass Probleme ihren Ursprung auch an anderer Stelle in der Infrastruktur haben können. Dieser zielgerichtete, mehrschichtige Ansatz zeigt also noch nicht das gesamte Bild, macht es den Teams aber deutlich leichter, potenzielle Unterbrechungen des Anlagenbetriebs zu minimieren, und die Fachleute können ihren Aufgaben zuversichtlicher und präziser nachkommen, was letztlich zu weniger Fehlern und einer Umgebung führt, die sicherer und produktiver ist.

Unser Beispiel verdeutlicht, wie effektiv die AIOps-Funktionen von Splunk AppDynamics sind. Die schnelle Erkennung und Diagnose von Anomalien hilft, Ausfallzeiten in Fertigungsumgebungen zu minimieren, während frühzeitige Identifizierung und Behebung von Problemen die ununterbrochene Produktionsfortführung gewährleisten und generell zur Resilienz der Anlage beitragen. Noch tieferen Einblick und einen vollständigen Überblick auch über die Maschinen- und die Netzwerkebene schafft dann die Integration mit der Splunk-Plattform und Cisco ThousandEyes – damit sind die Teams noch besser in der Lage, Incidents schnell zu klären und optimale Anlagen-Performance sicherzustellen.
In diesem Beispiel sehen wir uns an, wie das Echtzeit-Monitoring auf Schwachstellen die frühzeitige Erkennung von Security-Incidents erleichtert und zur Minimierung der operativen Risiken beiträgt. Durch die kontinuierliche Prüfung von Anwendungen auf potenzielle Bedrohungen können die Teams in der Fertigung proaktiv auf Schwachstellen reagieren, was die Wahrscheinlichkeit von Unterbrechungen minimiert und die Werkssicherheitslage allgemein verbessert.
Nehmen wir das folgende Szenario: Vor Kurzem wurde eine neue Version der MES-Client-Anwendung ausgerollt; davor hat man einen gründlichen Scan auf Schwachstellen durchgeführt, die App ist also auf bekannte Probleme geprüft und zum Start anerkannt sauber. Nun ist es aber so, dass die Angreifer ihre Taktiken ständig weiterentwickeln und nach neuen Schwachstellen und potenziellen Einfallstoren suchen. Selbst bei gründlichen Tests vor der Produktion besteht daher das Risiko, dass direkt nach dem Roll-out neu entdeckte Schwachstellen oder Zero-Day-Exploits ausgenutzt werden.
Tatsächlich erhält das Anlagenbetriebsteam eine Warnmeldung, weil der Business-Risk-Security-Wert der MES-Buttercup-Anwendung plötzlich angestiegen ist. Diese Echtzeitbenachrichtigung signalisiert eine potenzielle Schwachstelle oder einen Sicherheitsvorfall, weshalb das Team weitere Untersuchungen durchführt und umgehend Maßnahmen ergreift, um die damit verbundenen operativen Risiken für den Produktionsbetrieb zu minimieren.

Cisco Secure Application bietet etliche detaillierte Ansichten, die alle erkannten Schwachstellen übersichtlich auflisten, mit Zusatzinformationen aus der Integration von Cisco Vulnerability Management sowie Bedrohungsinformationen von Cisco Talos. Die Teams können die einzelnen Schwachstellen von hier aus gründlich untersuchen, potenzielle Auswirkungen auf den laufenden Betrieb bewerten und empfohlene Abhilfemaßnahmen prüfen. In vielen Fällen wird die Reaktion ein Upgrade auf eine neuere, sicherere Version der betroffenen Komponente erfordern. Dank dieser detaillierten Einblicke, die sich aus den soliden Funktionen von Cisco Vulnerability Management und den Bedrohungsinformationen von Cisco Talos speisen, können die Teams Schwachstellen effizient priorisieren und beheben, Sicherheitsrisiken reduzieren und so zur fortgesetzten Resilienz der Anlagen beitragen.
Anhand dieser umfassenden Informationen kann das Anlagenbetriebsteam die Prioritäten und Maßnahmen zur Behebung von Schwachstellen mit der Entwicklungsabteilung abstimmen. Man beachte, dass Cisco Secure Application im Beispiel wenige Tage nach der Produktionsbereitstellung eine neue Schwachstelle entdeckt hat. Die Scans im Vorfeld der Produktionsbereitstellung hätten das Problem nicht erkannt, weil die Schwachstelle erst danach bekannt wurde. Indem die beiden Teams Informationen zu Schwachstellen und empfohlenen Abhilfemaßnahmen austauschen – etwa zum Upgrade auf eine sicherere Version –, können sie schnell neu auftretende Risiken in Angriff nehmen und dafür sorgen, dass ihre MES-Anwendung durchgängig sicher bleibt.

Noch effektiver wird Cisco Secure Application, wenn die Lösung in Splunk Enterprise Security (Splunk ES) integriert ist. Bei dieser schlagkräftigen Kombination können Sicherheitsteams Erkennung, Analysen und Reaktionen auf Security Events in Laufzeitanwendungen (Schwachstellen, Exploits, verdächtige Aktivitäten etc.) direkt auf der Splunk-ES-Plattform zusammenführen und zentral steuern. Und durch die Integration der erweiterten Bedrohungsinformationen von Cisco, zusätzlich zu den umfassenden Analyse- und Korrelationsfunktionen von Splunk, erhalten Fertigungsunternehmen eine einheitliche Echtzeit-Übersicht über ihre gesamte Sicherheitslandschaft. Diese Integration verbessert die Incident-Reaktion, optimiert die Priorisierung von Bedrohungen und erleichtert den Teams die effiziente Risikominimierung in erfolgskritischen Anwendungsumgebungen.
Splunk AppDynamics kann als Schlüsselkomponente im Rahmen einer umfassenden Observability-Architektur für Produktionsumgebungen fungieren. In Kombination mit der Splunk-Plattform erhalten Fertigungsunternehmen damit leistungsstarke Funktionen zur Erfassung, zur Analyse und zur Visualisierung von Daten aus IT und OT. Durch die Integration mit anderen Cisco-Lösungen wie Cisco Cyber Vision für umfassende OT-Transparenz sowie weiteren Apps können Fertiger ein einheitliches Monitoring und einheitliche Sicherheit für ihre gesamten Betriebsabläufe schaffen. Mit diesem ganzheitlichen Ansatz sind die Teams in der Lage, Probleme schneller zu erkennen und zu beheben, die Gesamtsicherheitslage zu optimieren und für kontinuierliche Verbesserungen zu sorgen. Die Zusammenführung von Erkenntnissen aus Anwendungen, Infrastruktur und Industriesystemen kann Fertigungsunternehmen in der vernetzten Produktionslandschaft von heute ganz neue Level von Resilienz, Effizienz und Innovation erschließen.

Für Fertigungsunternehmen beginnt Resilienz heute mit umfassender Observability, starken Sicherheitsmaßnahmen und datengestützten Analysen. Lösungen wie Splunk AppDynamics in Kombination mit der Splunk-Plattform und dem weiteren Cisco-Ökosystem ermöglichen Fertigern einheitliche Echtzeit-Transparenz in ihren IT- und OT-Umgebungen. Mithilfe von KI, maschinellem Lernen und proaktivem Sicherheitsmonitoring können produzierende Unternehmen Ausfallzeiten reduzieren, Risiken minimieren und für operative Exzellenz sorgen.
Jetzt ist der Zeitpunkt, an dem Fertiger ihre Observability-Strategie auf den Prüfstand stellen sollten und sich für die integrierten Lösungen der nächsten Generation entscheiden sollten. Damit verbessern sie die Ausfallsicherheit ihrer Anlagen, schützen ihre kritischen Systeme und erschließen neue Innovationschancen in einer Industrielandschaft, die sich in schnellem Wandel befindet.
Bereit, den Anlagenbetrieb auf das nächste Level zu heben? Wie Unternehmen mit Lösungen von Cisco und Splunk eine resiliente, sichere und zukunftsfähige Produktion schaffen, steht im Abschnitt zu Industrie und Fertigung auf der Splunk-Website.
Die führenden Unternehmen der Welt vertrauen auf Splunk, einem Unternehmen von Cisco, um ihre digitale Resilienz mit der einheitlichen Sicherheits- und Observability-Plattform, unterstützt durch branchenführende KI, kontinuierlich zu stärken.
Unsere Kunden setzen auf die preisgekrönten Sicherheits- und Observability-Lösungen von Splunk, um die Zuverlässigkeit ihrer komplexen digitalen Umgebungen zu sichern und zu optimieren – in jeder Größenordnung.