LEARN

SLA, SLI und SLO im Vergleich: Service Level verstehen

In unserer serviceorientierten Welt müssen Unternehmen die bestmögliche Benutzererfahrung bieten. Ein hervorragender Service hilft euch, eure Kunden langfristig zu halten und gleichzeitig euren Kundenstamm zu vergrößern. Es gibt einige wichtige Metriken und Signale, mit denen ihr die Serviceleistung m Auge behalten könnt.

Service Level Agreements (SLAs), Service Level Objectives (SLOs) und Service Level Indicators (SLIs) sind Metriken, die Auskunft über die von Unternehmen angebotenen Produkte und Services sowie die Art und Weise geben, in der diese Unternehmen durch Monitoring die Einhaltung ihrer Leistungs- und Qualitätsziele kontrollieren.

In diesem Artikel befassen wir uns mit den Unterschieden zwischen SLAs, SLOs und SLIs und betrachten zudem die Herausforderungen und bewährten Verfahren im Zusammenhang mit ihrer Implementierung in Unternehmen.

Was sind SLAs?

Ein Service Level Agreement (SLA) ist eine Vereinbarung zwischen einem Serviceanbieter und seinen Kunden. Das SLA basiert auf spezifischen Serviceverpflichtungen, wie z. B. der Behebungsdauer für Kundentickets, der Serviceverfügbarkeit und der Reaktionsgeschwindigkeit einer Website. Jedes SLA ist ein spezifisches „Versprechen“ an den Kunden, d. h., nicht alle SLAs sind gleich.

SLAs können je nach Branche und Serviceanbieter stark variieren. Die Business- oder Rechtsteams des Serviceanbieters erstellen in der Regel SLAs für bezahlte und verfügbare Services des Unternehmens. Diese SLAs umfassen die folgenden Hauptbestandteile:

  • Umfang und Ergebnis beschreiben den vom Unternehmen erbrachten Service und was die Kunden erwarten können.
  • Metriken umfassen Leistungskennzahlen wie die Problembehebungsdauer, Fehlerraten, Reaktionszeit und Uptime in Prozent. Diese Metriken messen die Leistung des Service.
  • Sanktionen oder Abhilfemaßnahmen beschreiben, welche Folgen die Nichteinhaltung der SLAs für den Service hat. Sie können zum Beispiel Kundenanreize wie prozentuale Gutschriften, Zusatzleistungen oder Geldstrafen beinhalten. 
  • Die Kündigungs- und Ausstiegsstrategie legt fest, wie und unter welchen Bedingungen eine der beiden Parteien die Vereinbarung kündigen und zu einem neuen Serviceanbieter wechseln kann.
  • Ausschlüsse beschreiben, in welchen Fällen die definierten Verpflichtungen nicht gelten.
  • Definitionen beinhalten alle spezifischen und technischen Definitionen, die im SLA beschrieben sind. 

SLAs werden vom Business- oder Rechtsteam eines Unternehmens verfasst. Hierbei ist die Zusammenarbeit mit den technischen Teams wichtig, um technische Lücken bei der SLA-Definition zu vermeiden. 


Was sind SLOs?

Ein Service Level Objective (SLO) ist das, was der Service den Benutzern hinsichtlich bestimmter Messwerte zusagt. Zu diesen Messwerten gehören Metriken wie z. B.:

Im Gegensatz zu SLAs definieren SLOs einen spezifischen Wert für jedes dieser einzelnen Versprechen. Ein SLA ist eine formelle Vereinbarung, die von einem Serviceanbieter hinsichtlich der Leistung oder Qualität eines Service festgelegt wird. SLOs dagegen sind konkrete Ziele, die ihr als Anbieter intern festlegt, um zu bewerten, ob die SLAs eingehalten werden. 

Das folgende Beispiel zeigt einen Auszug aus einem SLO von AWS für seine einzelne EC2-Instanz.

  • Uptime in Prozent: Unter 99,5 %, aber größer oder gleich 99,0 % 
  • Servicegutschrift in Prozent: 10 %
  • Außerdem werden keine Kosten berechnet, wenn EC2 länger als sechs Stunden nicht verfügbar ist, ohne dass der Kunde eine Gutschrift anfordern muss.


Was sind SLIs?

Service Level Indicators (SLIs) sind die Schlüsselindikatoren zur Messung der Service-Leistung. SLIs helfen zu beurteilen, ob das Unternehmen die definierten SLOs erreicht hat. 

Im Vergleich zu definierten SLAs handelt es sich bei SLIs um die tatsächlichen oder historischen Werte. Liegen die Werte unter den definierten SLOs, gibt es ein Problem mit dem Service. Ihr könnt den Service dann also entweder optimieren, um das SLO zu erreichen, oder den SLO-Wert so anpassen, dass er mehr Spielraum lässt.  

Im vorherigen Beispiel zur EC2-Instanz von AWS ist das SLO kleiner als 99,5 %, aber größer oder gleich 99,0 %; der SLI wäre der tatsächliche Messwert der Serviceverfügbarkeit, könnte also beispielsweise bei 99,26 % liegen.


SLA, SLI und SLO im Vergleich: die wichtigsten Unterschiede

In der folgenden Tabelle haben wir die wichtigsten Unterschiede zwischen SLAs, SLOs und SLIs zusammengefasst.

 

SLA

SLO

SLI

Zweck

Mit den Kunden vereinbarte Serviceverpflichtungen 

Intern gesetzte Ziele, die der Service den Kunden bieten will. Dienen als Benchmark zur Leistungsbewertung.

Tatsächliche Werte von SLOs als Maß für die Service-Leistung

Verwendung

Geeignet für kostenpflichtige Services 

Sowohl für kostenlose als auch kostenpflichtige Services

Erforderlich zur Leistungsmessung, wenn SLOs definiert wurden

Fokus

Umfang, Metriken, rechtliche und finanzielle Folgen

Spezifisches Ziel zum Erfüllen der SLAs

Konkrete Daten zum Beurteilen der Leistung

Beispiele

Uptime in Prozent, Verfügbarkeit, Problembehebungsdauer

Reaktionszeit kleiner gleich 300 ms, Fehlerrate unter 2 %

Durchschnittliche Reaktionszeit = 250,1 ms

Uptime in Prozent = 98,9 %

Flexibilität

Geringe Flexibilität, da Änderungen zwischen Serviceanbietern, Rechtsteams und Kunden vereinbart werden müssen

Flexibler als SLAs. Änderungen aufgrund technologischer und Service-bezogener Anforderungen möglich. 

Flexibler als SLOs. Änderungen aufgrund geänderter Leistungsanforderungen möglich.

Jede dieser „Metriken“ kann zwar auf verschiedene Arten von Unternehmen und Services angewandt werden, man trifft sie allerdings häufiger im Zusammenhang mit dem Site Reliability Engineering (SRE) an. Da Verfügbarkeit die Voraussetzung für den SRE-Erfolg ist, sind SLIs, SLOs und SLAs wichtige Tools für SREs, die die Zuverlässigkeit eines Systems über die Zeit quantifizieren möchten. 

 

Ganz unabhängig vom Kontext gibt es jedoch einige Herausforderungen bei der effektiven Messung und Anwendung dieser Metriken in einer Organisation.


SLA, SLI und SLO im Vergleich – Herausforderungen

Sehen wir uns nun einige der Herausforderungen an, mit denen ihr im Zusammenhang mit diesen Metriken möglicherweise konfrontiert werdet:

Herausforderungen bei SLAs

Mangelnde Zusammenarbeit zwischen Rechts- und Tech-Teams kann zu unrealistischen SLAs führen
SLAs werden von den Rechts- oder Business-Teams eines Unternehmens erstellt und definiert, denen in der Regel der technische Hintergrund für den Service fehlt. Dies kann zur Festlegung unrealistischer SLOs führen, die schwer zu erreichen sind.

Angenommen, ein Rechtsteam definiert die Verfügbarkeit als 99,999 % der Zeit. Dieser Wert entspricht möglicherweise nur der Vorstellung des Rechtsteams von Hochverfügbarkeit und lässt die potenziellen Herausforderungen außer Acht, mit denen ihr beim Erreichen dieses Ziels konfrontiert sein könntet, wie etwa Software-, Hardware- und Netzwerkausfälle sowie Abhängigkeiten von Drittanbieter-Services. 

Anpassung der SLAs an geänderte Kundenanforderungen und technologische Entwicklungen
Aufgrund der rasanten Entwicklung von Technologien kann es schwierig sein, mit den verfügbaren Ressourcen des Serviceanbieters und den Budgetzwängen mit solch drastischen Veränderungen Schritt zu halten. Das Gleiche gilt für sich ändernde Kundenanforderungen, die ständige Anpassungen und Neuverhandlungen notwendig machen.

Kosten
Unternehmen müssen in Personal und neue Technologien investieren, um die SLAs wie geplant zu erfüllen. Dadurch könnten Zusatzkosten entstehen. 

Herausforderungen bei SLOs

Das richtige Gleichgewicht zwischen Komplexität und Einfachheit finden
SLOs können manchmal zu kompliziert sein, um sie zu messen. Wenn sie nicht von Anfang an klar definiert sind, kostet es Teams viel Zeit herauszufinden, wie die Ziele erreicht werden können. Leicht zu erreichende SLOs tragen dagegen nicht dazu bei, die gewünschten Kundenerwartungen zufrieden zu stellen. Es kann daher schwierig sein, ausgewogene SLOs zu definieren.

Auswahl der richtigen Metriken
Nehmen wir an, ihr wählt Metriken aus, die nicht zum Geschäftsziel und den Kundenerwartungen des Unternehmens passen. In diesem Fall spiegeln diese SLOs nicht das wider, was das Unternehmen seinen Kunden verspricht. 

Berücksichtigen externer Abhängigkeiten kann schwierig sein
Services hängen häufig von Komponenten oder Services von Drittanbietern ab. Gibt es Ausfälle bei diesen externen Abhängigkeiten, kann die SLO-Erfüllung des Service beeinträchtigt werden, selbst wenn die internen Komponenten perfekt funktionieren.

Herausforderungen bei SLIs

Zu viele Metriken
Zu viele Metriken können alles verkomplizieren, machen aber für den Benutzer kaum einen Unterschied.

Manche Metriken sind schwierig zu messen
Manche Leistungsmetriken lassen sich nur schwer genau messen. So kann es beispielsweise schwierig sein, das Benutzerengagement, die Latenz bei Echtzeitanwendungen und die allgemeine Benutzerzufriedenheit zu messen.

Es kann schwierig sein, die Werte genau zu messen
Es ist wichtig, die Leistung der einzelnen SLO-Metriken korrekt zu messen. Ihr benötigt genaue und zuverlässige Test- und Monitoring-Strategien. 

SLA, SLI und SLO im Vergleich – bewährte Methoden

Auch wenn sie Herausforderungen mit sich bringen können, sind SLAs, SLIs und SLOs bei der Bereitstellung von Services oder Produkten unglaublich wertvoll. Mit den folgenden bewährten Methoden setzt ihr diese Kennzahlen optimal ein:

SLA – bewährte Methoden

  • Gute Zusammenarbeit zwischen den Rechts- und Tech-Teams fördern: Beim Erstellen der SLAs müssen sich Rechtsteams mit Tech-Teams beraten und deren Input zu erreichbaren Uptime-Zielen, potenziellen Herausforderungen und realistischen Risikobegrenzungsstrategien berücksichtigen.
  • Fähigkeiten des Service berücksichtigen: Stellt sicher, dass euer Service über die nötigen Ressourcen verfügt, um die SLAs einzuhalten. 
  • Externe Faktoren berücksichtigen: Berücksichtigt Faktoren wie die Reaktionszeit und mangelnde Geschwindigkeit des Client, über die der Service keine Kontrolle hat, wenn ihr SLAs für die Incident-Behebungszeit definiert. 

SLO – bewährte Methoden

  • SLOs kontinuierlich verbessern: Überwacht, analysiert und passt die SLOs entsprechend dem Kundenfeedback an. Die Analyse von Echtzeitdaten hilft euch, die Systemleistung zu verbessern.
  • Wenige, dafür aber wertvolle SLOs wählen: Es ist nicht jedes SLO notwendig, um die Kundenerwartungen zu erfüllen. Geht lieber strategisch vor! Wählt nur die SLOs mit der höchsten Priorität, die sich direkt auf den Kunden auswirken. 
  • SLOs klar definieren: SLOs müssen klar definiert und messbar sein. Außerdem sollten sie sich an den Unternehmenszielen orientieren. 

SLI – bewährte Methoden

  • SLIs in Echtzeit nachverfolgen: Mit Echtzeitwerten, die von Monitoring- und Benachrichtigungssystemen für SLAs bereitgestellt werden, lassen sich Probleme schneller erkennen und beheben. 
  • Visualisierung und Berichte: Präsentiert SLI-Daten durch klare Visualisierungen und regelmäßige Berichte. Dies hilft den Beteiligten, Leistungstrends zu verstehen und informiert Entscheidungen zu treffen.
  • Werte müssen genau und konsistent sein: Ungenaue oder inkonsistente Daten können zu falschen Entscheidungen führen. Robuste Monitoring-Systeme tragen zur konsistenten Erfassung genauer Daten bei. 

Zusammenfassung 

Kurz zusammenfasst, sind SLAs die allgemeinen Vereinbarungen zwischen Anbietern, SLOs sind die konkreten Versprechen, die die Services den Kunden geben, und SLIs sind die tatsächlichen Werte, die zur Leistungsmessung herangezogen werden. 

Wie bei den meisten Unternehmens- oder IT-Konzepten lassen sich typische Herausforderungen bei SLAs, SLOs und SLIs durch Befolgen bewährter Methoden meistern. Wenn ihr diese Metrik effizient nutzt, könnt ihr sicherstellen, dass euer Unternehmen einen möglichst zuverlässigen und nützlichen Service bietet.

Was ist Splunk?

Dieser Beitrag spiegelt nicht zwingend die Position, Strategie oder Meinung von Splunk wider.

Dieser Artikel wurde aus dem Englischen übersetzt und editiert. Geschrieben wurde dieser Blog von Shanika Wickramasinghe, Softwareentwicklering spezialisiert auf Web und Mobile. Weitere Artikel von ihr, könnt ihr auch auf Medium finden.

Splunk
Posted by

Splunk