LEARN

SLA, SLI et SLO : tout savoir sur les niveaux de service

Dans notre monde axé sur les services, les entreprises doivent offrir la meilleure expérience utilisateur possible. Un service de qualité permet à la fois de fidéliser vos clients à long terme et d’élargir votre clientèle. Pour garder le contrôle sur les performances du service, vous allez vous appuyer sur plusieurs indicateurs et signaux clés.

Les accords de niveau de service (SLA), les objectifs de niveau de service (SLO) et les indicateurs de niveau de service (SLI) sont des mesures qui s’appliquent aux produits et services promis par les entreprises. Elles décrivent les critères retenus pour évaluer les progrès réalisés dans la poursuite des objectifs de performance et de qualité.

Dans cet article, nous explorerons les différences entre SLA, SLO et SLI, ainsi que les défis et les bonnes pratiques liées à leur mise en œuvre dans votre organisation.


Que sont les SLA ?

Un accord de niveau de service (SLA) est un accord entre un fournisseur de services et ses clients. Il repose sur des engagements de service spécifiques, tels que le délai de résolution des dossiers clients, la disponibilité du service et la réactivité du site web. Chaque SLA est une « promesse » spécifique faite au client : tous les SLA ne sont pas identiques.

Les SLA peuvent varier considérablement selon le secteur et le fournisseur de services. Les équipes commerciales ou juridiques du service préparent généralement des SLA pour les services payants de l’entreprise, et ils y font figurer les éléments clés suivants :

  • Portée et résultat : description du service fourni par l’entreprise et de ce à quoi les clients peuvent s’attendre.
  • Mesures : métriques de performances employées telles que le temps de résolution, le taux d’erreur, le temps de réponse et le pourcentage de disponibilité. Ces métriques mesurent les performances du service.
  • Pénalités ou recours : conséquences en cas de non-respect du SLA. Il peut s’agir de compensations, comme des crédits de service, des prolongations ou des pénalités financières.
  • Stratégie de résiliation et de sortie : définit comment et dans quelles conditions chaque partie peut résilier l’accord et, pour le client, migrer vers un nouveau fournisseur de services.
  • Exclusions : scénarios dans lesquels les engagements définis ne s’appliquent pas.
  • Définitions : incluent toutes les définitions spécifiques et techniques décrites dans le SLA.

Les SLA sont rédigés par l’équipe commerciale ou juridique d’une entreprise. Elles doivent impérativement collaborer avec les équipes techniques pour éviter toute lacune technique dans leur définition.


Que sont les SLO ?

Un objectif de niveau de service (SLO) décrit ce que le service s’engage à fournir à ses utilisateurs concernant des mesures spécifiques. Ces mesures incluent généralement les métriques suivantes :

Si on les compare aux SLA, les SLO définissent une valeur spécifique pour chacune de ces promesses. Un SLA est un accord formel établi par un fournisseur de services pour la performance ou la qualité d’un service. Les SLO, quant à eux, sont des objectifs clairs que le fournisseur définit en interne pour évaluer si les SLA sont respectés.

À titre d’exemple, voici un extrait des SLO fournis par AWS pour une instance EC2 individuelle.

  • Pourcentage de disponibilité : inférieur à 99,5 % mais égal ou supérieur à 99,0 %
  • Pourcentage de crédit de service : 10 %
  • De plus, aucuns frais ne seront facturés si l’EC2 est indisponible pendant plus de 6 heures sans que les clients n’aient à demander des crédits.


Que sont les SLI ?

Les indicateurs de niveau de service (SLI) sont les indicateurs clés qui mesurent les performances du service. Ils permettent d’évaluer si l’entreprise a atteint les SLO définis.

Par rapport aux SLA, les SLI correspondent à des valeurs réelles ou historiques. Si ces valeurs sont inférieures aux SLO définis, le service présente un problème. Vous pouvez donc optimiser le service pour respecter le SLO ou ajuster le SLO pour plus de valeur.

Par exemple, dans l’exemple précédent concernant AWS EC2, le SLO est inférieur à 99,5 % mais égal ou supérieur à 99,0 % ; le SLI décrira la disponibilité réelle du service – 99,26 %, par exemple.


SLA, SLI et SLO : les différences essentielles

Le tableau suivant résume les principales différences entre SLA, SLO et SLI.

 

SLA

SLO

SLI

Objectif

Accords conclus avec les clients lors des engagements de service

Objectifs internes que le service vise à fournir aux clients. Servent de référence pour mesurer les performances

Valeurs réelles des performances du service selon les critères des SLO

Quand l’utiliser

Convient aux services payants

Services gratuits et payants

Obligatoire si des SLO sont définis pour mesurer les performances

Centre d’intérêt

Portée, mesures, conséquences juridiques et financières

Objectif spécifique visant à respecter les SLA

Données réelles visant à évaluer les performances

Exemples

Pourcentage de disponibilité, temps de résolution

Temps de réponse inférieur ou égal à 300 ms, taux d’erreur inférieur à 2 %

Temps moyen de réponse = 250,1 ms

Pourcentage de disponibilité = 98,9 %

Flexibilité

Moins flexible, car toute modification doit faire l’objet d’un accord entre les prestataires de services, les équipes juridiques et les clients

Plus flexibles que les SLA. Peuvent être mis à jour en fonction des exigences des technologies et des services.

Plus flexibles que les SLO. Peuvent être adaptés en fonction d’une évolution dans les exigences de performance.

Bien que chacune de ces « métriques » puisse s’appliquer à différents types d’entreprises et de services, vous les retrouverez principalement dans le contexte de l’ingénierie de fiabilité de site (SRE). Dans la mesure où la performance SRE repose sur la disponibilité, les SLI, SLO et SLA sont des outils essentiels pour les SRE qui cherchent à quantifier la fiabilité des performances d’un système au fil du temps.

Dans tous les cas, la collecte et l’exploitation de ces métriques ne sont pas sans difficulté pour les organisations.


SLA, SLI et SLO : les défis

Examinons les défis que vous pourriez rencontrer avec chacune de ces mesures :

Défis des SLA

Un manque de collaboration entre les équipes juridiques et techniques peut conduire à des SLA irréalistes
Les SLA sont créés et définis par les équipes juridiques ou commerciales d’une entreprise, qui ne disposent généralement pas d’une riche expérience technique. Cela peut conduire à des SLA irréalistes et difficiles à atteindre.

Supposons qu’une équipe juridique définisse une disponibilité de 99,999 %. Cette valeur reflète uniquement la perception qu’a l’équipe juridique de la haute disponibilité, en négligeant les défis qui peuvent empêcher d’y parvenir comme les problèmes de logiciels, de matériel ou de réseau, la dépendance vis-à-vis de services tiers, etc.

Les SLA doivent être actualisés en fonction de l’évolution des besoins des clients et des technologies
L’évolution rapide des technologies peut être difficile à suivre avec les ressources disponibles et les contraintes budgétaires du fournisseur de services. Il en va de même pour les besoins des clients, qui évoluent et imposent constamment des ajustements et des renégociations.

Coûts
Les entreprises doivent investir dans des ressources humaines et de nouvelles technologies pour respecter les SLA comme prévu. Cela peut entraîner des coûts supplémentaires.

Défis des SLO

Trouver le juste milieu entre complexité et simplicité
Certains SLO peuvent être trop complexes à mesurer. S’ils ne sont pas correctement définis au départ, les équipes vont perdre du temps à comprendre comment les atteindre. À l’inverse, des SLO faciles à respecter ne permettront pas de répondre aux attentes des clients. Tout l’art consiste donc à définir des SLO équilibrés.

Sélectionner le bon ensemble de métriques
Si vous ne choisissiez pas des indicateurs en phase avec l’objectif commercial et les attentes des clients, les SLO ne refléteront pas la promesse de l’entreprise.

Difficultés liées aux dépendances externes
Les services dépendent souvent de composants ou de services tiers. Une défaillance de ces dépendances externes peut affecter la conformité de SLO du service, même si les composants internes fonctionnent parfaitement.

Défis des SLI

Excès de métriques
Une quantité excessive de métriques va compliquer la tâche des équipes sans avoir de réel effet sur l’utilisateur.

Certaines métriques peuvent être difficiles à mesurer
Certains indicateurs de performances peuvent être difficiles à mesurer avec précision. L’engagement des utilisateurs, la latence des applications en temps réel et la satisfaction globale des utilisateurs, notamment, ne se mesurent pas facilement.

Il peut être difficile d’obtenir des valeurs précises
Il est important de mesurer correctement chaque métrique SLO. Pour y parvenir, il faudra mettre en place des stratégies de test et de supervision précises et fiables.


SLA, SLI et SLO : les bonnes pratiques

Malgré ces défis, les SLA, SLI et SLO sont incroyablement utiles pour fournir un service ou un produit de qualité. Ces quelques bonnes pratiques vous aideront à tirer le meilleur parti de ces métriques :

Bonnes pratiques des SLA

  • Encouragez la collaboration entre les équipes juridiques et techniques. Au cours du processus de rédaction du SLA, les équipes juridiques doivent consulter les équipes techniques et prendre en compte leurs commentaires sur les objectifs de disponibilité réalisables, les défis potentiels et les stratégies d’atténuation réalistes.
  • Tenez compte des capacités du service. Assurez-vous que votre service dispose des ressources nécessaires pour atteindre les SLA.
  • Prenez en compte les facteurs externes. Par exemple, rappelez-vous que le temps de réponse et les lenteurs côté client ne sont pas sous le contrôle du service lorsque vous déterminez le délai de résolution des incidents dans le SLA.

Bonnes pratiques des SLO

  • Améliorez les SLO en continu. Surveillez, analysez et ajustez les SLO en fonction des commentaires des clients. L’analyse des données en temps réel contribuera à améliorer les performances de votre système.
  • Privilégiez l’utilité des SLO à la quantité. Il n’est pas nécessaire d’établir un SLO pour chaque attente du client. Soyez stratégique : choisissez uniquement les SLO prioritaires qui affectent directement le client.
  • Définissez clairement les SLO. Les SLO doivent être clairement définis et mesurables. Ils doivent également se conformer aux objectifs commerciaux.

Bonnes pratiques des SLI

  • Suivez les SLI en temps réel. Les valeurs fournies en temps réel par les systèmes de supervision et d’alerte pour les SLA offrent un excellent moyen d’identifier et de résoudre rapidement les problèmes.
  • Créez des visualisations et des rapports. Présentez les données de SLI sous forme de visualisations claires et de rapports réguliers. Vous aiderez ainsi les parties prenantes à comprendre les tendances de performance et à prendre des décisions éclairées.
  • Maintenez l’exactitude et la cohérence des valeurs. Des données inexactes ou incohérentes peuvent altérer la justesse des décisions. Misez sur des systèmes de supervision robustes pour collecter des données précises et cohérentes.

En résumé

Pour résumer, les SLA sont les accords globaux qui décrivent les promesses faites par les fournisseurs à leurs clients, tandis que les SLO sont les objectifs définis en interne pour tenir ces promesses, et les SLI, les valeurs qui permettent de mesurer les performances réelles du service.

Comme pour la plupart des concepts techniques ou métiers, les bonnes pratiques vous permettront de relever les défis couramment associés aux SLA, SLO et SLI. En utilisant efficacement ces outils, vous aiderez votre entreprise à offrir le service le plus fiable et le plus utile possible.

Qu’est-ce que Splunk ?

Cette publication ne représente pas nécessairement la position, les stratégies ou l’opinion de Splunk.

*This article has been translated and edited. The original post was written by Shanika Wickramasinghe and can be found here

Splunk
Posted by

Splunk