DEVOPS

Splunk était à la première édition française de la KubeCon

Pour la première fois, la KubeCon, un événement incontournable dédié à l’environnement Kubernetes et à l’open source, s’est tenue en France, et je ne pouvais pas passer à côté ! Invité par Programmez, le partenaire média de la conférence, j’ai profité de cette occasion unique pour montrer comment la plateforme Splunk permet de répondre aux enjeux des architectures conteneurisées d’aujourd’hui.

L’observabilité au service du monitoring

La plupart des workloads tournent dorénavant sur des environnements conteneurisés. Il était donc impossible pour Splunk de ne pas être présent à la KubeCon 2024, qui s’est tenue du 19 au 22 mars au parc des expositions de la Porte de Versailles, à Paris. En effet, même si notre plateforme va bien au-delà du monitoring des environnements Kubernetes, la supervision des conteneurs n’en reste pas moins un facteur vital d’une stratégie d’observabilité efficace.

Mais l’observabilité, c’est quoi ?

Pour le moment, chacun y va un peu de sa définition, mais, pour moi, il s’agit avant tout d’une approche visant à disposer de toutes les informations (métriques, logs, traces et bientôt les profiles) nécessaires pour monitorer efficacement un système. En d’autres termes, dans un système observable, il n’y a plus d’inconnues-inconnues, et vous disposez d’une visibilité totale sur votre environnement. Contrairement à ce que certaines personnes peuvent penser (et dire), l’observabilité ne vient donc pas simplement remplacer le monitoring, mais constitue une stratégie à adopter, en amont, pour améliorer la supervision.

Splunk, plateforme pionnière de l’open source

En matière d’observabilité et de collecte des données, Splunk a fait très tôt le pari de l’open source, notamment avec OpenTelemetry. À l’époque, ce choix de ne pas développer d’agents propriétaires a pu surprendre, mais il est aujourd’hui en train de s’imposer comme le nouveau standard, et le fait que nous soyons vraiment « natifs » nous procure un avantage non négligeable. Certains de nos clients figurant parmi les leaders de l’industrie française ont d’ailleurs déjà pris la décision de fonctionner exclusivement avec cet outil de collecte des données de télémétrie.

Et ça se comprend ! OpenTelemetry présente en effet de nombreux avantages :

  • Le déploiement d’un agent unique et transparent à la place d’une multitude de solutions propriétaires pour plus de visibilité
  • La possibilité de choisir son fournisseur et d’en changer facilement pour plus de liberté
  • Une standardisation des échanges pour une communication simplifiée

Nous voyons par ailleurs OpenTelemetry comme une solution d’observabilité pérenne, qui évitera aux entreprises de nombreux changements (et de nombreux problèmes) à l’avenir.

Le choix du streaming

Mais l’open source n’est pas le seul domaine dans lequel Splunk a démontré son esprit de pionnier du secteur. Nous sommes également les seuls à proposer une architecture de streaming permettant de traiter la data quasi en temps réel. En effet, dans les environnements de type conteneurs ultra rapides d’aujourd’hui, il ne suffit plus de repenser la manière de collecter les données, il faut également revoir notre approche afin d’être en mesure de les véhiculer et d’en extraire de la valeur presque immédiatement. 

 

Malheureusement, la plupart des solutions actuelles se contentent de collecter les données en quasi temps réel, pour les stocker ensuite dans des bases de données (Time Series Database) avant de pouvoir les rendres utiles (faire de l’alerting, mettre à jour un tableau de bord…) en utilisant une approche lente de type “batch”… et cela engendre une énorme perte de temps, augmenter le MTTD et MTTR (Mean Time To Detect / Mean Time To Repair)!

Pour suivre la cadence, les environnements modernes ne peuvent tout simplement plus se permettre d’envoyer ces batchs et de prendre des mesures à chaque minute. Au contraire, dès qu’un événement est détecté, la plateforme Splunk n’a besoin que de 2 ou 3 secondes pour générer une alerte, effectuer des analyses, mettre à jour un tableau de bord ou remédier à un incident. Un traitement en quasi-temps réel que nous sommes, pour le moment, les seuls à offrir.

Vous voulez en savoir plus sur OpenTelemetry et sur l’observabilité afin de rester à la pointe de votre secteur ? Consultez notre présentation détaillée Qu’est-ce qu’OpenTelemetry ? avant de découvrir nos Prévisions 2024 pour l’observabilité. Je vous invite aussi à découvrir cet article (en anglais) sur les dessous de l’observabilité.

Vingt ans de Product Management et Product Marketing, dans des startups de 150 personnes et des grands groupes de 180 000 personnes, 20 ans c'est long, mais c'est bien :)