Il est essentiel de comprendre les performances des systèmes pour acquérir un avantage concurrentiel. La télémétrie offre des informations détaillées sur les systèmes pour aider les dirigeants d’entreprise à prendre de meilleures décisions.
Cet article offre un aperçu complet de ce qu’est la télémétrie. Nous allons nous intéresser à ses fonctions et aux différents types de données. Nous verrons également dans quels domaines elle est la plus utile, et les difficultés que les entreprises pourraient rencontrer dans la mise en place des systèmes de télémétrie.
Commençons par une définition : la télémétrie collecte et analyse des données provenant de sources distantes pour en extraire des informations sur les performances d’un système, afin d’identifier les domaines à améliorer.
Courante dans de nombreux secteurs, la télémétrie apporte un appui parfois stratégique dans les domaines du développement logiciel et de l’informatique, de l’agriculture, de la santé, des prévisions météorologiques et de la recherche de terrain. Pour prendre un exemple crucial, la télémétrie suit les signes vitaux des patients, comme la tension artérielle et la fréquence cardiaque.
Dans l’industrie des technologies et du logiciel, qui sont au cœur de notre article, la télémétrie désigne le processus qui collecte automatiquement des données auprès de nombreux produits logiciels. Elle fournit des informations détaillées sur votre produit pour orienter et éclairer les décisions d’amélioration.
Par exemple, de nombreux systèmes logiciels utilisent la télémétrie pour suivre les interactions des utilisateurs avec vos produits. Pour cela, vous allez suivre des indicateurs comme :
(Découvrez MELT : métriques, événements, logs et traces.)
Les deux termes sont souvent employés de manière interchangeable. Ces processus se recoupent mais il faut noter quelques différences :
On peut donc dire que la supervision est un sous-domaine de la télémétrie. La télémétrie offre des outils de supervision plus approfondis et une image complète du système.
(À lire également : Qu’est-ce que l’EBPF ? et Télémétrie, supervision et observabilité).
Les entreprises collectent et supervisent différents types de données télémétriques selon leurs besoins.
Une infrastructure informatique produit un large éventail de télémétrie : taux de transaction et d’erreur, temps de réponse, utilisation du CPU et de la mémoire, E/S disque et débit du réseau.
Les données sont collectées lorsque l’utilisateur interagit avec des fonctionnalités du produit. Par exemple, lorsqu’il clique sur un bouton, se connecte au système, consulte une page spécifique ou rencontre une erreur particulière.
On supervise des indicateurs spécifiques tels que la capacité de la bande passante, certains ports réseau et les solutions de stockage. De plus, les données de télémétrie réseau peuvent inclure des indicateurs de l’état des périphériques réseau : consommation de CPU et de mémoire des routeurs et des switches, disponibilité des périphériques, température.
(Lisez notre guide de la télémétrie du réseau.)
Les applications génèrent un grand volume de données de télémétrie. La collecte de ces données permet de superviser la latence, le nombre de transactions par seconde, les accès aux bases de données, les requêtes aux bases de données, les erreurs générées par l’application et des activités propres au déploiement (déroulement et topologie).
De plus, les personnes responsables d’une application peuvent obtenir des informations sur les systèmes d’exploitation et les navigateurs (type et version) les plus utilisés, ainsi que des détails sur les appareils.
(En savoir plus sur la supervision des performances des applications, ou APM.)
Les entreprises peuvent également collecter des données de télémétrie propres au cloud : décisions de routage, modifications de configuration, changement de groupe de sécurité et autres.
La télémétrie offre de nombreuses possibilités à qui sait s’en servir. Voici quelques pistes.
Les données de télémétrie peuvent mettre en évidence les fonctions les plus sollicitées et les moins utilisées. Ces informations aident les équipes produit à hiérarchiser l’amélioration des fonctionnalités, voire à mettre fin au développement de fonctionnalités qui n’intéressent pas les utilisateurs.
Les données de télémétrie font la lumière sur les domaines et les fonctionnalités des logiciels ou plateforme où les erreurs et les ralentissements sont les plus fréquents. Grâce à ces révélations, les équipes peuvent cibler les aspects problématiques et les corriger avant que la situation ne s’aggrave.
Les données télémétriques mettent en évidence les bottlenecks des produits, et notamment les pages et les composants qui mettent trop de temps à se charger. Ces informations orientent l’intervention des développeurs pour améliorer les performances des produits.
En cas de modification ou d’enrichissement d’une fonctionnalité, les données de télémétrie permettent de vérifier si le changement :
Les données de télémétrie peuvent révéler des activités suspectes et des modèles d’utilisation malveillants. En examinant l’historique de la télémétrie, les équipes de sécurité comprennent mieux les incidents de sécurité et leurs causes possibles. La télémétrie offre également un moyen simple de détecter les versions obsolètes des logiciels, afin d’appliquer rapidement les correctifs de sécurité.
Pour profiter de la valeur de votre télémétrie, il ne suffit pas de collecter les données. Il y a plusieurs activités à réaliser, que je décompose en cinq étapes ci-dessous.
Commencez par identifier vos besoins en télémétrie et une approche pour la collecte des données. À quelles questions souhaitez-vous répondre ? Sur quels sujets voulez-vous obtenir des informations ? Vous allez également déterminer :
Il faut, par exemple, définir le schéma des messages de télémétrie du système cible. Si la télémétrie concerne plusieurs systèmes, pensez à définir des formats de message communs.
Lors de cette étape, on intègre la télémétrie au système cible qui envoie les données au système distant. Par exemple, dans le cas de la télémétrie des utilisateurs ou d’une application, c’est l’application qui va devoir envoyer les données selon le schéma défini, lors d’événements spécifiques.
Il y aura également des configurations à établir si le système doit envoyer des données via une file d’attente. Les données doivent être correctement validées. Évitez ou protégez les informations sensibles, conformément aux politiques de confidentialité et de sécurité de votre entreprise.
(Découvrez comment fonctionne la corrélation des événements.)
La troisième étape consiste à transmettre la télémétrie du système cible au stockage distant en temps réel ou à des intervalles définis. La transmission peut se faire à l’aide de différents protocoles et méthodes en fonction du système et des types de données. On peut notamment utiliser des files d’attente de messages spécifiques pour envoyer les données à destination.
De plus, les systèmes cibles devront peut-être répondre à des besoins spécifiques en fonction de la configuration de la télémétrie. Vous pouvez, par exemple, utiliser une méthode d’échantillonnage pour contrôler le volume de données et ajuster le débit de transmission.
Les données de télémétrie sont accumulées dans une base de données centrale ou un data lake. Le système de stockage sera choisi de manière à accueillir une grande quantité de données. Il doit également se prêter aux analyses historiques et en temps réel afin d’aider les équipes à identifier les tendances, les anomalies et les modèles au fil du temps.
Une fois les données collectées et stockées, elles sont analysées à l’aide de différents outils. Ces données peuvent révéler des informations qui vont faciliter l’identification et la correction des bugs, améliorer l’expérience utilisateur et soutenir la prise de décisions éclairées sur le développement des fonctionnalités.
Il s’agit de représenter visuellement les données et les informations répondant précisément aux besoins des parties prenantes, pour que celles-ci puissent identifier facilement les tendances et les modèles.
Abordons maintenant les difficultés propres aux données de télémétrie. La télémétrie permet de répondre à des questions stratégiques pour améliorer les performances des systèmes. Mais elle crée également de nombreux défis qu’il faut surmonter pour profiter pleinement de ses avantages.
Certaines entreprises peuvent envoyer des informations utilisateur sensibles, dont des noms d’utilisateur et des adresses IP, parce qu’elles sont essentielles pour obtenir de précieuses informations. Il reste que cela soulève de graves questions de confidentialité.
Les entreprises doivent respecter les réglementations sur la protection de la vie privée comme le RGPD et la CCPA, et donc protéger les informations personnelles et sensibles. Certains utilisateurs préfèrent désactiver des fonctions de télémétrie pour des raisons de confidentialité, mais cela peut créer des lacunes ou des biais dans les données.
La télémétrie produit un volume considérable de données. C’est particulièrement le cas si le système de télémétrie est intégré à un grand nombre de produits et de systèmes, ou que les pics d’utilisation augmentent encore la génération de données. Le stockage de ces volumes croissants de données peut devenir problématique et coûteux. Il faut donc privilégier des solutions fiables, évolutives et économiques.
(En savoir plus sur l’analyse des big data.)
La latence réseau peut dégrader l’analyse des données en temps réel. Ajoutons à cela que la transmission de grandes quantités de données de télémétrie peut consommer une grande part de bande passante et augmenter les coûts d’exploitation.
Si le système de télémétrie est intégré à de nombreux clients et systèmes, les dysfonctionnements des appareils, les bugs logiciels et les erreurs de transmission peuvent provoquer des incohérences. Ces problèmes d’intégrité nuisent à la précision des données. Il faut aussi tenir compte de la diversité des systèmes et des piles technologiques qui entravent les communications et le partage de données avec le système de télémétrie.
(Découvrez comment OpenTelemetry résout le problème posé par la segmentation des données.)
Quand les volumes de données sont très importants, l’analyse peut devenir longue et pénible. Il faut donc des outils et des techniques efficaces pour traiter, analyser et extraire des informations utiles de ces données.
Aujourd’hui, les systèmes de télémétrie sont essentiels pour améliorer les performances des systèmes et offrir la meilleure expérience utilisateur. Comme nous l’avons vu dans cet article, la télémétrie offre sur les systèmes des informations plus précises que la supervision classique. Les systèmes de télémétrie actuels suivent différents types de données.
La télémétrie a plusieurs avantages : elle permet de hiérarchiser le développement des fonctionnalités, d’améliorer la sécurité et de valider les améliorations. Comme l’explique l’article, la télémétrie présente également son lot de difficultés et il faut les surmonter pour profiter pleinement de son potentiel.
Si vous voulez en savoir plus sur la télémétrie, nous avons dressé une liste de ressources et de lectures intéressantes :
Une erreur à signaler ? Une suggestion à faire ? Contactez-nous à l’adresse ssg-blogs@splunk.com.
Cette publication ne représente pas nécessairement la position, les stratégies ou l’opinion de Splunk.
La plateforme Splunk élimine les obstacles qui séparent les données de l'action, pour donner aux équipes d'observabilité, d'IT et de sécurité les moyens de préserver la sécurité, la résilience et le pouvoir d'innovation de leur organisation.
Fondée en 2003, Splunk est une entreprise internationale. Ses plus de 7 500 employés, les Splunkers, ont déjà obtenu plus de 1 020 brevets à ce jour, et ses solutions sont disponibles dans 21 régions du monde. Ouverte et extensible, la plateforme de données Splunk prend en charge les données de tous les environnements pour donner à toutes les équipes d'une entreprise une visibilité complète et contextualisée sur l'ensemble des interactions et des processus métier. Splunk, une base solide pour vos données.