Data Insider

Qu'est-ce que l'Intelligence Artificielle pour les Opérations informatiques ? (AIOps)

Le terme « AIOps » désigne la pratique consistant à appliquer l’analyse et le machine learning aux big data pour automatiser et améliorer les opérations IT. L’IA peut analyser automatiquement des quantités massives de données réseau et machine pour y reconnaître des motifs, afin d’identifier la cause des problèmes existants mais aussi prévenir ceux à venir.

Le terme « AIOps » a été créé par Gartner en 2016. Dans le Guide du marché des plateformes AIOps, Gartner décrit les plateformes d’AIOps comme « des systèmes logiciels qui combinent big data et Intelligence Artificielle (IA) ou machine learning pour améliorer et remplacer en partie un large éventail de processus et de tâches informatiques, notamment la surveillance de la disponibilité et de la performance, la corrélation et l’analyse des événements, la gestion des services IT et l’automatisation. »

Fondamentaux de l’AIOps
AI for Operations

Comment utilisez-vous l’intelligence artificielle dans la gestion de vos opérations ?

L’AIOps est conçue pour mettre la vitesse et la précision de l’IA au service des opérations IT. La gestion des opérations informatiques est une tâche de plus en plus ardue en raison des dimensions et de la complexité croissantes des réseaux. Les outils et pratiques traditionnels de gestion des opérations parviennent difficilement à faire face aux volumes croissants de données issues de nombreuses sources, dans des environnements de réseau complexes et variés. Pour relever ces défis, l’AIOps :

  • Réunit des données de sources multiples : les approches, outils et solutions conventionnels n’ont pas été conçus en anticipant le volume, la variété et la vitesse générés par les environnements informatiques complexes et connectés d'aujourd’hui. C’est pourquoi elles rassemblent et agrègent les données, puis en font des moyennes, ce qui compromet la fidélité des données. L’un des avantages fondamentaux d’une plateforme AIOps réside dans sa capacité à capturer de vastes ensembles de données de tout type, provenant de tout l’environnement, tout en préservant la fidélité des données à des fins d'analyse complète.
  • Simplifie l’analyse des données : les plateformes AIOps ont le grand avantage de pouvoir recueillir tous les formats de données de différents volumes et vélocités. La plateforme applique ensuite une analyse automatisée aux données pour prédire et prévenir les futurs problèmes, et identifier la cause des problèmes existants.

Qu’est-ce qu’une plateforme AIOps ?

Selon Gartner, une plateforme AIOps rassemble big data et machine learning pour appuyer les opérations IT grâce à l’assimilation et l’analyse des données générées et sa capacité à s'adapter à des volumes croissants de données. La plateforme permet d’utiliser simultanément de nombreuses sources de données, méthodes de collecte et technologies d'analyse et de présentation.

Dans son Guide commercial des plateformes AIOps de 2019, Gartner souligne que « les plateformes AIOps apportent des fonctionnalités essentielles allant au-delà de ce qu'un outil de surveillance avec AIOps intégrée peut offrir. » Une véritable plateforme AIOps est « capable de réunir big data et machine learning pour appuyer les opérations IT grâce à l’assimilation et l’analyse des données générées et sa capacité à s'adapter à la croissance constante du volume, de la variété et de la vélocité de données."

Une plateforme AIOps doit pouvoir à la fois analyser les données stockées et fournir une analyse en temps réel au point d'assimilation.

Les fonctions centrales d’une plateforme AIOps telle que définie par Gartner :

  • Ingestion des données de sources multiples, quels que soient la source et le fournisseur.
  • Réalisation d'analyses en temps réel au point d'assimilation.
  • Réalisation d'analyses historiques sur les données stockées.
  • Exploitation du machine learning.
  • Déclenchement d’une action ou une étape en fonction des renseignements et de l’analyse.
Au cœur de l’AIOps

Quels sont les principaux cas d’usage de l’AIOps ?

Gartner recense cinq cas d’usage principaux pour l’AIOps, que nous allons examiner dans le détail :

  1. Gestion des big data (volume, variété, variabilité et vélocité)
  2. Analyse des performances
  3. Détection des anomalies
  4. Corrélation et analyse des événements
  5. Gestion des services informatiques
Application of AI powered by Machine Learning
  1. Analyse des performances : L’analyse des performances est une application clé de l’AIOps qui combine IA et machine learning pour recueillir et analyser rapidement de grandes quantités de données d'événement afin d’identifier la cause profonde d'un problème. Fonction essentielle de l’informatique, l’analyse des performances est devenue plus complexe avec l’augmentation du volume et de la variété des types de données. Il est devenu de plus en plus difficile pour les professionnels de l’IT d'analyser leurs données à l’aide des méthodes traditionnelles, même lorsque ces méthodes intègrent des technologies de machine learning. L’AIOps contribue à résoudre le problème de la croissance constante du volume et de la complexité des données, en appliquant des techniques d'IA plus sophistiquées pour analyser les jeux de données plus volumineux. Elle peut prédire les risques de dégradation et effectuer rapidement des analyses des causes profondes, permettant bien souvent d’empêcher les problèmes de se produire.
  2. Détection des anomalies : la détection des anomalies en IT consiste à identifier les valeurs anormales dans les données, autrement dit les événements et les activités qui se distinguent suffisamment des données historiques pour suggérer un problème potentiel. Ces valeurs sont appelées "événements anormaux".
      
    La détection des anomalies s'appuie sur des algorithmes. Un algorithme de tendance surveille un KPI (indicateur clé de performance) unique en comparant son comportement actuel à son comportement passé. Si le score augmente de façon anormale, l’algorithme génère une alerte. Un algorithme dit "de cohésion" examine un groupe de KPI devant se comporter de façon similaire et génère une alerte si le comportement de l’un d’entre eux change.
      
    L’AIOps rend la détection des anomalies plus rapide et plus efficace. Une fois qu’un comportement a été identifié, l’AIOps peut superviser la différence entre la valeur réelle du KPI étudié et la prédiction du modèle de machine learning, afin de reconnaître des changements importants.
  3. Corrélation et analyse des événements : la corrélation et l’analyse des événements permettent de voir, dans un « orage d'événements » constitué de multiples alertes connexes, la cause sous-jacente des événements et une piste de résolution. Toutefois, le problème des outils IT traditionnels est qu’ils ne donnent pas d'éclairage sur le problème, ils ne font que mettre en avant le déluge d'alertes.
     
    L’AIOps utilise les algorithmes d’IA pour grouper automatiquement les événements notables en fonction de leur similarité. Cela réduit la charge sur les équipes IT chargées de gérer les événements en continu, et réduit la masse inutile (et agaçante) d’événements. L’AIOps utilise l’IA pour grouper les événements apparentés, se concentrer sur des groupes d'événements clés et accomplir des actions basées sur des règles, comme fusionner les événements dupliqués, supprimer des alertes et fermer des événements notables à la réception d'un nouvel événement.
  4. Gestion des services informatiques : la gestion des services informatiques (ITSM) est un terme général qui recouvre tout ce qui est impliqué dans la conception, l'élaboration, la livraison, la prise en charge et la gestion des services informatiques d’une entreprise. L’ITSM englobe les politiques, processus et procédures de livraison des services IT aux utilisateurs finaux d’une entreprise.
     
    L’AIOps apporte à l’ITSM les mêmes avantages qu’aux autres disciplines IT. En appliquant l’IA aux données pour identifier les problèmes et les résoudre rapidement, et donc en rendant les services IT plus efficaces et rentables. L’AIOps pour l’ITSM peut être appliqué aux données pour surveiller le service d'assistance informatique, mais aussi tous les terminaux et plus encore.
     
    L’AIOps pour l’ITSM aide les services IT à :
    • Gérer les performances des infrastructures dans un environnement multi-cloud.
    • Faire des prédictions plus précises à des fins de planification des capacités.
    • Optimiser les ressources de stockage en ajustant automatiquement les capacités.
    • Améliorer l’utilisation des ressources en fonction des données historiques et des prédictions.
    • Identifier, prédire et prévenir les problèmes des services informatiques.
    • Gérer les appareils connectés sur l’ensemble du réseau.
  5. Automatisation : les outils conventionnels impliquent souvent d'assembler manuellement les informations de différentes sources avant qu’il soit possible de comprendre, dépanner et résoudre les incidents. L’AIOps offre un avantage conséquent par sa capacité à recueillir et corréler automatiquement les données de sources diverses, ce qui augmente considérablement la vitesse et la précision de la démarche. L'approche AIOps automatise ces fonctions à l’ensemble des opérations informatiques d’une entreprise :
    • Serveurs, OS et réseaux : collectez l’intégralité des logs, des métriques, des configurations, des messages et des pièges pour interroger les données, les corréler, générer des alertes et produire des rapports sur plusieurs serveurs.
    • Conteneurs : collectez, explorez et corrélez les données des conteneurs avec d'autres données d'infrastructure pour une mise en contexte et une surveillance améliorées des services, et pour produire des rapports de meilleure qualité.
    • Surveillance du cloud : supervisez les performances, l’utilisation et la disponibilité de l’infrastructure cloud.
    • Surveillance de la virtualisation : Bénéficiez d'une visibilité sur l'ensemble de la pile virtuelle, établissez plus rapidement des corrélations entre les événements et faites des recherches portant sur des transactions issues des composants physiques et virtuels.
    • Surveillance des systèmes de stockage : ayez une meilleure vision de vos systèmes de stockage dans le contexte des performances des applications associées, des temps de réponse des serveurs et de la charge financière de la virtualisation.

Quels sont les avantages clés de l’AIOps pour vos activités ?

En automatisant les fonctions des opérations IT et en utilisant la puissance de l’IA pour améliorer les performances du système, l’AIOps apporte des avantages significatifs à une entreprise. Par exemple :

key business benefits of AIOps

En améliorant les performances de l’infrastructure et des applications IT, l’AIOps améliore les KPI qui définissent le succès d’une entreprise.

  • La prévention des interruptions améliore la satisfaction des clients.
  • Le regroupement de sources de données auparavant isolées dans des silos permet de produire des analyses et des renseignements plus complets.
  • L'accélération de l'analyse des causes profondes et la correction des problèmes réduit les coûts et économise du temps et des ressources.
  • La réduction du délai de réponse et le renforcement de la cohérence des réactions améliore la qualité du service.
  • La localisation et la correction des erreurs dont la prise en charge serait chronophage et fastidieuse, améliore la satisfaction des employés et permet aux équipes IT de se concentrer sur des analyses et de l'optimisation à grande valeur ajoutée.
  • Les décideurs informatiques ont plus de temps pour collaborer avec leurs collègues des fonctions métier ce qui leur permet de démontrer plus facilement la valeur stratégique de l’organisation IT.

Nombre des défis des opérations IT sont communs à tous les secteurs d'activités, et l’AIOps permet de les résoudre. Certains problèmes sont toutefois plus fréquents ou menaçants dans certaines industries, notamment la santé, le commerce de détail, la fabrication ou encore les services financiers.

Intérêt de l’AIOps pour l’informatique du secteur de la santé (HIT) :

En automatisant les fonctions des opérations IT et en utilisant la puissance de l’IA pour améliorer les performances du système, l’AIOps apporte des avantages significatifs à une entreprise. Par exemple :

  • Sécurisation des informations médicales personnelles électroniques (ePHI) conformément à la loi HIPAA sur la portabilité et la traçabilité de l'assurance santé.
  • Réduction des risques associés aux réseaux mobiles et à l’utilisation des appareils personnels (« Bring Your Own Device ou BYOD ») par les professionnels de santé.
  • Prévention des attaques par ransomware, qui ciblent les établissements de santé de façon disproportionnée.
  • Possibilité d’explorer et d’utiliser les données massives internes et externes à des fins de diagnostic.

Comment l’AIOps peut être utilisé en informatique dans le secteur du commerce de détail :

  • Pour les points de vente (POS) mobiles et les systèmes de paiement mobiles dans les magasins physiques.
  • Synchronisation des données sur l’ensemble des canaux et plateformes de distribution (boutiques, applications mobiles, sites web traditionnels).
  • Sécurisation des données et informations des clients qui sont ensuite utilisables pour la création d’expériences client personnalisées.
  • Mise en place d’une infrastructure flexible où il est possible d'ajouter de nouvelles technologies au fil de la croissance et de l'évolution de l’entreprise.
  • Maintien d'opérations efficaces et réduction des coûts face à la pression financière qui s’exerce sur toute l’industrie du commerce.
  • Prise en charge du nombre croissant d'appareils connectés présents dans les boutiques.
  • Mise en œuvre de nouvelles technologies intelligentes (p. ex. appareils ménagers intelligents), outils en réalité augmentée ou virtuelle et systèmes sans caisse permettant à un client de payer en scannant un code-barres avec une application pour smartphone.

Comment utiliser l’AIOps pour l’informatique dans le secteur de la fabrication :

  • Automatisation de la collecte et de l’analyse de sources de données disparates provenant de l’intégration de la chaîne d'approvisionnement, du fonctionnement des usines et de la gestion du cycle de vie des produits et des services.
  • Utilisation de la supervision en temps réel pour suivre chaque machine de l’usine, en regroupant des données telles que la durée des cycles de fabrication, les rendements de qualité par machine et cycle de production, l’utilisation de la capacité et les niveaux de qualité des fournisseurs.
  • Prévention des ralentissements de production grâce à l’exploitation des données historiques combinées à des analyses prédictives pilotées par l'IA, de façon à protéger les flux de revenus et à améliorer la satisfaction des clients.
  • Utilisation des données machine pour permettre la maintenance prédictive, qui consiste à réparer les machines avant qu’elles ne tombent en panne.
  • Meilleure exploitation des données, permettant d’accroître l’efficacité des systèmes de gestion de la chaîne logistique.

Comment utiliser l’AIOps pour l’informatique dans le secteur des services financiers :

  • Prévention des failles de sécurité et de la cybercriminalité, toujours plus sophistiquées.
  • Possibilité de mettre les données clients au service des activités marketing et des opportunités de croissance.
  • Analyse des données client historiques permettant d'améliorer la précision des prédictions de croissance des revenus.
  • Sécurisation des données et conformité réglementaire.
  • Mise en place d’un framework intégrant de multiples groupes de données massifs, permettant d’exploiter des technologies émergentes comme la blockchain.
  • Capacité à proposer des expériences de banque mobile et numérique à la hauteur des attentes des clients.
  • Amélioration de la vitesse et des performances des réseaux.

Comment choisir les meilleurs outils et produits d’AIOps ?

Avec l’intérêt croissant suscité par l’AIOps, certains fournisseurs réunissent des outils opérationnels classiques, ajoutent quelques fonctionnalités d’IA de base et appellent le tout « plateforme AIOps ». Mais une véritable plateforme AIOps n’est pas une simple collection d'outils. Il est essentiel de bien comprendre cela dès le départ, car la plateforme que vous choisirez sera déterminante pour votre succès. Gartner recommande aux entreprises de « donner la priorité aux fournisseurs qui permettent de déployer l’assimilation, le stockage et l'accès aux données indépendamment des autres composants AIOps. »

Examinez attentivement les listes de fonctionnalités, et lisez des études de cas des clients actuels ainsi que les scénarios d’utilisation en AIOps. La façon la plus simple de savoir si une plateforme AIOps répondra à vos besoins consiste à trouver des études de cas où une entreprise comparable à la vôtre a utilisé l’AIOps pour relever ses propres défis. Cherchez les fournisseurs qui présentent leurs clients en ligne et demandez des références. Si un outil ou une plateforme AIOps promet des résultats exceptionnels mais ne peut pas le prouver, c’est sans doute qu’il vaut mieux chercher ailleurs.

Bien démarrer

Comment prendre un bon départ avec l’AIOps ?

La meilleure façon de bien démarrer avec l’AIOps consiste à adopter une approche incrémentale. La bonne pratique recommande de commencer à petite échelle, en réorganisant vos domaines IT par source de données. Apprenez à travailler avec de grands jeux de données permanentes provenant de sources diverses. Donnez à votre équipe des opérations informatiques la possibilité de se familiariser avec les aspects big data de l’AIOps. Commencez par un groupe de données existantes, puis ajoutez progressivement de nouvelles sources de données en améliorant votre utilisation.

Dans un premier temps, concentrez-vous sur l’assimilation des données : la mise en place de l’AIOps nécessite d'avoir accès à tous les types de données : données machine et métriques non structurées, et données relationnelles à des fins d’enrichissement. Ces différents types de données vous permettent de construire une perspective holistique dépassant les silos et de prendre des mesures adaptées à la situation et au type de données.

Assimiler et analyser tous les types de données, de façon rapide et efficace, est une tâche colossale. Commencez plutôt par localiser et analyser les données machine et les métriques historiques brutes, afin d’acquérir une compréhension basique de la situation, puis utilisez des algorithmes de clustering et des analyses pour identifier des tendances et des motifs remarquables. Les données brutes sont les meilleures si vous tenez réellement à pouvoir faire de la détection en temps réel. Vous pouvez ensuite commencer à analyser les flux de données pour déterminer s’ils correspondent à ces motifs, en appliquant l’IA et le machine learning pour introduire de l’automatisation puis, à terme, parvenir à l’analyse prédictive.

Incorporez et analysez autant de types de données que possible : les données historiques sont extrêmement précieuses lorsque vous démarrez avec l’AIOps. Si vous commencez par analyser et comprendre les états passés de vos systèmes, vous pourrez ensuite corréler ce que vous aurez appris avec le présent.

Pour y parvenir, les organisations doivent assimiler et donner accès à un très grand nombre de types de données historiques et de flux. Le type de données que vous allez sélectionner – log, métrique, texte, transaction, réseaux sociaux – dépend du problème que vous cherchez à résoudre. Vous pouvez par exemple utiliser les données métriques de votre infrastructure pour superviser sa capacité, ou les logs d'applications pour être sûr de délivrer une expérience exceptionnelle à vos clients.

De nombreuses plateformes AIOps ne se concentrent que sur une seule source de données. Restreindre l’AIOps à un seul type de données limite les renseignements que vous pouvez obtenir sur le comportement des systèmes, que ces renseignements proviennent d’un administrateur ou d’un algorithme. C’est pourquoi les entreprises doivent choisir les plateformes capables d'assimiler et d'analyser des données issues de sources multiples.

N’essayez pas de tout faire en une fois : cherchez avant tout à déterminer la cause profonde de votre problème le plus urgent. Progressez ensuite vers la supervision des données. Ce n’est qu'une fois cela fait que vous pourrez aborder l’IA. Et là encore, procédez étape par étape :

  • Commencez par mettre en place une plateforme AIOps qui fournira une fondation solide pour organiser de grands volumes de données afin de faciliter le passage à l’action, mais aussi des fonctions de supervision pour révéler tendances et motifs.
  • Explorez ensuite dans quelle mesure ces motifs vous permettent de prédire des incidents et rendre votre informatique plus proactive, afin de réduire non seulement le MTTR mais aussi le nombre d’incidents affectant les activités.
  • Enfin, mettez le machine learning au service de l’analyse des causes profondes pour atteindre le stade de la prédiction, où vous pourrez identifier les incidents et leur impact avant même qu’ils n'affectent vos services stratégiques et l’expérience client.
Pour résumer : foncez.

Si vous êtes un professionnel de l’IT et des réseaux, on vous a dit et répété que les données sont l’actif le plus important de l’entreprise, et que les big data vont transformer le monde. L’IA est une révolution, et elle est là pour longtemps. L’AIOps est un moyen concret de faire du battage médiatique entourant l’IA et les big data une réalité. Pour améliorer la sécurité comme pour normaliser les opérations ou accroître la productivité., l’AIOps offre un moyen pratique et accessible de développer et agrandir vos opérations IT pour qu’elles soient à la hauteur des défis à venir, et consolider ainsi le rôle de l’IT comme catalyseur stratégique de la croissance de l’entreprise.