Leaders

Le potentiel ignoré des dark data

Dark Data ReportSplunk a publié le rapport sur l'état des dark data et – attention, spoiler – les décideurs informatiques et métier du monde entier pensent que c’est un sujet très important. Mais le rapport dessine également une situation qui m’inquiète un peu, et devrait également vous inquiéter si vous êtes dans le domaine des technologies : le fossé qui sépare les attentes de la réalité en ce qui concerne les dark data et l’intelligence artificielle. Mais avant tout, revenons un peu en arrière pour définir un terme que j'ai utilisé dès la première ligne.

« Dark data » sonne un peu comme le titre d'un roman cyberpunk, mais cette appellation théâtrale désigne simplement les données inconnues et inexploitées de votre entreprise, données qui sont générées par les systèmes, les appareils et les interactions. Gartner définit les dark data comme suit :

« Les informations qu’une entreprise collecte, traite et stocke au cours de ses activités normales, mais qu’elle ne parvient généralement pas à réutiliser dans un autre cadre (par exemple, à des fins d'analyse, de relations commerciales ou de monétisation directe). Comme la matière noire en physique, les « données noires » regroupent souvent la majeure partie de l’univers des ressources d’information d'une entreprise. C’est pourquoi ces dernières conservent souvent les dark data à des fins de conformité uniquement. Le stockage et la sécurisation de ces données produit généralement plus de coût (et parfois plus de risques) que de valeur. »*

Les dark data sont précieuses en partie parce qu’elles sont tellement nombreuses et qu’elles pourraient être exploitées pour libérer de la valeur commerciale. Plus vous avez de données, plus vous pouvez obtenir d’informations sur tous les aspects de vos opérations. Plus le groupe de données est large, et plus l'analyse sera juste. Si vous fermez les yeux sur les dark data, vous oubliez de l’argent sur la table. D’ailleurs, 76 % des personnes interrogées pensent que « l’entreprise qui possède le plus de données triomphera. »

N’oublions pas qu’il y a un coût financier réel à posséder des dark data sans les exploiter, et que ce coût s'ajoute à celui des opportunités ignorées. Le stockage des données est certes beaucoup moins cher qu'auparavant, mais il n’est toujours pas gratuit. Si vous payez pour le stockage de données que vous n’utilisez pas, vous gaspillez de l’argent et vous manquez l’opportunité de les exploiter.

Donc, si les dark data sont si précieuses et que les décideurs le savent, pourquoi les entreprises ne les utilisent-elles pas ? Parce qu’elles n’ont pas les bons outils. Pensez aux systèmes « zombies » qui hantent les salles de serveurs de tant d’entreprises : des solutions de supervision obsolètes assemblées avec du scotch et de la ficelle, qui fonctionnent uniquement grâce à la sueur, aux prières et aux jurons des responsables informatiques. Dans le cas des données et de ces systèmes, l’opacité est synonyme de gaspillage et de dissimulation de la valeur potentielle. Les entreprises qui refusent de se tourner vers l’avenir en adoptant de nouvelles solutions informatiques ne seront jamais capables de tirer avantage des dark data. Elles vont perdre la course aux données avant même d'avoir atteint la ligne de départ.

Revenons maintenant à la situation inquiétante dont je parlais au début. On peut aisément lire ce rapport comme une confirmation de l’évidence : les données sont précieuses et l’IA peut nous aider à les utiliser de façon plus efficace. Mais il est possible de faire une interprétation plus approfondie des conclusions clés du rapport :

  1. Les décideurs informatiques et métier conviennent que les dark data ont une valeur considérable, mais
  2. Ils ne savent pas comment les utiliser (de fait, pour 56 % des participants, le concept de « piloté par les données » n’est qu’un slogan dans leur entreprise),
  3. Ils comptent sur l’IA pour en extraire la valeur mais ne possèdent ni la technologie, ni l’expertise, ni le personnel requis pour utiliser l’IA, et
  4. Une majorité de participants (69 %) admettent qu’ils n’essaient même pas d'acquérir de nouvelles compétences en matière de données, et parmi eux la moitié prétextent qu’ils sont trop vieux (ce qui, selon moi, n’est qu’une excuse pour éviter de dire « c’est trop difficile »).

La Chine est le seul pays de cette étude internationale où un pourcentage élevé de participants indique faire des efforts importants pour relever les défis des dark data et de l’IA.

Quelle que soit la façon dont vous interprétez les conclusions du rapport, il est temps de mettre au point votre stratégie de dark data. Votre entreprise fait-elle ce qu'il faut pour rester compétitive ? Recrutez-vous les bonnes personnes ? Encouragez-vous une culture axée sur les données dans votre entreprise, et proposez-vous des formations adaptées pour la rendre possible ? Investissez-vous dans des technologies permettant de faire la lumière sur vos dark data ?

C’est sur cette dernière question que Splunk peut vous aider.

Je vous encourage à lire le rapport sur l’état des dark data dans son intégralité : il explore dans le détail les attitudes des participants et leurs projets concernant les dark data, l’IA et l’avenir des métiers. Vous pouvez l’obtenir ici


*Glossaire informatique Gartner, « Dark Data » 2019.

**Cet article est une traduction de celui initialement publié sur le blog Splunk anglais.

Tim Tully
Posted by

Tim Tully

Tim est Directeur technologique depuis 2017. Avant de rejoindre Splunk, il a travaillé pendant 14 ans pour Yahoo où il a occupé différents postes, dirigeant notamment l’ingénierie de la division Médias au sein de laquelle ses équipes ont développé de grandes marques comme Yahoo.com, Yahoo Finance, Yahoo Sports, Yahoo Fantasy, Tumblr, Huffington Post et Flurry. Auparavant, il a été l’architecte de données en chef de Yahoo, un poste où il a assuré la direction de l’architecture pour toutes les équipes de données et a également développé l’essentiel de cette pile. Avant cela, Tim a été membre du personnel technique de Sun Microsystems au sein de l’équipe JavaSoft. Tim détient un Master de l’Université Carnegie Mellon ainsi qu’une licence de l’Université de Californie à Davis.

Tags

Le potentiel ignoré des dark data

Afficher tous les tags
Show Less Tags

Join the Discussion