Data Insider

Que sont les dark data ?

Les dark data sont toutes les données inutilisées, inconnues et inexploitées d’une entreprise, générées par les interactions quotidiennes des utilisateurs avec d'innombrables machines et systèmes, des données machine aux fichiers de log des serveurs, en passant par les données non structurées dérivées des réseaux sociaux.

Ces données peuvent être considérées comme trop anciennes pour avoir de la valeur, incomplètes ou redondantes, ou bien se présenter dans un format inaccessible avec les outils à disposition. Bien trop souvent, leur existence n’est même pas connue.

Toutefois, les dark data peuvent être la ressource inexploitée la plus importante d'une entreprise. Les données acquièrent une importance croissante en tant qu’actif organisationnel, et les entreprises compétitives doivent en exploiter toute la valeur. De plus, des réglementations toujours plus étroites sur les données peuvent exiger une gestion complète des données de l’entreprise.

Cet article explore la définition des dark data et leur impact sur votre entreprise, comment procéder pour les rechercher, y accéder et les analyser, et comment mettre sur pied une stratégie complète pour préparer un nouvel avenir pour les données.

Livre blanc | Libérez enfin le potentiel de vos données inexploitées

Que sont les dark data ?

Quel pourcentage des données sont des dark data ?

Globalement, environ 55 % des données d’une entreprise sont considérées comme « dark », autrement dit, elles sont inconnues, non détectées, non quantifiées, sous-utilisées voire totalement inexploitées. Ces chiffres sont ceux du Rapport 2019 sur l'état des dark data, publié par TRUE Global Research et commandé par Splunk. Dans son enquête, l’étude a révélé qu’un tiers des participants estiment que plus de 75 % des données de leur entreprise sont « dark », tandis que 11 % seulement affirment que les dark data représentent moins d’un quart de leurs données.

Ces chiffres varient sur les sept économies étudiées. Par exemple, si 44 % des participants chinois indiquent qu'au moins la moitié de leurs données sont des dark data, ils sont 65 % à affirmer la même chose en France et au Japon. (Moyenne globale : 60 %)

Quel est le lien entre dark data et big data ?

Selon Gartner, les big data sont des actifs très volumineux ou divers qui nécessitent des formes innovantes et rentables de traitement de l’information. Mais avec la croissance exponentielle des big data, la quantité de dark data invisibles augmente également. La quantité de données machine d’entreprise, par exemple, augmente bien plus rapidement que les données traditionnelles, mais elles contiennent également des informations d'une importance grandissante pour la prise de décision stratégique et commerciale. On ne sera donc pas surpris qu’elles soient également une source majeure de dark data.

Qu’est-ce que l’analyse des dark data ?

L'analyse de dark data est une solution ou un logiciel qui permet aux entreprises de mieux localiser, identifier et exploiter des données jusque-là inconnues à des fins de prise de décision commerciale stratégique. Selon le Rapport sur l’état des dark data, les participants voient l’analyse comme la solution majeure capable de relever adéquatement les défis des dark data, et de permettre à un vivier plus large d’employés non techniciens de comprendre leur entreprise. Spécifiquement, une solution d'analyse des dark data va délivrer une vision plus complète, éclairante et précise des données des utilisateurs, et leur offrir une image globale de leur environnement.

Quel est le lien entre dark data et analyse des données ?

À l’avenir, il est très probable que l’analyse des dark data s’appuie sur l’IA, tout simplement parce que l’IA a la possibilité de traiter des quantités énormes de données diverses à très haute vitesse. De plus, face à des quantités considérables d'informations, dont des dark data, l’IA a le pouvoir de produire des renseignements commerciaux plus profonds, nuancés et précis. Ainsi, si les IA actuelles ne peuvent remplacer la réflexion et la créativité humaines, elle sait traiter rapidement des données à une échelle et une vélocité hors de portée des humains. Nul besoin d’être voyant pour imaginer que l’IA et les dark data vont être de plus en plus étroitement liées.

Découvrir les dark data

Comment réaliser une évaluation des dark data ?

Vous pouvez réaliser une évaluation des dark data de plusieurs manières. Premièrement, il est possible de recruter un consultant indépendant qui va évaluer l’entreprise et rechercher les dark data masquées ou négligées.

Une autre option consiste à évaluer l’intégralité de votre environnement pour gagner en visibilité et améliorer l’efficacité de la gestion des données. Les entreprises ont également tout intérêt à identifier les infractions à la conformité et à détecter les failles de sécurité, les vulnérabilités et les activités malveillantes qui peuvent mettre leurs données en danger.

Quelles études peut-on consulter sur les dark data ?

Les entreprises n’en sont qu’à leurs tout premiers pas dans la gestion de ces défis, et les études dans le domaine ne font qu’émerger. Gartner, le cabinet d'analyse leader qui a créé le terme « dark data » s’est penché sur la façon dont les entreprises peuvent prendre le contrôle sur l'accumulation de données et d'autres sujets connexes.

Avant qu’on les appelle officiellement « dark data », le cabinet de conseil Deloitte évoquait des défis à venir dans un rapport sur les opportunités que représentaient les données non structurées pour les entreprises, et délivrait des éclairages stratégiques sur les problèmes qu'allaient poser les données inconnues dans tous les secteurs.

L'étude la plus récente sur les dark data à l’heure où nous écrivons cet article est le Rapport 2019 sur l'état des dark data, conduit par TRUE Global Intelligence et sponsorisé par Splunk. Plus de 1 300 décideurs informatiques et métier du monde entier ont été interrogés sur la façon dont leur entreprise collecte, gère et utilise les données. Outre les conclusions mentionnées plus haut, le rapport apporte plusieurs éclairages :

  • 76% des participants pensent que « la réussite sera celle de l’entreprise qui possède le plus de données ».
  • 60 % disent que plus de la moitié des données de leur entreprise sont des dark data, et un tiers indiquent que les dark data représentent plus de 75 % de leurs données.
  • Selon les décideurs métier, les principaux obstacles à l’extraction des dark data sont le volume des données, suivi de la pénurie des compétences et des ressources.
  • Plus de la moitié (56 %) reconnaissent que « orienté données » n’est qu'un slogan dans leur entreprise.

Le rapport aborde également les inquiétudes entourant l’ascension de l’intelligence artificielle et les défis liés à des postes de plus en plus axés sur les données.

Dark data : usages et tendances dans le monde réel
Quelles sont les tendances dans les dark data ?

La tendance majeure associée aux dark data est une sensibilisation croissante à l’importance d'une gestion efficace des données de l’entreprise. S'il est clair que les données sont le carburant qui va alimenter le succès à l’avenir, la plupart des entreprises ne sont pas préparées à faire face aux défis que cela comporte, pour des raisons de manque de compétences mais aussi de négligence. Plusieurs tendances se dégagent en matière de dark data :

  • Les données vont être la clé de la réussite future des entreprises : plus de deux tiers des entreprises (71 %) estiment que les données vont devenir plus précieuses encore au cours des dix prochaines années, et presque tous s'attendent à voir croître leur influence sur la prise de décision.
  • Les compétences en données vont être indispensables aux futurs emplois : dans leur grande majorité, les décideurs pensent que les compétences en données resteront importantes pour tous les rôles de leur entreprise, et pas seulement dans la fonction IT. De plus, il faudra presque certainement avoir une bonne maîtrise des données pour être un cadre dirigeant.
  • Les entreprises ne possèdent pas les outils qui rendent les données utilisables : en dépit de l’importance croissante des données, les décideurs admettent que leur entreprise ne possède pas les ressources, les outils et les compétences nécessaires pour exploiter toute cette abondance de données ou profiter de ses avantages.
  • Les entreprises souffrent d'un manque de compétences en données « dark » : beaucoup d’employés restent réticents à l’acquisition de nouvelles compétences, et ils sont 69 % à affirmer qu’ils se satisfont de leur travail actuel, même si cela les prive d'une promotion potentielle.
dark data global research

Quels sont les usages des dark data ? 

L’une des applications majeures des dark data sera l’alimentation des solutions reposant sur l’IA : une quantité de données accrue enrichit les informations exploitables par les IA et doivent leur permettre de produire des renseignements encore plus approfondis et précis.

L’éventail des scénarios d’utilisation spécifiques est large. L’un des plus importants sera la création et l'élaboration de stratégies commerciales plus productives et innovantes. Il faut notamment aider les entreprises à identifier lesquels de leurs services sont responsables des données, de quels types de données la direction est responsable et sur quels types elle doit avoir la main. Elles peuvent aussi être employées pour améliorer les processus d'assurance qualité, pour détecter et corriger les erreurs de processus, pour rechercher les failles de confidentialité, les vulnérabilités et les infractions potentielles à la conformité.

À l’avenir, les dark data pourront être utilisées de façon proactive pour créer de nouvelles stratégies de gestion des données axées sur des technologies à la croissance rapide, comme l’IoT, et servir de matière à des analyses de tendance à court et long terme qui apporteront une preuve chiffrable aux responsables et aux dirigeants.

Quels sont les cas d’usage des dark data dans le secteur de la santé ?

Comme le secteur de la santé a fortement besoin de gagner en efficacité, mais aussi d'avoir une image complète de ses données et d’adopter des approches innovantes, la puissance des dark data aura un impact considérable à long terme sur cette industrie. Une utilisation plus efficace des données peut aider les hôpitaux, les cabinets de médecin et les spécialistes à hyper-personnaliser l’expérience médicale des patients, pour offrir de meilleurs soins et renforcer la sécurité des dossiers médicaux et la conformité au RGPD.

Pour bien démarrer

Poser les fondations d’une nouvelle culture des données

Les entreprises sont confrontées à des défis contradictoires : elles savent que les données et l’IA renferment un potentiel quasi illimité de transformation et que la maîtrise des données sera indispensable à de nombreux postes. Pourtant, les décideurs n’ont qu'une confiance limitée dans leur compétence, leur expertise en IA et leur capacité à prendre de bonnes décisions en fonction des données qu’ils possèdent.

À la lumière de ce contraste, voici plusieurs recommandations essentielles à l’intention des entreprises qui tentent de passer d’une situation d’incertitude vis-à-vis des données, à un avenir piloté par les données.

dark data

Préparez-vous à l’IA. Gardez une longueur d'avance sur les nouvelles technologies telles que l’IA et le machine learning, tout en recherchant des scénarios d’utilisation appropriés pour votre secteur et votre entreprise. Entre autres choses, les décideurs informatiques et métier doivent suivre les développements généraux en matière d’IA et comprendre comment ces technologies évoluent dans différents marchés. Pensez également au potentiel de l’automatisation, qui peut apporter des gains considérables d’efficacité et de précision, et décupler votre capacité à travailler efficacement avec de grands volumes de données.

Encouragez une culture centrée sur les données. La création de l’infrastructure nécessaire est la première étape à franchir pour faire d’un avenir axé sur les données une réalité. À partir de là, prenez des mesures pour comprendre vos données et engagez-vous à en mettre un maximum au jour : ce doit être une dimension essentielle de votre stratégie. Vous devrez également mettre l’automatisation et l’IA sur votre feuille de route informatique et imprégner votre prise de décision stratégique de données et d'analyse.

Recrutez de nouvelles compétences en données. Face à la pénurie de compétences en données qui frappe toute l’industrie, vous devez adopter une approche plus agressive de recrutement. Vous devez créer un vivier de talents, collaborer avec les grandes écoles de votre région, participer aux salons professionnels, aux conférences techniques et autres événements. La concurrence est rude quand il s’agit de trouver des travailleurs qualifiés et maîtrisant les données. Pour vous distinguer de vos concurrents, soignez le profil de votre entreprise et affirmez-vous comme une organisation visionnaire pour attirer et fidéliser les meilleurs talents.

Fournissez des opportunités de formation. Il vous incombera de veiller à ce que vos employés actuels reçoivent la formation dont ils ont besoin pour rester à jour des nouvelles technologies qui vont contribuer à la transformation de votre entreprise. Multipliez les opportunités de développement : créez des partenariats avec des sites de formation en ligne, envoyez vos collaborateurs à des conférences et des événements, proposez-leur des réductions sur des frais de scolarité. Encouragez vos collaborateurs à prendre en main leur développement de carrière et leurs objectifs professionnels, mais donnez-leur aussi les moyens d’y parvenir.

Pour résumer

Plantez le décor d'un avenir piloté par les données

Tout le monde s'accorde aujourd'hui à dire que les données sont plus que jamais le moteur du développement produit, de la chaîne logistique, de l’expérience client et des stratégies d’entreprise dans leur ensemble. Pourtant, de nombreux décideurs d'aujourd'hui ne sont pas réellement préparés à cette révolution. Ce défi s'accompagne toutefois d’opportunités.

Sans aucun doute, les entreprises vont devoir travailler dur pour recruter et former une main d'œuvre compétente en données, afin de se préparer aux réalités d'un avenir axé sur les données. Beaucoup d’efforts seront nécessaires pour instiller une culture axée sur les données. Enfin, elles vont devoir agir pour mettre au jour l’ensemble de leurs données. Les données sont un actif de plus en plus précieux et les entreprises vont avoir besoin des personnes, des processus et des technologies pour les gérer et maximiser leur valeur.