Data Insider

Qu’est-ce qu’une plateforme de données ?

Une plateforme de données est une solution complète pour l’importation, le traitement, l’analyse et la présentation des données générées par les systèmes, les processus et les infrastructures des entreprises numériques modernes. S’il existe de nombreuses solutions spécialisées et applications dédiées pour gérer un ou plusieurs aspects du puzzle des données efficacement, une véritable plateforme de données assure la gestion des données de bout en bout.

Une plateforme de données est bien plus qu’une plateforme d’informations métier. Tandis que cette dernière incorpore des données pertinentes pour améliorer la prise de décision d’une entreprise, une véritable plateforme de données gère davantage de types et de structures de données sur l’ensemble de l’entreprise, et importe non seulement les données utilisées à des fins de sécurité, de confidentialité et de conformité, mais aussi des données des opérations IT et techniques ; autrement dit, toutes les données que votre entreprise reçoit ou génère.

Les entreprises d’aujourd’hui peuvent bâtir une infrastructure à partir de milliers d’applications et de services pour répondre à des besoins précis, mais ces différentes solutions sont souvent incapables de s’intégrer efficacement les unes aux autres. Le résultat : des silos, c’est-à-dire des jeux de données qui ne peuvent être partagés avec d’autres équipes ni avoir d’autres usages au sein de l’entreprise. C’est un frein à la puissance de l’analyse dans l’identification des défis et des opportunités.

L’un des nombreux avantages d’une plateforme de données moderne est la centralisation: une seule et même plateforme peut être utilisée dans toute l’entreprise pour éviter la formation de silos et fournir des informations exploitables basées sur une vision globale des données de l’entreprise. Mais pour y parvenir efficacement, elle doit être capable d’importer les données de toutes les sources ou presque sans introduire une complexité supplémentaire. Pour résumer, une plateforme de données doit améliorer la capacité de votre entreprise à apprendre de toutes les données et à toutes les exploiter.

Nous allons voir plus bas ce qu’est une plateforme de données et les qualités à rechercher afin d’en choisir une pour votre entreprise.

Présentation des plateformes de données

Existe-t-il une différence entre une plateforme de données et une plateforme big data ?

Une « plateforme big data » n’est pas différente d’une « plateforme de données » : les deux sont conçues pour traiter des données à grande échelle.

Le concept de « big data » a été popularisé dans les années 90, lorsque le volume de données généré par l’humanité a commencé à suivre une croissance exponentielle. Mais aujourd’hui, toutes les données sont des big data. Chaque consommateur a accès à des appareils et des systèmes cloud proposant des pétaoctets de stockage. Les organisations professionnelles, aussi bien les entreprises que les institutions publiques, produisent des quantités stupéfiantes des données. L’IDC estime que d'ici 2025, il y aura 163 zettaoctets de données dans l’univers numérique.

Trois grandes caractéristiques définissent les « big data » (que nous pouvons maintenant appeler simplement « données ») :

  • le volume, c'est-à-dire la quantité de données générées et stockées ;
  • la variété, à savoir le type et la nature des données ;
  • la vélocité, qui correspond à la vitesse à laquelle les données sont générées et traitées.

En raison de la croissance considérable sur ces trois vecteurs, toute plateforme de données capable de répondre aux besoins actuels des entreprises peut être considérée comme une plateforme « big data ».

Quels sont les avantages d’une plateforme de données d’entreprise ?

Les avantages d’une plateforme de données entreprise (EDP) s’articulent autour de la combinaison de fonctionnalités de bout en bout qui remplacent les solutions spécialisées précédemment employées pour fournir des services de données. De nombreuses entreprises se contentent de dépôts de données opérationnels (ODS), d’entrepôts de données (DW) ou de marchés de données (DM) qui ne fonctionnent pas toujours efficacement ensemble et limitent la capacité d’évolution. Une EDP intègre les capacités de ces solutions et réunit toutes les données au même endroit afin de les sécuriser, de les partager et de les utiliser le plus efficacement possible.

Une EDP apporte des avantages de poids aux grandes entreprises, notamment :

  • la centralisation et la standardisation des fonctions de données au sein d’une plateforme cloud ;
  • une simplification de l’ajout de nouveaux utilisateurs (même à la suite d’acquisitions de sociétés) ;
  • une gestion de la technologie centralisée plutôt que répartie sur plusieurs services ;
  • des rapports plus simples et de meilleure qualité ;
  • une analyse des données plus performante, plus rapide et plus complète.

Pour résumer, une plateforme de données d’entreprise efficace vous permet de travailler avec n’importe quel jeu de données, quels que soient sa nature, son emplacement (base de données structurée ou vaste lac de données) et son volume. Et avec une rapidité et un degré de confiance permettant de produire des informations exploitables en temps réel.

Qu’est-ce que l’architecture des données ?

Une architecture de données est essentiellement un cadre pour l’environnement de données d’une entreprise. Une architecture de données n’est pas une plateforme de données. Une architecture de données est un plan pour l’importation, le stockage et la mise à disposition des données, tandis que la plateforme de données est la machine qui consulte, déplace, analyse, met en corrélation et valide les données pour les utilisateurs finaux.

On comprend alors toute l’importance d’une architecture de données robuste : c’est la colonne vertébrale d’une entreprise axée sur les données, l’infrastructure solide qui soutient ses besoins actuels et peut évoluer en fonction de la croissance des données et de l’infrastructure. Avec des technologies comme l’edge computing et l’Internet des objets (IoT), il est de plus en plus important d’avoir des principes architecturaux solides.

Une architecture de données moderne est conçue pour intégrer les trois caractéristiques suivantes :

  • la polyvalence : les architectures de données sont conçues pour gérer le flux de données d’une entreprise pour que chaque domaine d’activité puisse accéder facilement aux données utiles à ses objectifs. Les besoins commerciaux et les sources de données (des nouvelles applications de back-end aux nouvelles plateformes de réseaux sociaux) changent fréquemment et l’architecture de données doit évoluer et s’adapter à ces changements rapidement, sans incident.
  • l’intelligence : une architecture de données doit nécessiter le minimum de maintenance et d’entretien. Elle doit automatiser l’assimilation et la distribution des données autant que possible, puis les cataloguer et les acheminer en toute fiabilité à leur destination. Outre l’automatisation, une architecture de données doit tirer parti du machine learning et de l’intelligence artificielle (IA) pour répondre aux changements, réparer les données erronées et améliorer en continu sa capacité à prédire les besoins des utilisateurs.
  • et la sécurité : une architecture de données digne de ce nom doit trouver le juste équilibre entre les qualités ci-dessus et la sécurité. Il est indispensable d’assurer une sécurité rigoureuse et de respecter les réglementations sur la confidentialité, ce qui exige des pratiques robustes de chiffrement des données et de gestion du cycle de vie des données. Il est impératif de mettre en place une stratégie de sécurisation des données adaptée à l’évolution l’architecture pour protéger l’entreprise, ses clients et leur avenir commun.

Qu’est-ce qu’une stratégie de données ?

Une stratégie de données décrit la façon dont une entreprise va collecter, stocker, sécuriser, gérer, analyser et partager des données, mais aussi les exploiter pour atteindre ses objectifs. C’est un concept central et intégré qui articule la façon dont les données vont inspirer et accélérer la stratégie commerciale. La stratégie de données d’une entreprise constitue le fondement de toutes ses opérations en lien avec les données.

La stratégie de données de chaque entreprise est unique, mais elle inclut généralement les aspects suivants :

  • elle définit la façon dont les données vont aider l’entreprise à atteindre ses objectifs commerciaux et établir la voie à suivre pour y parvenir ;
  • elle suscite des changements dans l’entreprise pour maximiser la valeur des données et planifier la mise en œuvre de ces changements ;
  • elle apporte une justification financière aux changements suggérés et aux avantages qu’ils représentent pour l’entreprise qui va utiliser les informations pour accroître les profits et monétiser les données.

Une stratégie de données combine la science des données et les objectifs de l’entreprise ; elle doit être spécifique et inclure des tactiques de mise en œuvre, mais offrir assez de flexibilité pour s’adapter aux changements rapides du marché.

Pour bien démarrer

Comment choisir une plateforme de données ?

Sélectionner la bonne plateforme de données revient à faire six choix fondamentaux : locale ou cloud, évolutivité, flexibilité, utilisabilité/champ d’application, sécurité/conformité et intelligence/automatisation. À la racine de tous ces critères se trouve une même considération essentielle : vous avez besoin de travailler avec toutes les données de votre entreprise, quels qu’en soient la source, le format ou l’échelle temporelle, vous devez pouvoir poser n’importe quelle question et obtenir des informations exploitables.

  • Locale, cloud ou hybride. Différents facteurs permettent de déterminer si vous devez gérer vos données sur place, via un fournisseur cloud ou une combinaison des deux. Ce sont les exigences de sécurité et de conformité, le coût de différents modèles de licence logicielle, les compétences et fonctions que vous souhaitez conserver au sein de votre équipe IT interne et celles que vous voulez acquérir via vos fournisseurs.
  • Évolutivité. Une plateforme de données doit être à la hauteur des volumes de données actuels et pouvoir s’adapter à la croissance inévitable de vos dépôts de données. (L’impératif d’évolutivité est l’un des principaux moteurs de l’adoption croissante des plateformes de données cloud.)
  • Flexibilité. La flexibilité est indispensable. La plateforme est-elle en mesure de servir différents groupes et scénarios d’utilisation ? Peut-on ajouter relativement simplement de nouvelles fonctions et scénarios d’utilisation à la plateforme ? Existe-t-il un écosystème robuste d’applications et d’extensions pour prendre en charge de nouvelles fonctionnalités ?
  • Convivialité et champ d’application. La plateforme que vous envisagez d’utiliser est-elle simple à déployer et à configurer pour des utilisateurs de différents niveaux de compétence ? Quelle est la courbe d’apprentissage ? Pour mobiliser les données dans toutes les décisions, il faut que tous les membres de votre entreprise, des pros de l’IT aux employés moins spécialisés, puissent travailler avec ces données.
  • Sécurité et conformité. Les entreprises doivent garantir la protection de leurs données contre les grandes failles qui font les unes des journaux et mettent des sociétés, des clients et même des nations en danger. Il faut donc s’assurer que votre plateforme dispose de fonctions de sécurité robustes ou d’outils qui s’intègrent à vos solutions de sécurité existantes. C’est la même chose pour la conformité : la plateforme de gestion des données doit respecter les cadres et les directives établis par les autorités de régulation du pays ou de la région où l’entreprise exerce ses activités.
  • Intelligence et automatisation. Les grandes quantités de données qui imposent le recours à une plateforme dépassent les capacités des analystes les plus dévoués. Les innovations technologiques, notamment dans le domaine du machine learning (ML) et de l’intelligence artificielle (IA), offrent aux entreprises de toutes tailles de nouveaux moyens de profiter d’informations basées sur les données.

Quel est l’avenir des plateformes de données ?

À l’avenir, les plateformes de données vont devoir gérer une augmentation de la vélocité, de la variété et du volume des données, tout en permettant à un large éventail d’utilisateurs, des data scientists aux responsables commerciaux, de mobiliser des données en temps réel pour chaque question, décision et action. Une plateforme de données doit permettre aux utilisateurs d’investiguer, de superviser et d’analyser les données, et de prendre des mesures efficaces sur la base des informations révélées.

Pour Splunk, les nouvelles technologies vont délivrer plus de données, dans davantage de formats, et les plateformes de données vont également devoir évoluer. Pour relever les défis à venir, les plateformes de données vont devoir intégrer des technologies « intelligentes » (machine learning et intelligence artificielle) pour soutenir proactivement les entreprises dans leurs objectifs liés aux données. L’approche Splunk vous permet de conjuguer les données et l’expertise de votre entreprise à de l’IA et du machine learning pour plus d’efficacité et de productivité, quels que soient le secteur d’activité, les scénarios d’utilisation et les compétences. Découvrez notre approche avec Splunk, la plateforme Data-to-Everything.

Pour résumer

Concentrez-vous sur vos besoins, pas sur les étiquettes

Face à la multiplicité des options, le choix d’une plateforme de données peut sembler impossible. Mettez de côté l’éventail du choix et les étiquettes des produits, services et solutions, et abordez la question en partant de vos besoins.

  • Sachez quels sont vos objectifs : vous devez savoir ce que vous cherchez à réaliser pour choisir une application big data. Vous ne pourrez pas satisfaire efficacement vos besoins si vous ne savez pas ce que vous cherchez à accomplir.
  • Commencez petit : concentrez-vous dans un premier temps sur un projet à petite échelle. Démontrer l’efficacité de l’utilisation d’une plateforme de gestion des données est le meilleur moyen d’encourager son adoption à plus grande échelle dans votre entreprise.
  • Voyez les choses en grand : les données recèlent une puissance extraordinaire et peuvent s’avérer utiles dans tous les domaines de l’entreprise. Veillez à ce que la plateforme que vous choisirez puisse être utilisée partout où les données peuvent être bénéfiques, dans toute votre entreprise.
  • Encouragez une culture des données : rendre l’analyse des données accessible à votre entreprise n’est qu’une partie de l’équation, vous devez également instaurer une culture qui s’appuie sur les informations extraites des données. Incitez les équipes de données et d’analyse à collaborer avec le reste de l’entreprise pour inciter les utilisateurs à rechercher leurs propres informations.