INDUSTRIES

[PODCAST] Vers une data responsable : les enjeux écologiques

En France, le numérique est responsable de 10 % de la consommation électrique et de 2,5 % de l’empreinte carbone, et la situation n’est pas près de s’arranger ! Car, malgré les accords de Paris et le Pacte vert, les prévisions ne sont pas vraiment optimistes. D’après un rapport de la Commission européenne publié en 2020, notre consommation devrait encore augmenter de 25 % d’ici 2025.

Dans ce contexte d’urgence climatique, les données sont souvent accusées de participer au problème, sans égard pour le rôle qu’elles peuvent jouer dans sa résolution. C’est justement l'un des enjeux soulevé par les actrices et les acteurs de la data interviewés dans notre podcast Étant Données. D'eux de nos invités de la première saison, Chafika Chettaoui, Group Chief Data Officer chez SUEZ et Ludovic Donati, Directeur de la Transformation Numérique et de la Performance chez Eramet, ont accepté de répondre aux questions du journaliste Bertrand Lenotre à ce sujet, lors d’un événement enregistré en public.

 

 

Les data centers : vrai problème ou faux débat

La forte consommation énergétique des data centers est régulièrement prise pour cible, à tel point qu’on en oublierait presque tout ce qu’ils rendent possible. Autrement dit, on doit parfois faire face à un public qui regarde notre doigt quand on lui montre la lune, et ce n’est pas forcément la meilleure façon d’aller de l’avant. Car la data et la puissance de calcul, ce sont aussi de potentielles solutions si on en fait bon usage, mais leur impact bénéfique sur l’environnement est rarement pris en compte.

Prenons l’exemple du secteur minier et métallurgique, très gourmand en énergie. Comme l’explique Ludovic Donati, dans de nombreux cas, l’usage de la donnée permet d’optimiser les processus de production ainsi que la consommation énergétique, et la balance bénéfices-coûts est souvent largement positive, notamment dans l’industrie lourde. Utilisée de manière raisonnée, la data est donc bien plus susceptible de faire partie de la solution que du problème. Mais pour s’en assurer, encore faut-il se doter d’instruments de mesure prenant en compte l’impact environnemental de nos activités ; les « business cases » sont déjà entrés dans les mœurs, à quand les « environment cases » ?

Il faut aussi s’interroger sur le stockage de cette data afin d’en minimiser l’impact géographique. Un grand nombre d’informations peuvent en effet être traitées localement. Pour les autres, il peut être judicieux de récupérer les données consolidées en fonction de cas d’usages précis plutôt que de déplacer des masses de données brutes, par exemple.

La question du traitement des données

Même s’il reste du chemin à faire, le secteur a largement gagné en maturité dans ce domaine. Il y a encore cinq ou dix ans, la mode était en effet aux data lakes ; il fallait stocker les données coûte que coûte, au cas où elles pourraient servir à l’avenir. Heureusement, les entreprises ont fini par se rendre compte que cette approche était très coûteuse et souvent peu pertinente, d’abord d’un point de vue financier, mais aussi d’un point de vue environnemental.

C’est à ce moment-là que les Chief Data Officers (CDO) ont fait leur apparition, afin de pousser les organisations à utiliser la donnée de manière plus responsable. Aujourd’hui, les bonnes pratiques ne consistent plus à remplir des data lakes, mais plutôt à alimenter les systèmes d’information en fonction des cas d’usage. Et cette démarche usage-driven change vraiment la donne.

C’est d’ailleurs le choix qu’a fait Eramet en orientant sa stratégie autour d’une question centrale : comment les algorithmes d’intelligence artificielle peuvent-ils contribuer à optimiser la production d’informations métallurgiques et la gestion des mines ? Une attitude pragmatique, qui a permis au groupe de trouver des solutions concrètes et efficaces.

Par exemple, l’entreprise s’est dotée de drones, qui lui permettent de récupérer suffisamment de données pour qu’un grand nombre de personnes puissent accéder, en quelques clics, à l’état des stocks et des routes ou à l’historique de l’extraction des minerais. Cette data était déjà utilisée pour répondre à des enjeux environnementaux ou à des problématiques de sécurité, mais Eramet a voulu aller plus loin en cherchant un équilibre optimal entre le besoin d’informations et l’impact écologique de ces pratiques. En d’autres termes, la question n’est plus de savoir si les données pourront se révéler utiles, mais comment et à quelle fréquence les collecter pour atteindre ses objectifs, tout en ayant une gestion la plus responsable possible.

Répondre aux enjeux environnementaux grâce à la data

La data serait-elle donc la clé pour résoudre tous les problèmes écologiques ? Comme l’explique Chafika Chettaoui, c’est en tout cas un allié de taille pour prédire les fuites d’eau, améliorer la maintenance des systèmes de traitement et d’approvisionnement ou aider les opérateurs à optimiser le recyclage. Dans ce secteur, la plupart des cas d’usage ont ainsi un impact direct sur l’environnement.

Mais l’industrie peut, elle aussi, réduire son empreinte carbone grâce au potentiel des données. C’est notamment le cas d’Eramet, qui utilise ses drones pour revégétaliser les zones minières après leur exploitation ou aider à la relocalisation des populations lorsque cela se révèle pertinent. Des capteurs ont également permis au groupe de mettre au point des algorithmes capables d’optimiser la quantité d’énergie nécessaire pour fondre le minerai, ce qui représente une diminution de 3 à 4 % de la consommation de ses fours métallurgiques.

Green IT for data ou Data for Green

Selon Chafika Chettaoui, cette distinction est essentielle, car elle nous permet de prendre de la distance avec la vision catastrophiste du numérique et de recentrer le débat sur la question la plus importante : comment la data peut-elle avoir des répercussions positives sur l’environnement ? C’est pour cette raison que Suez a décidé de se concentrer sur le Data for Green, sans pour autant laisser de côté le Green IT.

Et cette réflexion s’étend bien au-delà du contexte local. De nombreux professionnels se regroupent en effet pour mettre au point des outils permettant d’évaluer les conséquences écologiques de nos activités économiques. Par exemple, la French Tech Corporate Community a mis en place une première version de simulateur d’impact environnemental du numérique. Avant de lancer un projet de transformation digitale, il sera donc bientôt possible de mettre en perspective les résultats attendus avec le coût de ces décisions sur les émissions carbone, la consommation d’eau et la biodiversité. On constate d’ailleurs que, lorsqu’elle est bien utilisée, la data contribue déjà de manière positive à l’environnement, en tout cas dans l’industrie. 

Construire une éthique commune de la data

Pour Chafika Chettaoui, un usage responsable du numérique doit par ailleurs être gouverné. Il faut en effet éviter que chaque data scientist ne travaille dans son coin, sans réellement questionner ses pratiques. C’est justement l’objectif de la plateforme que Suez a créée en collaboration avec Microsoft : inclure les partenaires dans le processus de gouvernance sur l’usage de l’IA et de la data au sein du groupe.

Concrètement, cela signifie de vérifier en amont si l’algorithme auquel on s’intéresse a déjà été développé. Cet outil permet aussi de confronter les points de vue, afin de s’assurer que le cas d’usage concerné est pertinent, qu’il ne risque pas d’avoir un impact négatif sur l’environnement et qu’il est susceptible d’être réellement mis en œuvre. Ce sont des choses très factuelles que toutes les entreprises peuvent mettre en place.

Il faut également prêter attention au Green Washing et parfois confronter les fournisseurs dans ce domaine, sans pour autant oublier que nous traversons une période de transition. Les solutions ne sont donc pas forcément au point, mais il revient à chacun de s’assurer que l’ensemble de la chaîne avance dans le bon sens.

Développer une véritable culture de la data

Pour qu’une entreprise parviennent à faire un usage vraiment responsable de la data, il faut que l’ensemble des acteurs soient engagés dans le processus, du comité exécutif aux opérateurs, en passant par le middle management et les data scientists. Il revient donc au CDO de mettre en place des plans de formation pour sensibiliser tous les collaborateurs concernés aux impacts positifs et négatifs de l’IA et de la data.

Il faut notamment faire passer le message que ces outils ne sont pas des baguettes magiques capables de répondre à tous les besoins et à tous les problèmes. C’est aussi l’occasion d’aborder les questions d’éthique ainsi que la responsabilité environnementale et sociétale de l’entreprise. Au-delà du ROI, il est en effet essentiel que nous nous interrogions sur ces problématiques dorénavant incontournables :

  • L’algorithme respecte-t-il la vie privée de l’utilisateur ?
  • Les répercussions du cas d’usage permettront-elles de compenser son impact carbone ?
  • Des mesures sont-elles prévues pour accompagner les opérateurs dont le poste est susceptible d’être modifié ou supprimé ?

La tâche n’est pas simple, car dans certains secteurs, il est parfois très difficile de faire évoluer les pratiques. L’idée de s’appuyer sur des données pour développer des cas d’usage et optimiser la gestion de l’entreprise n’est en effet pas toujours évidente, notamment dans des entreprises très anciennes. Mais ces trois dimensions doivent être intégrées à chaque projet si nous voulons vraiment pouvoir parler de data responsable, et la formation a un rôle crucial à jouer dans ce domaine. 

Mesurer l’impact environnemental de nos activités numériques

Amélioration rime généralement avec évaluation. Il est donc essentiel de nous accorder sur un certain nombre de métriques communes, même si la tâche est loin d’être simple. Le système ne sera certainement pas parfait au début, mais les entreprises doivent absolument mettre en place des checklists si elles veulent s’assurer d’aller dans le bon sens. Et il est possible de commencer par des choses très simples et pragmatiques :

  • Quel est le coût de développement du projet ?
  • Quelle est l’estimation de l’empreinte carbone ?
  • Combien de lignes de codes sont-elles nécessaires ?
  • Y a-t-il eu des modifications ?

Ces outils sont indispensables pour développer une gestion plus responsable de la data et éviter tout autant le green washing que les discours irréalistes sur l’IA. Pour aller plus loin, je vous invite d'ailleurs à lire cet autre article de mon collègue Ewald Munz, qui explique comment le Sustainability Toolkit de Splunk vous aide à acquérir une vision d’ensemble et obtenir des informations détaillées sur votre empreinte carbone, afin de respecter les nouveaux impératifs de durabilité.


Vous voulez en savoir plus sur l’avenir de la data ? Découvrez la vision de dix acteurs majeurs du secteur dans notre podcast La data du futur et téléchargez notre e-book hors-série dédié à La data responsable.

 

Audrey est senior content marketing manager sur les marchés francophones. Elle est responsable de la création et la localisation en français de tout le contenu de Splunk, des réseaux sociaux au blog en passant par les réussites de nos clients ou les livres blancs. Avant Splunk, Audrey a entre autres travaillé chez VMware, Facebook, Neopost, Sanofi ou encore la SNCF. Passionnée par l’écriture, elle tient depuis des années un blog culture, Digression Urbaine.