Vers un référentiel d’écoconception Data : relever le défi d’une donnée responsable et durable

18 septembre 2025
Raphaël Thébaud Raphaël Thébaud

Face à l’urgence climatique, l’écoconception des projets data n’est plus une option, mais une nécessité. Cet article explore les défis spécifiques à l’écoconception des projets data et propose des pistes pour la création d’un référentiel de bonnes pratiques.

J-13

Big Data & AI 2025

Paris 01 Oct 2025 08h30 – 19h00
S'inscrire

L’urgence d’une donnée responsable

La Data, l’IA et l’analyse de données sont au cœur de la transformation numérique, impactant tous les secteurs d’activité. Cependant, cette révolution data engendre un coût environnemental souvent sous-estimé. La croissance exponentielle du volume de données, la complexité croissante des algorithmes et l’infrastructure massive nécessaire à leur traitement contribuent à une augmentation significative de la consommation en ressources du numérique.

Vers un référentiel d’écoconception Data : relever le défi d'une donnée responsable et durable

Écoconception : Contexte & définitions

L’écoconception vise à prendre en compte les aspects environnementaux lors de la conception et la création d’un bien ou d’un service.

Toutes les étapes du cycle de vie doivent être couvertes. Dans le cadre d’un service numérique, on appliquera ainsi ces principes lors de la conception, de la réalisation, du déploiement, du run, de la maintenance, mais aussi du décommissionnement.

Derrière le terme projet data, on englobera tout projet de mise en œuvre d’un service numérique manipulant et stockant un gros volume de données, qu’il s’agisse de Business Intelligence, d’EPM, de Big Data ou encore de MDM.

Appliquée aux projets data, l’écoconception englobe toutes les étapes, de la collecte des données à leur visualisation, en passant par leur stockage, leur traitement et leur analyse sans oublier l’archivage et la suppression.

La data, angle mort de l’écoconception numérique

Bien que le RGESN (Référentiel Général d’Écoconception de Services Numériques) offre un cadre méthodologique général, il peine à répondre aux problématiques spécifiques des projets data.

En effet, le référentiel de l’État est par nature généraliste et offre donc peu de solutions techniques spécifiques (même s’il y a eu une nette amélioration dans sa 2eme version de mai 2024).

Il propose de nombreuses règles centrées sur l’expérience utilisateur et le frontend, le rendant en partie non applicable pour des projets où l’infrastructure backend, le traitement des données et les algorithmes sont les principaux contributeurs à l’empreinte environnementale.

Les projets data se retrouvent donc mal représentés dans cet héritage Web.

Les études montrent que les terminaux utilisateur représentent une part très significative de l’empreinte environnementale du numérique.

Cependant, lorsque l’on regarde un projet décisionnel, est-ce réellement toujours le cas ? Peut-on appliquer les mêmes abaques à un logiciel qui brasse des millions de lignes de données pour afficher un chiffre consulté par 3 utilisateurs chaque mois qu’à un site e-commerce grand public ?

Intuitivement la réponse est non. Encore faut-il le démontrer.

Puis, une fois les hypothèses posées, quels outils fournir aux équipes techniques ? Quelles sont les pratiques à fort impact ? Comment prioriser les actions d’écoconception ?

Livre blanc

Comment utiliser le FinOps pour améliorer l’empreinte carbone du SI ?

Télécharger

Pourquoi les outils de mesure d’impact ne sont pas d’un grand secours ?

La mesure d’impact environnemental du numérique est un sujet complexe. Un service numérique implique des composantes logicielles, matérielles et des infrastructures physiques qu’il faut prendre en compte à chaque étape du cycle de vie.

Si on schématise, toute architecture Web peut être répartie en 3 couches :

  • Les terminaux : ici on va retrouver les PC et smartphones des utilisateurs mais aussi les périphériques associés : écrans, clavier, souris, imprimante, jusqu’à la box.
  • Le réseau : c’est la partie la plus nébuleuse pour le grand public, elle regroupe des antennes relais, de la fibre optique, du câble, des switchs, des routeurs, des multiplexeurs (DSLAM), etc.
  • Les serveurs : chargés d’héberger et d’opérer les services, ils sont regroupés au sein de data centers. De plus en plus souvent virtualisés, le lien entre serveur logique et machine physique n’est pas toujours simple. Du point de vue environnemental on s’intéresse aux machines et aux infrastructures physiques ainsi qu’à leur efficacité énergétique.

Il est impossible de maîtriser avec exactitude le matériel utilisé par les utilisateurs, trop volatile, en particulier dans un contexte grand public.

Quant aux infrastructures réseau sollicitées à chaque requête la nature même du protocole IP ne permet pas de tracer un chemin unique pour tenter de les identifier et de les cartographier.

La partie serveur qu’on pourrait penser plus « captive » devient elle-même impossible à monitorer à l’ère des architectures distribuées et du cloud. On dépend des informations (pas toujours complètement transparentes) fournies par les cloud providers.

Il faut ainsi accepter qu’il demeure des approximations, l’essentiel étant :

  • De considérer l’ensemble du cycle de vie du service, de la fabrication au décommissionnement
  • D’adopter une démarche sincère en essayant de prendre en compte l’ensemble des infrastructures sollicitées
  • De prendre en compte les différents facteurs d’impact environnementaux (et pas uniquement le commode équivalent CO2)

On peut séparer les outils à notre disposition en 2 grandes familles :

  • Les outils de mesure (PowerAPI, CodeCarbon, etc.) vont par exemple être capable de calculer la consommation électrique d’un serveur lors de son utilisation pour en déduire un impact environnemental en fonction d’un mix énergétique. Ces outils offrent une vision fiable mais sur une partie du périmètre uniquement et sont difficilement utilisable par les data engenieer et développeurs en phase de conception et de build.
  • Les outils de modélisation (GreenIt Analysis, CO2.js, etc.) sont des algorithmes capables d’estimer des impacts environnementaux globaux à partir de données fournies en entrée (volume de données, nombre de requêtes, nombre de serveurs, consommation électrique, etc.). Malheureusement, les modèles les plus avancés à ce jour ont été conçu pour des sites Web et sont peu pertinents dans le contexte qui nous intéresse.

Créer un référentiel de bonnes pratiques d’écoconception

Il y a un célèbre adage qui dit : « On ne peut pas améliorer ce qu’on ne peut pas mesurer ! », est-ce pour autant qu’il faut baisser les bras et ne rien faire ?

Un certain nombre d’informations chiffrées (études, mesures de performances, ACV) permettent de faire des choix pragmatiques en faveur d’un numérique plus respectueux de l’environnement.

Raphaël Thébaud

Si l’on admet qu’on n’est pas en capacité de mesurer avec exactitude, et surtout dans un effort raisonnable, les impacts environnementaux d’un projet data, comment faire en sorte de les minimiser ?

Bien que le problème puisse sembler inextricable à première vue, nous disposons d’un certain nombre d’informations chiffrées (études, mesures de performances, ACV) permettant de faire des choix pragmatiques en faveur d’un numérique plus respectueux de l’environnement.

L’enjeu est d’imaginer un référentiel de bonnes pratiques d’écoconception applicable aux projets data en s’appuyant sur des outils imparfaits (mais pas non plus sur des intuitions hors sol !). Il y a avant tout un enjeu culturel, de conduite du changement à amener des démarches de sobriété sur le terrain de la data.

Tout d’abord, ce n’est pas parce qu’on ne peut pas tout mesurer que l’on ne peut rien mesurer !

  • Il est toujours possible de mesurer une partie des impacts
  • Il est aussi possible de prototyper sur des environnements maîtrisés, mesurables et de raisonner par extrapolation.

Prenons un exemple : si je sais mesurer qu’une brique logicielle A consomme moins d’énergie qu’une brique logicielle B sur un banc d’essai bien pensé, je pourrai sans doute raisonnablement affirmer qu’il faut privilégier la brique A à la brique B dans un autre contexte d’exécution ?

Ce ne sera peut-être pas le cas dans 100% des situations, cependant ce qui va nous intéresser pour un référentiel de bonnes pratiques c’est que cela fonctionne dans le cas général.

L’objectif est de fournir un cadre aux équipes de réalisation qu’elles puissent largement adopter pour améliorer leurs pratiques au quotidien et contribuer à une évolution positive du métier.

Les experts les plus pointus seront toujours indispensables pour traiter les cas les plus complexes.

Un enjeu collectif pour un futur durable

L’écoconception des projets data est un défi majeur qui nécessite une mobilisation collective. Chercheurs, ingénieurs, data scientists, décideurs et utilisateurs doivent collaborer pour développer des solutions innovantes et responsables.

Chez Orange Business, nous avons décidé d’agir en mobilisant une équipe mixte d’expert(e)s de la Data et d’expert(e)s de l’écoconception pour proposer des bonnes pratiques d’écoconception de projets Data et enrichir les outils existants.

En confrontant les bonnes pratiques d’optimisation maîtrisées par nos experts aux données issues d’études, nous avons posé les bases d’un référentiel d’écoconception lisible par les équipes data et précisant le cadre RGESN.

Certaines bonnes pratiques nécessitent d’être documentées et validées avec une vraie approche scientifique avant de pouvoir être communiquées. C’est un véritable travail de recherche qui attend notre groupe de travail et nous souhaitons le mener avec rigueur et sincérité.

À bientôt pour les premiers résultats…

Raphaël Thébaud Raphaël Thébaud Responsable de pôle digital – Conseil & Expertise Orange Business

Avec plus de 20 ans d’expérience dans le domaine des solutions digitales, Raphaël Thébaud est expert chez Orange Business. Il accompagne les entreprises sur leur écosystème digital en élaborant des solutions innovantes, adaptées à leurs besoins spécifiques avec un savoir-faire particulier autour du Numérique Responsable.

Tous les articles de Raphaël Thébaud

Commentaire (0)

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Votre adresse de messagerie est uniquement utilisée par Orange Business, responsable de traitement, aux fins de traitement de votre demande et d’envoi de toute communication de Orange Business en relation avec votre demande uniquement. En savoir plus sur la gestion de vos données et vos droits.

Découvrez aussi