Concevoir et mettre en place une IA Responsable

Une formation complète pour développer des solutions d'intelligence artificielle éco-conçues, frugales et durables

8 Modules
1 Journée

Sommaire de la formation

Module 01

Introduction

Comprendre les enjeux de l'IA responsable et son contexte actuel

Ai-je besoin de l'IA ?

💡

Réponse courte : NON !

Réponse longue : Peut-être bien que oui, peut-être bien que non !? C'est tout l'objet de cette formation.

L'histoire de l'IA : une évolution par vagues technologiques

1950

Machine Intelligente

Turing pose les bases de l'intelligence artificielle

1956

Conférence de Dartmouth

Le terme "AI" (Artificial Intelligence) apparaît officiellement

1970-1990

Premiers projets & Systèmes experts

Applications militaires, médicales, industrielles

1996

Deep Blue

L'IA d'IBM bat Kasparov aux échecs

2000-2010

Machine Learning

Essor du ML et reconnaissance vocale

2011

Apple Siri

L'assistant vocal grand public

2022-2025

IA Générative

ChatGPT, GPT-4, GPT-5, DeepSeek... L'explosion

Glossaire

Phase d'entraînement
Moment où l'IA apprend grâce à de nombreux exemples.
Phase d'inférence
Moment où l'IA utilise ce qu'elle a appris pour produire une réponse.
Datasets
Ensembles d'exemples (textes, images, chiffres) servant à entraîner une IA.
Fine-tuning
Ajustement d'une IA déjà entraînée pour la spécialiser sur un domaine particulier.

L'explosion de la puissance des modèles

📈

Modèles de grande taille

Explosion du nombre de paramètres avec une capacité à traiter plusieurs langues, formats et tâches (modèles "multimodaux")

🔧

Généralisation des usages IA

Présence de l'IA dans les outils du quotidien, intégration dans les chaînes métiers : automatisation, aide à la décision, agents conversationnels

🏭

Effet d'industrialisation

IA intégrée massivement dans les processus industriels et commerciaux

L'hyper-croissance et la démesure

⚠️

Microsoft a annoncé en septembre 2024 le redémarrage d'une centrale nucléaire (Three Mile Island) pour alimenter ses data centers IA. Cette centrale avait connu un accident sur son réacteur Unit 2 en 1979.

Une croissance et un impact exponentiels

Consommation et impact de l'entraînement de ChatGPT

Version Consommation Équivalent CO2
GPT-3 1 300 MWh 120 foyers américains / 1 an 550 tCO2eq
GPT-4 52 000 MWh 5 000 foyers américains / 1 an 22 000 tCO2eq

Chiffres clés de l'impact

x10
Consommation énergétique d'une requête ChatGPT vs une recherche Google
📈
+15%
Augmentation annuelle de la consommation des data centers
🏠
1.6M
Foyers français équivalent à la consommation annuelle de GPT-5
💧
500ml
Eau douce évaporée pour une conversation moyenne avec ChatGPT

Rappel des impacts environnementaux du numérique

Sources d'impact

1
Fabrication des équipements

Extraction de métaux rares, assemblage et transport mondialisés, renouvellement rapide

2
Consommation énergétique

Électricité pour alimenter, refroidir, maintenir disponibles les systèmes

3
Fin de vie des équipements

Recyclage infime, métaux précieux souvent non récupérés

4%

des émissions mondiales de GES sont dues au numérique

Source : GreenIT.fr 2020

Cycle de vie d'une IA et consommation

📊

Modélisation

🎓

Entraînement

Impact élevé
🔧

Fine-tuning

🚀

Inférence

Impact récurrent
♻️

Fin de vie

Optimiser l'entraînement réduit le pic, optimiser l'inférence réduit l'impact récurrent.

Un virage nécessaire

🌱

Face à l'accélération des impacts environnementaux de l'IA moderne et au risque de non-soutenabilité, l'éco-conception devient un levier d'efficacité indispensable.

  • Réduire les besoins en données, calcul, stockage...
  • Optimiser les usages en ciblant la valeur réelle
  • Réduire la quantité des infrastructures et allonger leur durée de vie

Qu'est-ce que l'écoconception ?

L'écoconception vise à proposer des services numériques dont les impacts sur l'environnement sont réduits à chaque étape du cycle de vie. De manière plus concrète, écoconcevoir un service numérique consiste, à niveau de qualité et de service constant, à réduire la quantité de moyens matériels nécessaires à son fonctionnement.

Une exigence stratégique et réglementaire

🎯 Trajectoire Bas Carbone

Objectif de réduction de 35% des émissions à horizon 2030

  • Cartographier les services IA
  • Mesurer l'empreinte carbone
  • Analyser et mettre en œuvre des pratiques IA écoresponsables

📜 Loi REEN

Obligation pour les acteurs publics de mesurer et réduire leur empreinte numérique

Module 02

Définition du besoin & Cadrage

Évaluer la pertinence du recours à l'IA avant de se lancer

L'IA n'est jamais un objectif

💡

L'IA n'est qu'un moyen pour répondre à un besoin réel, priorisé et évalué avec les usagers.

L'IA n'est pas toujours la meilleure solution. Elle peut être coûteuse en énergie, complexe à maintenir, et parfois disproportionnée par rapport au besoin réel.

Il est donc crucial d'explorer des alternatives avant de se lancer dans un projet IA.

Les 3 étapes du cadrage

1

Comprendre le besoin utilisateur

Utiliser des méthodes comme l'UX research, les interviews ou le design thinking.

→ Quel est le besoin fondamental ?

2

Reformuler la problématique

Une bonne formulation doit :

  • Être compréhensible
  • Laisser la porte ouverte à plusieurs types de solutions
  • Être testable
3

Identifier les besoins durables

Le besoin est-il récurrent, structurant, pérenne ?

Cherchez l'erreur !

❌ Mauvaise formulation

"Il nous faut une IA de reconnaissance d'image pour détecter les défauts."

✅ Bonne formulation

"Nous voulons détecter plus tôt les défauts de fabrication pour réduire les pertes et améliorer la qualité."

Explorer les alternatives à l'IA

⚠️

L'IA n'est pas neutre écologiquement, elle implique souvent plus d'infrastructure, de calcul et de données.

Des solutions plus simples peuvent répondre aussi bien ou mieux au besoin, être plus robustes, moins coûteuses et plus rapides à déployer.

Identifier les alternatives non-IA

Logique métier

Règles déterministes (si... alors...)

RPA

Automatisation robotisée des processus

Statistiques classiques

Analyses et modèles statistiques simples

Intervention humaine

Processus manuels optimisés

S'assurer de l'alignement stratégique

Comités Produit/Data/IA

Double validation impérative

Cohérence avec les priorités du SI et des produits

Comité Éthique IA

Évaluer l'impact et les risques sociaux de la solution IA :

  • Données personnelles
  • Biais algorithmiques
  • Impact sur l'emploi

L'usage de l'IA doit être collectivement validé, pas décidé unilatéralement.

Définir des critères de frugalité

🎯

Frugalité

Volume de données utilisées, fréquence de réentraînement

Durabilité

Longévité et maintenabilité de la solution

Simplicité

Éviter la sur-ingénierie

📊

Pertinence

Adéquation au besoin réel

⚠️

Une IA mal cadrée est source de dette technique.

Arbre de décision interactif : Ai-je besoin de l'IA ?

Cliquez sur votre réponse pour découvrir la suite !

Y a-t-il un volume important d'informations, d'actions ou de données à traiter ?

1 2 3 4

🎮 Cas pratique : Projet GRAINE

Contexte métier

Sur la base lunaire Gaïa-9, l'autonomie alimentaire qui repose sur des serres cultivées est en danger !

Le besoin

Mieux anticiper les besoins des plantes en environnement instable : analyser en continu les données de culture (capteurs de sol, d'humidité, de lumière...) pour optimiser les rendements.

Analyse

✅ Arguments pour l'IA
  • L'IA détecte des signaux faibles non visibles à l'œil nu
  • Analyse des corrélations complexes multivariables
  • Objectif écologique crucial dans tel environnement
⚠️ Points de vigilance
  • Des règles métier pourraient déjà résoudre une partie du besoin
  • Les jardiniers pourraient se sentir dépossédés
  • Le cycle de décision pourrait être plus long avec des observations
Module 03

Gestion de la donnée

Qualité, quantité et réutilisation des données pour une IA frugale

L'importance de la qualité et de la quantité

🔍 Qualité des données

Une donnée de mauvaise qualité :

  • Pollue les algorithmes
  • Rallonge l'entraînement
  • Alourdit le stockage
  • Nuit à la pertinence du produit

📊 Quantité de données

Plus on stocke de données :

  • Plus d'espace mobilisé sur les serveurs
  • Plus de matériel à fabriquer
  • Plus de requêtes et transferts énergivores
  • Plus de besoins en refroidissement
💡

Réduire le volume et avoir des données propres, c'est la base de l'écoconception IA.

Réutiliser plutôt que dupliquer

Dupliquer des données alourdit inutilement les infrastructures et augmente l'empreinte carbone.

Mieux vaut réutiliser les jeux de données déjà disponibles afin de :

  • Gagner du temps
  • Éviter les erreurs
  • Réduire les coûts de stockage et de traitement

Bonnes pratiques opérationnelles

  • Utiliser des outils comme le Data Catalogue pour identifier les datasets existants
  • Favoriser la mutualisation des données entre équipes
  • Documenter les datasets pour faciliter leur réutilisation

Les questions essentielles à se poser

Est-ce que chaque donnée collectée est réellement utilisée ?

Est-ce qu'une version plus légère (résolution, fréquence, format) suffirait ?

Peut-on réduire le jeu d'apprentissage sans perdre en performance ?

Quelle est la qualité de la donnée (source, complétude, cohérence) ?

Les données sont-elles déjà disponibles ailleurs dans l'entreprise ?

Qui est en charge de la gestion des données ?

Product Owner

Valide les règles de nettoyage, arbitre les pertes de données

Dev / Tech Lead

Implémente les routines automatiques de nettoyage et de réduction

Expert Data

Analyse les impacts statistiques, propose des méthodes d'allocation

Tous

Participent à la documentation et la traçabilité des choix faits

Module 04

Optimisation des modèles

Choisir le bon modèle pour le bon usage

Les 3 niveaux de complexité des modèles IA

Niveau 1

Machine Learning traditionnel

Peu gourmand, rapide, efficace sur beaucoup de cas métiers simples

Exemples : Playlists automatiques Spotify, Classification des spams
Niveau 2

Deep Learning

Plus précis mais plus coûteux en calcul et énergie

Exemples : Filtres Instagram, Recommandations Netflix, Assistants vocaux (Siri, Alexa...)
Niveau 3

IA générative / LLM

Très gourmand, à réserver aux besoins vraiment complexes

Exemples : ChatGPT, Génération de texte, Création d'images

Arbre de décision interactif : Quel type de modèle choisir ?

Cliquez sur votre réponse pour découvrir le modèle adapté !

Votre logique métier repose-t-elle sur des règles fixes ou des décisions déterministes (si, alors...) ?

1 2 3

Découper en petits modèles dédiés

💡

Un gros modèle unique est souvent lourd et coûteux à maintenir. Découper en petits modèles dédiés réduit la consommation d'énergie et facilite la maintenance : chacun est entraîné et mis à jour sans impacter les autres.

Exemple : Assistant client

Séparez :

  • La détection d'intention (ex : classification légère)
  • La génération de réponse (ex : template ou LLM selon le cas)
  • L'extraction d'entités (ex : NER spécialisé)

L'orchestrateur de modèles

L'orchestrateur est un système d'aiguillage qui décide en temps réel quel modèle doit traiter une requête, en fonction de la complexité et des ressources disponibles.

2 approches :

Cascade de modèles

Utiliser un petit modèle d'abord, puis un plus gros si nécessaire

Routage intelligent

Diriger directement vers le modèle le plus adapté selon le contexte

Techniques d'optimisation des modèles

Quantification

Transformer la précision numérique des poids pour réduire la taille mémoire et le coût en calcul.

  • Le modèle reste identique en structure
  • Peut introduire une légère perte de précision (souvent négligeable)
  • Appliquée en post-training ou en cours d'entraînement

Distillation

Utiliser un modèle existant pour entraîner un modèle plus léger qui reproduit son comportement.

  • Le "professeur" guide l'"élève"
  • Permet d'obtenir un modèle compact et performant

Multi-Instance GPU (MIG)

Fractionner un GPU pour exécuter plusieurs tâches en parallèle, avec des ressources adaptées à la charge de chacune.

Surveillance de l'usage

Détecter les modèles et services non utilisés pour les mettre en pause et libérer les ressources.

🎮 Cas pratique : Hugging Face

Le répertoire de référence Open Source pour l'IA

📦 Modèles

Beaucoup d'entreprises, chercheurs ou associations publient leurs modèles et permettent de les télécharger.

  • Documentation technique pour chaque modèle
  • Tri par tâche et par taille
📊 Datasets

Publication des datasets d'entraînement avec possibilité de téléchargement.

  • Documentation technique
  • Tri par type de données et par taille
🧪 Spaces

Tester directement sur le site des IA publiées par la communauté.

💡 Recherchez l'outil "Ecologits" pour estimer l'impact d'une requête d'IA Générative !

Module 05

Gestion des phases d'entraînement et d'inférence

Optimiser les phases les plus énergivores du cycle de vie IA

L'entraînement est-il toujours nécessaire ?

Existe-t-il un modèle open-source ou interne pertinent ?

Le besoin utilisateur est-il satisfait par ce modèle ?

✅ Si oui aux deux

Entraînement non nécessaire

⚠️ Sinon

Entraînement à considérer avec précaution

⚠️

Une phase d'entraînement n'est pas toujours nécessaire, et son intégration doit être conditionnée à une valeur ajoutée démontrée car elle est très coûteuse en ressources.

Réutiliser un modèle existant

✅ Avantages

  • Baisse directe de l'impact carbone
  • Gain de temps
  • Qualité éprouvée

⚠️ Points de vigilance

  • Vérifier la compatibilité avec les données réelles
  • S'assurer du respect des exigences de sécurité et d'éthique
  • Évaluer le poids du modèle et privilégier une version plus légère

Stratégies d'entraînement responsable

Fine-tuning local

Adapter un modèle existant (interne ou open source) uniquement sur le jeu de données métier

Réapprentissage contrôlé

Mettre à jour le modèle sur de nouvelles données sans repartir de zéro et uniquement quand on observe une baisse de qualité (AI drift)

Quand réentraîner ?

Indicateurs déclencheurs :

📉

Dégradation d'un ou plusieurs KPI (précision, taux d'erreur, couverture)

📊

Data drift : changement statistique des données entrantes

🔄

Conceptual drift : modification dans les relations entrées/sorties

👥

Changement dans les besoins des utilisateurs

📜

Évolution réglementaire ou nouvelle politique

💬

Feedback utilisateur signalant une perte de pertinence

Techniques d'optimisation de l'entraînement

Batch training

Vitesse

Fractionner les données d'apprentissage en petits groupes (batchs) pour paralléliser les calculs et réduire les I/O.

Toujours applicable

Early stopping

Économie

Arrêter l'entraînement dès que la performance sur les données de validation cesse de s'améliorer.

Mutualisation des entraînements

Efficacité

Les clusters personnels ou dédiés sont souvent sous-utilisés. Les plateformes mutualisées permettent un meilleur rendement "impact carbone / kWh".

Créneaux d'entraînement optimisés

Green IT

Entraîner quand l'électricité est moins carbonée. L'intensité carbone varie selon les périodes et conditions météorologiques.

Optimisation de l'inférence

🗄️ Mise en cache

Mémoriser le résultat d'une prédiction pour ne pas recalculer si la même demande est répétée.

Cas d'usage :
  • Résultats de classification stables dans le temps
  • Traduction automatique pour contenus statiques

⏱️ Rafraîchissement contrôlé

Solliciter les modèles périodiquement ou uniquement si les données ont changé.

Exemples :
  • Score de risque recalculé uniquement si données modifiées
  • Recommandation personnalisée mise à jour selon un seuil

📦 Traitement par lot

Regrouper plusieurs requêtes en un seul lot pour mutualiser l'exécution.

Adapté pour :
  • Traitements asynchrones ou file d'attente
  • Services ayant une tolérance à la latence
Module 06

Infrastructure & Déploiement

Choisir les bonnes ressources pour minimiser l'impact

L'impact environnemental du cloud

L'impact environnemental du cloud varie fortement selon :

🔌 Mix énergétique

Taux d'énergies renouvelables ou bas carbone du fournisseur

📍 Localisation

Réseau électrique local, refroidissement naturel, etc.

⚡ Efficacité énergétique

PUE (Power Usage Effectiveness), modularité, refroidissement

📊 Transparence

Outils fournis pour monitorer ou optimiser l'impact

GPU vs CPU : Quel matériel pour quel usage ?

Cas d'usage Caractéristique Matériel recommandé
Entraînement Deep Learning Beaucoup de calculs à la fois, sur de grosses données GPU
Inférence rapide (chatbot, assistant vocal) Faible latence exigée, en continu GPU
Prédictions régulières non urgentes Traitements par lot, latence tolérée CPU
⚠️

Le GPU est surpuissant, mais très énergivore. À utiliser uniquement quand c'est vraiment nécessaire !

Coûts et consommation des GPU

GPU grand public (RTX)

Modèle Prix (EUR) VRAM Consommation (TDP)
RTX 6000 Ada 7 120 - 9 135 € 48 GB 300W
RTX 5000 Ada 4 097 - 5 500 € 32 GB 250W
RTX 4000 Ada 1 150 - 1 600 € 20 GB 130W

GPU datacenter (NVIDIA)

Modèle Prix (EUR) VRAM Consommation (TDP) Usage principal
B200 SXM 42 000 - 47 000 € 192 GB HBM3e 1000W Training massif
H200 SXM 28 000 - 37 000 € 141 GB HBM3e 700W LLM très larges
H100 SXM 25 000 - 40 000 € 80 GB HBM3 700W Training & inférence
Module 07

Mesurer et piloter l'impact carbone

On ne peut pas améliorer ce qu'on ne mesure pas

Pourquoi mesurer ?

Mesurer l'impact d'un service IA permet de :

🔍

Identifier les leviers d'optimisation sur tout le cycle de vie

👁️

Favoriser la transparence auprès des parties prenantes (métier, IT, RSE...)

🎯

Soutenir des décisions produit alignées avec les engagements environnementaux

Les deux dimensions de l'impact

🏭 Impact fabrication

40 à 60% de l'impact total d'un service numérique

Correspond à l'extraction des matières premières, la production, l'assemblage, le transport et la fin de vie de :

  • PCB, CPU, GPU, RAM
  • Systèmes de stockage (disques durs, SSD)
  • Systèmes de refroidissement
  • Réseaux, routeurs, câblages
  • Datacenters (bâtiment, climatisation...)

⚡ Impact usage

Consommation énergétique des serveurs

  • Reflète l'effort pour chaque inférence ou réentraînement
  • Les composants les plus consommateurs : CPU et GPU
  • Taille du modèle
  • Fréquence des requêtes

Les métriques clés

kWh Consommation électrique
tCO2eq Émissions de gaz à effet de serre
Consommation d'eau
kgSbeq Épuisement des ressources

Exemple d'impact : Mistral AI (18 mois)

20 400 tCO2eq
281 000 m³ d'eau
660 kgSbeq
Source : Mistral report & Mistral News

Outils de mesure

💡

La mesure de l'impact environnemental d'une IA est un exercice complexe. Cette formation vous donne des repères pour comprendre les grands leviers, mais la mesure fine reste le rôle d'experts car elle nécessite des données précises et une méthodologie rigoureuse.

Types d'outils disponibles

  • Calculettes d'empreinte carbone - Pour estimer l'impact d'un service IA
  • Outils de monitoring GPU/CPU - Pour mesurer la consommation en temps réel
  • Ecologits (Hugging Face) - Pour estimer l'impact d'une requête d'IA Générative

🎮 Cas pratique : Estimer l'impact d'un projet IA

Cluster GPU fictif : FAB-IA-01

GPUs

2 GPU V100 + 4 GPU A100

CPUs

100 vCPU (AMD EPIC Zen 2)

RAM

1.2 To

Stockage

10 To SSD

Services du projet ABC

Service de défloutage 5 Pods (10 Go RAM + 10 vCPU chacun)
Service de classification 15 Pods (4 Go RAM + 2 vCPU chacun)
Service d'OCR 30 Pods (8 Go RAM + 6 vCPU chacun)
Service d'extraction de mots clés 10 Pods (4 Go RAM + 2 vCPU chacun)
Module 08

Gestion de la fin de vie

Anticiper et gérer la fin de vie des services IA

Pourquoi planifier la fin de vie ?

⚠️

La frugalité doit couvrir toutes les étapes du cycle de vie. Une IA inutilisée continue de consommer et de complexifier l'écosystème.

Elle doit être abordée comme une vraie étape projet, avec des responsabilités claires et des décisions à documenter.

Risques si on ne prévoit pas la fin de vie :

  • Coûts d'infrastructure maintenus inutilement
  • Dette technique croissante
  • Confusion dans l'écosystème applicatif
  • Données non archivées ou perdues

Les 3 étapes de la fin de vie

1

Désactivation du service IA

  • Ajouter dans la backlog une étape de désactivation planifiée (date ou critère métier)
  • Préciser les modalités de coupure (arrêt des containers, suppression de l'instance cloud...)
  • Communiquer auprès des utilisateurs
2

Nettoyage ou archivage des modèles

  • Mettre en place une politique de rétention (ex : conserver 1 an puis archiver)
  • Documenter les modèles pour réutilisation future éventuelle
3

Revue critique des datasets

  • Identifier les données à conserver, archiver ou supprimer
  • Respecter les obligations RGPD

Donner une seconde vie aux modèles

Les modèles d'IA peuvent enrichir une bibliothèque interne partagée entre les collaborateurs.

À terme, les modèles pourront également avoir une seconde vie avec l'open-source, mais attention aux exigences de conformité au RGPD et de protection des données personnelles.

Conclusion

Les objectifs de cette formation

🎯
Cadrer

Un projet d'IA de manière responsable en intégrant des critères de sobriété, d'utilité et d'impact environnemental

💡
Concevoir

Des solutions IA frugales en limitant la volumétrie des données

⚖️
Choisir

Des modèles d'IA sobres et adaptés en arbitrant entre performance, complexité et coût énergétique

📉
Réduire

L'impact environnemental des phases d'entraînement et d'inférence

♻️
Anticiper

La fin de vie des services IA

Ressources pour aller plus loin

Passez à l'action !

Cette formation vous a donné les clés pour concevoir et mettre en place une IA responsable. Il est maintenant temps de les appliquer dans vos projets.