Module 01

Introduction

Comprendre les enjeux de l'IA responsable et son contexte actuel

Ai-je besoin de l'IA ?

💡

Réponse courte : NON !

Réponse longue : Peut-être bien que oui, peut-être bien que non !? C'est tout l'objet de cette formation.

L'histoire de l'IA : une évolution par vagues technologiques

1950

Machine Intelligente

Turing pose les bases de l'intelligence artificielle

1956

Conférence de Dartmouth

Le terme "AI" (Artificial Intelligence) apparaît officiellement

1970-1990

Premiers projets & Systèmes experts

Applications militaires, médicales, industrielles

1996

Deep Blue

L'IA d'IBM bat Kasparov aux échecs

2000-2010

Machine Learning

Essor du ML et reconnaissance vocale

2011

Apple Siri

L'assistant vocal grand public

2022-2025

IA Générative

ChatGPT, GPT-4, GPT-5, DeepSeek... L'explosion

Glossaire

Phase d'entraînement: Moment où l'IA apprend grâce à de nombreux exemples.
Phase d'inférence: Moment où l'IA utilise ce qu'elle a appris pour produire une réponse.
Datasets: Ensembles d'exemples (textes, images, chiffres) servant à entraîner une IA.
Fine-tuning: Ajustement d'une IA déjà entraînée pour la spécialiser sur un domaine particulier.

L'explosion de la puissance des modèles

📈

Modèles de grande taille

Explosion du nombre de paramètres avec une capacité à traiter plusieurs langues, formats et tâches (modèles "multimodaux")

🔧

Généralisation des usages IA

Présence de l'IA dans les outils du quotidien, intégration dans les chaînes métiers : automatisation, aide à la décision, agents conversationnels

🏭

Effet d'industrialisation

IA intégrée massivement dans les processus industriels et commerciaux

L'hyper-croissance et la démesure

⚠️

Microsoft a annoncé en septembre 2024 le redémarrage d'une centrale nucléaire (Three Mile Island) pour alimenter ses data centers IA. Cette centrale avait connu un accident sur son réacteur Unit 2 en 1979.

Une croissance et un impact exponentiels

Consommation et impact de l'entraînement de ChatGPT

Version	Consommation	Équivalent	CO2
GPT-3	1 300 MWh	120 foyers américains / 1 an	550 tCO2eq
GPT-4	52 000 MWh	5 000 foyers américains / 1 an	22 000 tCO2eq

Chiffres clés de l'impact

⚡

x10

Consommation énergétique d'une requête ChatGPT vs une recherche Google

📈

+15%

Augmentation annuelle de la consommation des data centers

🏠

1.6M

Foyers français équivalent à la consommation annuelle de GPT-5

💧

500ml

Eau douce évaporée pour une conversation moyenne avec ChatGPT

Rappel des impacts environnementaux du numérique

Sources d'impact

Fabrication des équipements

Extraction de métaux rares, assemblage et transport mondialisés, renouvellement rapide

Consommation énergétique

Électricité pour alimenter, refroidir, maintenir disponibles les systèmes

Fin de vie des équipements

Recyclage infime, métaux précieux souvent non récupérés

des émissions mondiales de GES sont dues au numérique

Source : GreenIT.fr 2020

Cycle de vie d'une IA et consommation

📊

Modélisation

→

🎓

Entraînement

Impact élevé

→

🔧

Fine-tuning

→

🚀

Inférence

Impact récurrent

→

♻️

Fin de vie

Optimiser l'entraînement réduit le pic, optimiser l'inférence réduit l'impact récurrent.

Un virage nécessaire

🌱

Face à l'accélération des impacts environnementaux de l'IA moderne et au risque de non-soutenabilité, l'éco-conception devient un levier d'efficacité indispensable.

Réduire les besoins en données, calcul, stockage...
Optimiser les usages en ciblant la valeur réelle
Réduire la quantité des infrastructures et allonger leur durée de vie

Qu'est-ce que l'écoconception ?

L'écoconception vise à proposer des services numériques dont les impacts sur l'environnement sont réduits à chaque étape du cycle de vie. De manière plus concrète, écoconcevoir un service numérique consiste, à niveau de qualité et de service constant, à réduire la quantité de moyens matériels nécessaires à son fonctionnement.

Une exigence stratégique et réglementaire

🎯 Trajectoire Bas Carbone

Objectif de réduction de 35% des émissions à horizon 2030

Cartographier les services IA
Mesurer l'empreinte carbone
Analyser et mettre en œuvre des pratiques IA écoresponsables

📜 Loi REEN

Obligation pour les acteurs publics de mesurer et réduire leur empreinte numérique

Module 02

Définition du besoin & Cadrage

Évaluer la pertinence du recours à l'IA avant de se lancer

L'IA n'est jamais un objectif

💡

L'IA n'est qu'un moyen pour répondre à un besoin réel, priorisé et évalué avec les usagers.

L'IA n'est pas toujours la meilleure solution. Elle peut être coûteuse en énergie, complexe à maintenir, et parfois disproportionnée par rapport au besoin réel.

Il est donc crucial d'explorer des alternatives avant de se lancer dans un projet IA.

Les 3 étapes du cadrage

Comprendre le besoin utilisateur

Utiliser des méthodes comme l'UX research, les interviews ou le design thinking.

→ Quel est le besoin fondamental ?

Reformuler la problématique

Une bonne formulation doit :

Être compréhensible
Laisser la porte ouverte à plusieurs types de solutions
Être testable

Identifier les besoins durables

Le besoin est-il récurrent, structurant, pérenne ?

Cherchez l'erreur !

❌ Mauvaise formulation

"Il nous faut une IA de reconnaissance d'image pour détecter les défauts."

✅ Bonne formulation

"Nous voulons détecter plus tôt les défauts de fabrication pour réduire les pertes et améliorer la qualité."

Explorer les alternatives à l'IA

⚠️

L'IA n'est pas neutre écologiquement, elle implique souvent plus d'infrastructure, de calcul et de données.

Des solutions plus simples peuvent répondre aussi bien ou mieux au besoin, être plus robustes, moins coûteuses et plus rapides à déployer.

Identifier les alternatives non-IA

Logique métier

Règles déterministes (si... alors...)

RPA

Automatisation robotisée des processus

Statistiques classiques

Analyses et modèles statistiques simples

Intervention humaine

Processus manuels optimisés

S'assurer de l'alignement stratégique

Comités Produit/Data/IA

Double validation impérative

Cohérence avec les priorités du SI et des produits

Comité Éthique IA

Évaluer l'impact et les risques sociaux de la solution IA :

Données personnelles
Biais algorithmiques
Impact sur l'emploi

L'usage de l'IA doit être collectivement validé, pas décidé unilatéralement.

Définir des critères de frugalité

🎯

Frugalité

Volume de données utilisées, fréquence de réentraînement

⏳

Durabilité

Longévité et maintenabilité de la solution

✨

Simplicité

Éviter la sur-ingénierie

📊

Pertinence

Adéquation au besoin réel

⚠️

Une IA mal cadrée est source de dette technique.

Arbre de décision interactif : Ai-je besoin de l'IA ?

Cliquez sur votre réponse pour découvrir la suite !

Y a-t-il un volume important d'informations, d'actions ou de données à traiter ?

1 2 3 4

🎮 Cas pratique : Projet GRAINE

Contexte métier

Sur la base lunaire Gaïa-9, l'autonomie alimentaire qui repose sur des serres cultivées est en danger !

Le besoin

Mieux anticiper les besoins des plantes en environnement instable : analyser en continu les données de culture (capteurs de sol, d'humidité, de lumière...) pour optimiser les rendements.

Analyse

✅ Arguments pour l'IA

L'IA détecte des signaux faibles non visibles à l'œil nu
Analyse des corrélations complexes multivariables
Objectif écologique crucial dans tel environnement

⚠️ Points de vigilance

Des règles métier pourraient déjà résoudre une partie du besoin
Les jardiniers pourraient se sentir dépossédés
Le cycle de décision pourrait être plus long avec des observations

Module 03

Gestion de la donnée

Qualité, quantité et réutilisation des données pour une IA frugale

L'importance de la qualité et de la quantité

🔍 Qualité des données

Une donnée de mauvaise qualité :

Pollue les algorithmes
Rallonge l'entraînement
Alourdit le stockage
Nuit à la pertinence du produit

📊 Quantité de données

Plus on stocke de données :

Plus d'espace mobilisé sur les serveurs
Plus de matériel à fabriquer
Plus de requêtes et transferts énergivores
Plus de besoins en refroidissement

💡

Réduire le volume et avoir des données propres, c'est la base de l'écoconception IA.

Réutiliser plutôt que dupliquer

Dupliquer des données alourdit inutilement les infrastructures et augmente l'empreinte carbone.

Mieux vaut réutiliser les jeux de données déjà disponibles afin de :

Gagner du temps
Éviter les erreurs
Réduire les coûts de stockage et de traitement

Bonnes pratiques opérationnelles

Utiliser des outils comme le Data Catalogue pour identifier les datasets existants
Favoriser la mutualisation des données entre équipes
Documenter les datasets pour faciliter leur réutilisation

Les questions essentielles à se poser

❓

Est-ce que chaque donnée collectée est réellement utilisée ?

❓

Est-ce qu'une version plus légère (résolution, fréquence, format) suffirait ?

❓

Peut-on réduire le jeu d'apprentissage sans perdre en performance ?

❓

Quelle est la qualité de la donnée (source, complétude, cohérence) ?

❓

Les données sont-elles déjà disponibles ailleurs dans l'entreprise ?

Qui est en charge de la gestion des données ?

Product Owner

Valide les règles de nettoyage, arbitre les pertes de données

Dev / Tech Lead

Implémente les routines automatiques de nettoyage et de réduction

Expert Data

Analyse les impacts statistiques, propose des méthodes d'allocation

Tous

Participent à la documentation et la traçabilité des choix faits

Module 04

Optimisation des modèles

Choisir le bon modèle pour le bon usage

Les 3 niveaux de complexité des modèles IA

Niveau 1

Machine Learning traditionnel

Peu gourmand, rapide, efficace sur beaucoup de cas métiers simples

Exemples : Playlists automatiques Spotify, Classification des spams

Niveau 2

Deep Learning

Plus précis mais plus coûteux en calcul et énergie

Exemples : Filtres Instagram, Recommandations Netflix, Assistants vocaux (Siri, Alexa...)

Niveau 3

IA générative / LLM

Très gourmand, à réserver aux besoins vraiment complexes

Exemples : ChatGPT, Génération de texte, Création d'images

Arbre de décision interactif : Quel type de modèle choisir ?

Cliquez sur votre réponse pour découvrir le modèle adapté !

Votre logique métier repose-t-elle sur des règles fixes ou des décisions déterministes (si, alors...) ?

1 2 3

Découper en petits modèles dédiés

💡

Un gros modèle unique est souvent lourd et coûteux à maintenir. Découper en petits modèles dédiés réduit la consommation d'énergie et facilite la maintenance : chacun est entraîné et mis à jour sans impacter les autres.

Exemple : Assistant client

Séparez :

La détection d'intention (ex : classification légère)
La génération de réponse (ex : template ou LLM selon le cas)
L'extraction d'entités (ex : NER spécialisé)

L'orchestrateur de modèles

L'orchestrateur est un système d'aiguillage qui décide en temps réel quel modèle doit traiter une requête, en fonction de la complexité et des ressources disponibles.

2 approches :

Cascade de modèles

Utiliser un petit modèle d'abord, puis un plus gros si nécessaire

Routage intelligent

Diriger directement vers le modèle le plus adapté selon le contexte

Techniques d'optimisation des modèles

Quantification

Transformer la précision numérique des poids pour réduire la taille mémoire et le coût en calcul.

Le modèle reste identique en structure
Peut introduire une légère perte de précision (souvent négligeable)
Appliquée en post-training ou en cours d'entraînement

Distillation

Utiliser un modèle existant pour entraîner un modèle plus léger qui reproduit son comportement.

Le "professeur" guide l'"élève"
Permet d'obtenir un modèle compact et performant

Multi-Instance GPU (MIG)

Fractionner un GPU pour exécuter plusieurs tâches en parallèle, avec des ressources adaptées à la charge de chacune.

Surveillance de l'usage

Détecter les modèles et services non utilisés pour les mettre en pause et libérer les ressources.

🎮 Cas pratique : Hugging Face

Le répertoire de référence Open Source pour l'IA

📦 Modèles

Beaucoup d'entreprises, chercheurs ou associations publient leurs modèles et permettent de les télécharger.

Documentation technique pour chaque modèle
Tri par tâche et par taille

📊 Datasets

Publication des datasets d'entraînement avec possibilité de téléchargement.

Documentation technique
Tri par type de données et par taille

🧪 Spaces

Tester directement sur le site des IA publiées par la communauté.

💡 Recherchez l'outil "Ecologits" pour estimer l'impact d'une requête d'IA Générative !

Module 05

Gestion des phases d'entraînement et d'inférence

Optimiser les phases les plus énergivores du cycle de vie IA

L'entraînement est-il toujours nécessaire ?

Existe-t-il un modèle open-source ou interne pertinent ?

Le besoin utilisateur est-il satisfait par ce modèle ?

✅ Si oui aux deux

Entraînement non nécessaire

⚠️ Sinon

Entraînement à considérer avec précaution

⚠️

Une phase d'entraînement n'est pas toujours nécessaire, et son intégration doit être conditionnée à une valeur ajoutée démontrée car elle est très coûteuse en ressources.

Réutiliser un modèle existant

✅ Avantages

Baisse directe de l'impact carbone
Gain de temps
Qualité éprouvée

⚠️ Points de vigilance

Vérifier la compatibilité avec les données réelles
S'assurer du respect des exigences de sécurité et d'éthique
Évaluer le poids du modèle et privilégier une version plus légère

Stratégies d'entraînement responsable

Fine-tuning local

Adapter un modèle existant (interne ou open source) uniquement sur le jeu de données métier

Réapprentissage contrôlé

Mettre à jour le modèle sur de nouvelles données sans repartir de zéro et uniquement quand on observe une baisse de qualité (AI drift)

Quand réentraîner ?

Indicateurs déclencheurs :

📉

Dégradation d'un ou plusieurs KPI (précision, taux d'erreur, couverture)

📊

Data drift : changement statistique des données entrantes

🔄

Conceptual drift : modification dans les relations entrées/sorties

👥

Changement dans les besoins des utilisateurs

📜

Évolution réglementaire ou nouvelle politique

💬

Feedback utilisateur signalant une perte de pertinence

Techniques d'optimisation de l'entraînement

Batch training

Vitesse

Fractionner les données d'apprentissage en petits groupes (batchs) pour paralléliser les calculs et réduire les I/O.

Toujours applicable

Early stopping

Économie

Arrêter l'entraînement dès que la performance sur les données de validation cesse de s'améliorer.

Mutualisation des entraînements

Efficacité

Les clusters personnels ou dédiés sont souvent sous-utilisés. Les plateformes mutualisées permettent un meilleur rendement "impact carbone / kWh".

Créneaux d'entraînement optimisés

Green IT

Entraîner quand l'électricité est moins carbonée. L'intensité carbone varie selon les périodes et conditions météorologiques.

Optimisation de l'inférence

🗄️ Mise en cache

Mémoriser le résultat d'une prédiction pour ne pas recalculer si la même demande est répétée.

Cas d'usage :

Résultats de classification stables dans le temps
Traduction automatique pour contenus statiques

⏱️ Rafraîchissement contrôlé

Solliciter les modèles périodiquement ou uniquement si les données ont changé.

Exemples :

Score de risque recalculé uniquement si données modifiées
Recommandation personnalisée mise à jour selon un seuil

📦 Traitement par lot

Regrouper plusieurs requêtes en un seul lot pour mutualiser l'exécution.

Adapté pour :

Traitements asynchrones ou file d'attente
Services ayant une tolérance à la latence

Module 06

Infrastructure & Déploiement

Choisir les bonnes ressources pour minimiser l'impact

L'impact environnemental du cloud

L'impact environnemental du cloud varie fortement selon :

🔌 Mix énergétique

Taux d'énergies renouvelables ou bas carbone du fournisseur

📍 Localisation

Réseau électrique local, refroidissement naturel, etc.

⚡ Efficacité énergétique

PUE (Power Usage Effectiveness), modularité, refroidissement

📊 Transparence

Outils fournis pour monitorer ou optimiser l'impact

GPU vs CPU : Quel matériel pour quel usage ?

Cas d'usage	Caractéristique	Matériel recommandé
Entraînement Deep Learning	Beaucoup de calculs à la fois, sur de grosses données	GPU
Inférence rapide (chatbot, assistant vocal)	Faible latence exigée, en continu	GPU
Prédictions régulières non urgentes	Traitements par lot, latence tolérée	CPU

⚠️

Le GPU est surpuissant, mais très énergivore. À utiliser uniquement quand c'est vraiment nécessaire !

Coûts et consommation des GPU

GPU grand public (RTX)

Modèle	Prix (EUR)	VRAM	Consommation (TDP)
RTX 6000 Ada	7 120 - 9 135 €	48 GB	300W
RTX 5000 Ada	4 097 - 5 500 €	32 GB	250W
RTX 4000 Ada	1 150 - 1 600 €	20 GB	130W

GPU datacenter (NVIDIA)

Modèle	Prix (EUR)	VRAM	Consommation (TDP)	Usage principal
B200 SXM	42 000 - 47 000 €	192 GB HBM3e	1000W	Training massif
H200 SXM	28 000 - 37 000 €	141 GB HBM3e	700W	LLM très larges
H100 SXM	25 000 - 40 000 €	80 GB HBM3	700W	Training & inférence

Module 07

Mesurer et piloter l'impact carbone

On ne peut pas améliorer ce qu'on ne mesure pas

Pourquoi mesurer ?

Mesurer l'impact d'un service IA permet de :

🔍

Identifier les leviers d'optimisation sur tout le cycle de vie

👁️

Favoriser la transparence auprès des parties prenantes (métier, IT, RSE...)

🎯

Soutenir des décisions produit alignées avec les engagements environnementaux

Les deux dimensions de l'impact

🏭 Impact fabrication

40 à 60% de l'impact total d'un service numérique

Correspond à l'extraction des matières premières, la production, l'assemblage, le transport et la fin de vie de :

PCB, CPU, GPU, RAM
Systèmes de stockage (disques durs, SSD)
Systèmes de refroidissement
Réseaux, routeurs, câblages
Datacenters (bâtiment, climatisation...)

⚡ Impact usage

Consommation énergétique des serveurs

Reflète l'effort pour chaque inférence ou réentraînement
Les composants les plus consommateurs : CPU et GPU
Taille du modèle
Fréquence des requêtes

Les métriques clés

kWh Consommation électrique

tCO2eq Émissions de gaz à effet de serre

m³ Consommation d'eau

kgSbeq Épuisement des ressources

Exemple d'impact : Mistral AI (18 mois)

20 400 tCO2eq

281 000 m³ d'eau

660 kgSbeq

Source : Mistral report & Mistral News

Outils de mesure

💡

La mesure de l'impact environnemental d'une IA est un exercice complexe. Cette formation vous donne des repères pour comprendre les grands leviers, mais la mesure fine reste le rôle d'experts car elle nécessite des données précises et une méthodologie rigoureuse.

Types d'outils disponibles

Calculettes d'empreinte carbone - Pour estimer l'impact d'un service IA
Outils de monitoring GPU/CPU - Pour mesurer la consommation en temps réel
Ecologits (Hugging Face) - Pour estimer l'impact d'une requête d'IA Générative

🎮 Cas pratique : Estimer l'impact d'un projet IA

Cluster GPU fictif : FAB-IA-01

GPUs

2 GPU V100 + 4 GPU A100

CPUs

100 vCPU (AMD EPIC Zen 2)

RAM

1.2 To

Stockage

10 To SSD

Services du projet ABC

Service de défloutage 5 Pods (10 Go RAM + 10 vCPU chacun)

Service de classification 15 Pods (4 Go RAM + 2 vCPU chacun)

Service d'OCR 30 Pods (8 Go RAM + 6 vCPU chacun)

Service d'extraction de mots clés 10 Pods (4 Go RAM + 2 vCPU chacun)

Module 08

Gestion de la fin de vie

Anticiper et gérer la fin de vie des services IA

Pourquoi planifier la fin de vie ?

⚠️

La frugalité doit couvrir toutes les étapes du cycle de vie. Une IA inutilisée continue de consommer et de complexifier l'écosystème.

Elle doit être abordée comme une vraie étape projet, avec des responsabilités claires et des décisions à documenter.

Risques si on ne prévoit pas la fin de vie :

Coûts d'infrastructure maintenus inutilement
Dette technique croissante
Confusion dans l'écosystème applicatif
Données non archivées ou perdues

Les 3 étapes de la fin de vie

Désactivation du service IA

Ajouter dans la backlog une étape de désactivation planifiée (date ou critère métier)
Préciser les modalités de coupure (arrêt des containers, suppression de l'instance cloud...)
Communiquer auprès des utilisateurs

Nettoyage ou archivage des modèles

Mettre en place une politique de rétention (ex : conserver 1 an puis archiver)
Documenter les modèles pour réutilisation future éventuelle

Revue critique des datasets

Identifier les données à conserver, archiver ou supprimer
Respecter les obligations RGPD

Donner une seconde vie aux modèles

Les modèles d'IA peuvent enrichir une bibliothèque interne partagée entre les collaborateurs.

À terme, les modèles pourront également avoir une seconde vie avec l'open-source, mais attention aux exigences de conformité au RGPD et de protection des données personnelles.

Conclusion

Les objectifs de cette formation

🎯

Cadrer

Un projet d'IA de manière responsable en intégrant des critères de sobriété, d'utilité et d'impact environnemental

💡

Concevoir

Des solutions IA frugales en limitant la volumétrie des données

⚖️

Choisir

Des modèles d'IA sobres et adaptés en arbitrant entre performance, complexité et coût énergétique

📉

Réduire

L'impact environnemental des phases d'entraînement et d'inférence

♻️

Anticiper

La fin de vie des services IA

Passez à l'action !

Cette formation vous a donné les clés pour concevoir et mettre en place une IA responsable. Il est maintenant temps de les appliquer dans vos projets.

Revoir le sommaire Recommencer la formation

Concevoir et mettre en place une IA Responsable

Sommaire de la formation

Introduction

Définition du besoin & Cadrage

Gestion de la donnée

Optimisation des modèles

Entraînement & Inférence

Infrastructure & Déploiement

Mesure & Pilotage

Gestion de la fin de vie

Introduction

Ai-je besoin de l'IA ?

L'histoire de l'IA : une évolution par vagues technologiques

Machine Intelligente

Conférence de Dartmouth

Premiers projets & Systèmes experts

Deep Blue

Machine Learning

Apple Siri

IA Générative

Glossaire

L'explosion de la puissance des modèles

Modèles de grande taille

Généralisation des usages IA

Effet d'industrialisation

L'hyper-croissance et la démesure

Une croissance et un impact exponentiels

Consommation et impact de l'entraînement de ChatGPT

Chiffres clés de l'impact

Rappel des impacts environnementaux du numérique

Sources d'impact

Cycle de vie d'une IA et consommation

Modélisation

Entraînement

Fine-tuning

Inférence

Fin de vie

Un virage nécessaire

Qu'est-ce que l'écoconception ?

Une exigence stratégique et réglementaire

🎯 Trajectoire Bas Carbone

📜 Loi REEN

Définition du besoin & Cadrage

L'IA n'est jamais un objectif

Les 3 étapes du cadrage

Comprendre le besoin utilisateur

Reformuler la problématique

Identifier les besoins durables

Cherchez l'erreur !

Explorer les alternatives à l'IA

Identifier les alternatives non-IA

Logique métier

RPA

Statistiques classiques

Intervention humaine

S'assurer de l'alignement stratégique

Comités Produit/Data/IA

Comité Éthique IA

Définir des critères de frugalité

Frugalité

Durabilité

Simplicité

Pertinence

Arbre de décision interactif : Ai-je besoin de l'IA ?

🎮 Cas pratique : Projet GRAINE

Contexte métier

Le besoin

Analyse

✅ Arguments pour l'IA

⚠️ Points de vigilance

Gestion de la donnée

L'importance de la qualité et de la quantité

🔍 Qualité des données

📊 Quantité de données

Réutiliser plutôt que dupliquer

Bonnes pratiques opérationnelles

Les questions essentielles à se poser

Qui est en charge de la gestion des données ?

Product Owner

Dev / Tech Lead