Dans un nouveau rapport technique détaillant la consommation d’énergie des requêtes sur Gemini, Google vient de réaliser l’évaluation la plus transparente et la plus complète à ce jour du genre pour une grande entreprise technologique fournissant un produit d’IA populaire. Selon le rapport, une invite textuelle standard consommerait en moyenne 0,24 wattheure d’électricité, soit l’équivalent d’environ neuf secondes de télévision. L’entreprise a également révélé des estimations de la consommation d’eau et des émissions de carbone d’une invite pour son modèle d’IA.
Les outils d’IA et les entreprises qui les proposent sont de plus en plus pointées du doigt pour leur consommation énergétique et les impacts environnementaux qui en résultent. Cette consommation augmente rapidement à mesure que la technologie se développe et exige davantage de puissance de calcul. La consommation énergétique aux États-Unis a par exemple augmenté d’environ 4% par rapport à l’année dernière, principalement en raison de l’expansion rapide des centres de données d’IA.
Des efforts croissants ont alors été déployés pour comprendre la consommation énergétique de la technologie. Cependant, ces efforts ont été entravés par le manque d’accès complet aux données liées aux opérations des grandes entreprises technologiques. Si les chercheurs peuvent extrapoler les besoins énergétiques d’une IA en fonction de sa demande en matière de puissance de calcul, il est difficile d’obtenir une estimation exacte pour les cas d’utilisation réels.
En effet, pour les utilisations réelles, beaucoup de variables doivent être prises en compte. Mis à part l’énergie consommée par le processeur pour traiter une requête, il faut aussi inclure celle nécessaire à la mémoire, au refroidissement, au stockage des données, etc. Il faut aussi garder à l’esprit que de l’énergie a été utilisée pour la fabrication du matériel nécessaire au traitement des données, ainsi que pour les infrastructures nécessaires à leur installation. L’IA consomme en outre beaucoup d’énergie au cours de son entraînement.
Pour la première fois, Google dévoile ce que consomme une invite textuelle standard d’IA en énergie, permettant de mieux comprendre l’impact réel de la technologie. « De nombreux calculs actuels de consommation énergétique de l’IA ne prennent en compte que la consommation active des machines, négligeant ainsi plusieurs facteurs critiques. Par conséquent, ils représentent une efficacité théorique plutôt qu’une efficacité opérationnelle réelle à grande échelle », expliquent dans un communiqué Amin Vahdat, vice-président/directeur général du département IA et infrastructure chez Google Cloud et Jeff Dean, scientifique en chef chez Google DeepMind et Google Research.
0,24 wattheure d’énergie, 0,03 gramme de CO2 et 0,26 millilitre d’eau
Pour effectuer leur analyse, les chercheurs de Google ont suivi la consommation énergétique des processeurs, des accélérateurs d’IA et de la mémoire, pendant qu’ils étaient activés pour traiter des requêtes et aussi lorsqu’ils sont inactifs entre les requêtes. La consommation d’énergie et d’eau du centre de données lors du traitement d’une requête d’IA a aussi été calculée, ainsi que les émissions de carbone liées à la consommation énergétique de l’ensemble du matériel utilisé. Les estimations sont basées sur un suivi de 24 heures des requêtes et du matériel de traitement.
« Des mesures détaillées nous permettent de comparer différents modèles d’IA, ainsi que le matériel et l’énergie qu’ils utilisent, tout en permettant des optimisations de l’efficacité à l’échelle du système, du matériel et des centres de données aux modèles eux-mêmes », expliquent Vahdat et Dean. « En partageant notre méthodologie, nous espérons accroître la cohérence à l’échelle du secteur dans le calcul de la consommation et de l’efficacité des ressources de l’IA », ajoutent-ils.
Les résultats – détaillés sur le serveur de prépublication arXiv – ont montré qu’une invite textuelle médiane sur Gemini consomme 0,24 wattheure d’énergie, émet 0,03 gramme de CO2 et utilise 0,26 millilitre d’eau (soit environ cinq gouttes d’eau). Pour mettre ces valeurs en perspective, cette consommation énergétique équivaut à environ neuf secondes de télévision ou environ deux secondes de four à micro-ondes.
Sur ces 0,24 wattheure, les processeurs ou puces d’IA représentent 58 % de la consommation, tandis que la mémoire de l’appareil hôte représente 25 %. Les équipements de secours en cas de panne consomment 10 % et les 8 % restants sont dédiés aux frais généraux d’exploitation du centre de données, notamment le refroidissement et la conversion d’énergie.

Une consommation divisée par 33 depuis 2024
Bien que ces chiffres paraissent faibles, il est important de considérer que Gemini traite un volume de requêtes considérablement élevé chaque jour. Si la consommation individuelle d’une requête est faible, celle cumulée pourrait être considérable. D’autre part, ces estimations ne sont pas représentatives de toutes les requêtes soumises à Gemini, Google ayant explicitement mentionné qu’il s’agit de chiffres calculés à partir d’invites médianes strictement textuelles.
Certaines invites consomment donc beaucoup plus d’énergie. Dean a mentionné l’exemple d’une requête consistant à fournir un résumé détaillé d’une dizaine de livres en une seule fois. « C’est le genre de tâche qui consommera probablement plus d’énergie que l’invite médiane », a-t-il indiqué au MIT Technology Review. Les invites de génération d’image ou de vidéo pourraient aussi nécessiter plus d’énergie, ainsi que l’utilisation d’un modèle de raisonnement.
Néanmoins, l’entreprise affirme que l’énergie totale utilisée pour une requête Gemini a significativement diminué, ayant notamment été divisée par 33 depuis mai 2024. Cela serait attribué aux améliorations apportées aux modèles et à l’optimisation des logiciels. Google a par exemple décrit, à cet effet, une approche appelée « Mixture-of-Experts », qui consiste à déterminer comment activer uniquement la partie d’un modèle d’IA nécessaire au traitement de requêtes spécifiques. Cela aurait permis de diviser les besoins en calcul par 10 à 100 selon les requêtes.
« Les gains d’efficacité de Gemini sont le fruit de plusieurs années de travail, mais ce n’est qu’un début. Conscients de la demande croissante en IA, nous investissons massivement dans la réduction des coûts d’approvisionnement en électricité et en eau par demande », expliquent les responsables dans le communiqué. « Nous plaidons pour l’adoption généralisée de ce cadre de mesure, ou de cadres de mesure tout aussi complets, afin de garantir que l’efficacité environnementale progresse parallèlement aux capacités de l’IA », ajoutent-ils.
Par ailleurs, les investissements massifs de l’entreprise dans les énergies renouvelables ont permis de réduire les émissions de carbone d’environ 30 % au cours de l’année écoulée. Google a même investi dans les recherches sur la fusion nucléaire afin de poursuivre ses efforts dans ce sens.