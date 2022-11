Pour tester sa nouvelle approche, Hugging Face a estimé les émissions globales de son propre grand modèle de langage, BLOOM, qui a été lancé plus tôt cette année. C’était un processus qui impliquait d’additionner de nombreux nombres différents : la quantité d’énergie utilisée pour former le modèle sur un supercalculateur, l’énergie nécessaire pour fabriquer le matériel du supercalculateur et maintenir son infrastructure informatique, et l’énergie utilisée pour faire fonctionner BLOOM une fois qu’il avait été déployé. Les chercheurs ont calculé cette partie finale à l’aide d’un outil logiciel appelé CodeCarbon, qui suivait les émissions de carbone que BLOOM produisait en temps réel sur une période de 18 jours.

Hugging Face a estimé que la formation de BLOOM a entraîné 25 tonnes métriques d’émissions de carbone. Mais, selon les chercheurs, ce chiffre a doublé lorsqu’ils ont pris en compte les émissions produites par la fabrication du matériel informatique utilisé pour la formation, l’infrastructure informatique plus large et l’énergie nécessaire pour faire fonctionner BLOOM une fois qu’il a été formé.

Bien que cela puisse sembler beaucoup pour un modèle, 50 tonnes métriques d’émissions de carbone équivaut à environ 60 vols entre Londres et New York, c’est nettement moins que les émissions associées à d’autres LLM de même taille. En effet, BLOOM a été formé sur un supercalculateur français qui fonctionne principalement à l’énergie nucléaire, qui ne produit pas d’émissions de carbone. Les modèles formés en Chine, en Australie ou dans certaines parties des États-Unis, qui ont des réseaux énergétiques qui dépendent davantage des combustibles fossiles, sont susceptibles d’être plus polluants.

Après le lancement de BLOOM, Hugging Face a estimé que l’utilisation du modèle émettait environ 19 kilogrammes de dioxyde de carbone par jour, ce qui est similaire aux émissions produites en conduisant environ 54 milles dans un voiture neuve moyenne.

A titre de comparaison, OpenAI GPT-3 et Meta OPTER ont été estimés à émettre plus de 500 et 75 tonnes métriques de dioxyde de carbone, respectivement, pendant la formation. Les vastes émissions de GPT-3 peuvent s’expliquer en partie par le fait qu’il a été formé sur du matériel plus ancien et moins efficace. Mais il est difficile de dire avec certitude quels sont les chiffres; il n’existe aucun moyen standardisé de mesurer les émissions de carbone, et ces chiffres sont basés sur des estimations externes ou, dans le cas de Meta, sur des données limitées publiées par l’entreprise.

“Notre objectif était d’aller au-delà des seules émissions de carbone de l’électricité consommée pendant la formation et de tenir compte d’une plus grande partie du cycle de vie afin d’aider la communauté de l’IA à avoir une meilleure idée de leur impact sur l’environnement et comment nous pourrions commencer à le réduire », déclare Sasha Luccioni, chercheur à Hugging Face et auteur principal de l’article.

L’article de Hugging Face établit une nouvelle norme pour les organisations qui développent des modèles d’IA, déclare Emma Strubell, professeure adjointe à l’école d’informatique de l’Université Carnegie Mellon, qui a écrit un article fondateur papier sur l’impact de l’IA sur le climat en 2019. Elle n’a pas participé à cette nouvelle recherche.

L’article “représente l’analyse la plus approfondie, la plus honnête et la mieux informée de l’empreinte carbone d’un grand modèle ML à ce jour, pour autant que je sache, allant dans beaucoup plus de détails… que tout autre article [or] rapport dont je suis au courant », déclare Strubell.