En tant que dirigeants technologiques affluer vers le Capitole cette semaine, pour discuter avec les législateurs de la réglementation potentielle sur l’IA, ils sont également interrogés sur les conditions de travail des travailleurs qui fabriquent ChatGPT, Bardeet Bing possible.

Les législateurs américains interrogent neuf géants de la technologie – Microsoft, OpenAI, Anthropic, Meta, Alphabet, Amazon, Inflection AI, Scale AI et IBM – sur les conditions de travail des étiqueteurs de données. Les étiqueteurs de données sont des travailleurs humains chargés d’étiqueter les données de formation et d’évaluer les réponses des chatbots pour s’assurer que les systèmes d’IA sont sûrs et fiables.

« Malgré la nature essentielle de ce travail, des millions de travailleurs des données dans le monde effectuent ces tâches stressantes sous surveillance constante, avec de bas salaires et aucun avantage social », ont écrit un groupe de législateurs, dont le sénateur Edward Markey, Elizabeth Warren et Bernard Sanders, dans un communiqué. lettre aux dirigeants technologiques aujourd’hui (13 septembre). « Ces conditions nuisent non seulement aux travailleurs, mais elles mettent également en danger la qualité des systèmes d’IA, ce qui peut potentiellement nuire à la précision, introduire des biais et mettre en péril la protection des données. »

La lettre attire également l’attention sur les nouvelles startups de l’IA, notamment Inflection AI, Scale AI et Anthropic, mettant en lumière le who’s who des entreprises qui façonnent les systèmes d’IA aujourd’hui.

Les entreprises technologiques ont la responsabilité de garantir que ces travailleurs bénéficient de conditions de travail sûres, soient payés équitablement, soient protégés contre des procédures disciplinaires injustes et doivent être plus transparentes quant au rôle que ces travailleurs jouent dans les entreprises d’IA, ont écrit les législateurs.

L’équipe d’étiquetage des données derrière ChatGPT et Bard

Les entreprises technologiques ont tendance à sous-traiter l’étiquetage des données à des sociétés de recrutement qui embauchent des travailleurs en dehors des États-Unis, dans des pays tels que Kenya, Inde et Philippines.

Les produits d’IA sont utilisés pour automatiser les processus de prise de décision, et les algorithmes derrière ces produits doivent apprendre à « voir » les choses. Par exemple, un algorithme de voiture autonome doit être capable de faire la différence entre un piéton et un panneau d’arrêt. L’algorithme est formé par des étiqueteurs de données qui regardent des heures de contenu vidéo et identifient les objets dans chaque image, comme Le Financial Times a rapporté. Une heure de vidéo prend huit heures à annoter, selon le FT.

Ces travailleurs subissent souvent des conditions difficiles. Pour rendre ChatGPT plus sûr, les travailleurs kenyans, qui gagnent moins de 2 dollars de l’heure, doivent qualifier les images d’abus sexuels, de discours de haine et de violence de Enquête temporelle depuis plus tôt cette année trouvé. Les employés ont déclaré à Time qu’ils devaient lire et étiqueter entre 150 et 250 extraits de texte, allant de 100 mots à plus de 1 000 mots, par quart de travail de neuf heures. Les employés ont déclaré qu’ils étaient mentalement marqués par leur travail et, même s’ils avaient droit à des séances de bien-être, ils trouvaient souvent ces séances inutiles. Les étiqueteurs de données ne bénéficient pas non plus des mêmes avantages que les employés des entreprises technologiques qui commandent les travaux.

Avec la diffusion de produits d’IA générative à gauche et à droite, l’étiquetage des données ne semble pas disparaître. Le marché mondial de l’annotation et de l’étiquetage des données a atteint 800 millions de dollars l’année dernière et devrait passer à 3,6 milliards de dollars d’ici fin 2027, selon Markets and Markets, un cabinet d’études de marché. Comme le volume de données nécessitant des ballons d’étiquetageles entreprises d’étiquetage des données affirment que les travailleurs se spécialisent davantage dans différents types de données telles que les informations de conduite ou médicales.