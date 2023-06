Sans surprise, tout le monde parlait d’IA et de la récente ruée vers le déploiement de grands modèles de langage. Avant la conférence, les Nations Unies ont publié une déclaration encourageant les participants à RightsCon à se concentrer sur la surveillance et la transparence de l’IA.

J’ai été surpris, cependant, par à quel point les conversations sur les risques de l’IA générative étaient différentes à RightsCon de tous les avertissements des grandes voix de la Silicon Valley que j’ai lu dans les nouvelles.

Au cours des dernières semaines, des sommités technologiques comme le PDG d’OpenAI, Sam Altman, l’ancien Googler Geoff Hinton, le chercheur en intelligence artificielle Yoshua Bengio, Elon Musk et bien d’autres ont appelé à une réglementation et à une action urgente pour faire face aux « risques existentiels », y compris même l’extinction – que l’IA représente pour l’humanité.

Certes, le déploiement rapide de grands modèles de langage sans évaluation des risques, sans divulgation de données et de processus de formation, ou apparemment avec beaucoup d’attention accordée à la manière dont la technologie pourrait être utilisée à mauvais escient est préoccupant. Mais les orateurs de plusieurs sessions à RightsCon ont réitéré que cette ruée vers l’or de l’IA est le produit de la recherche de profit des entreprises, pas nécessairement de l’incompétence réglementaire ou de l’inévitabilité technologique.

Lors de la toute première session, Gideon Lichfield, le rédacteur en chef de Wired (et l’ancien rédacteur en chef de Tech Review), et Urvashi Aneja, fondateur du Digital Futures Lab, se sont affrontés avec Kent Walker de Google.

» Satya Nadella de Microsoft a déclaré qu’il voulait faire danser Google. Et Google a dansé », a déclaré Lichfield. « Nous sommes maintenant, nous tous, en train de sauter dans le vide en nous tenant le nez parce que ces deux entreprises essaient de se battre. » Walker, en réponse, a souligné les avantages sociaux que les progrès de l’intelligence artificielle pourraient apporter dans des domaines tels que la découverte de médicaments, et a réaffirmé l’engagement de Google en faveur des droits de l’homme.

Le lendemain, le chercheur en IA Timnit Gebru a directement abordé le discours sur les risques existentiels posés par l’IA : « Attribuer l’agence à un outil est une erreur, et c’est une tactique de diversion. Et si vous voyez qui parle comme ça, ce sont littéralement les mêmes personnes qui ont versé des milliards de dollars dans ces entreprises.

Elle a déclaré: «Il y a quelques mois à peine, Geoff Hinton parlait de GPT-4 et de la façon dont c’est le papillon du monde. Oh, c’est comme une chenille qui prend des données puis vole dans un beau papillon, et maintenant tout d’un coup c’est un risque existentiel. Je veux dire, pourquoi les gens prennent-ils ces gens au sérieux ? »

Frustrés par les récits autour de l’IA, des experts comme Frederike Kaltheuner, directeur de la technologie et des droits de l’homme de Human Right Watch, suggèrent de nous ancrer dans les risques que nous connaissent déjà la peste AI plutôt que de spéculer sur ce qui pourrait arriver.

Et il y a des dommages clairs et bien documentés causés par l’utilisation de l’IA. Ils comprennent:

Désinformation accrue et amplifiée. Il a été démontré que les algorithmes de recommandation sur les plateformes de médias sociaux comme Instagram, Twitter et YouTube donnent la priorité aux contenus extrêmes et émotionnellement convaincants, quelle que soit leur précision. Les LLM contribuent à ce problème en produisant des informations erronées convaincantes appelées « hallucinations ». (Plus à ce sujet ci-dessous)

Il a été démontré que les algorithmes de recommandation sur les plateformes de médias sociaux comme Instagram, Twitter et YouTube donnent la priorité aux contenus extrêmes et émotionnellement convaincants, quelle que soit leur précision. Les LLM contribuent à ce problème en produisant des informations erronées convaincantes appelées « hallucinations ». (Plus à ce sujet ci-dessous) Données de formation et résultats biaisés. Les modèles d’IA ont tendance à être entraînés sur des ensembles de données biaisés, ce qui peut entraîner des résultats biaisés. Cela peut renforcer les inégalités sociales existantes, comme dans le cas des algorithmes qui discriminent lors de l’attribution de scores de risque aux personnes pour avoir commis une fraude à l’aide sociale, ou des systèmes de reconnaissance faciale connus pour être moins précis sur les femmes à la peau plus foncée que sur les hommes blancs. Des cas de ChatGPT crachant du contenu raciste ont également été documentés.

Les modèles d’IA ont tendance à être entraînés sur des ensembles de données biaisés, ce qui peut entraîner des résultats biaisés. Cela peut renforcer les inégalités sociales existantes, comme dans le cas des algorithmes qui discriminent lors de l’attribution de scores de risque aux personnes pour avoir commis une fraude à l’aide sociale, ou des systèmes de reconnaissance faciale connus pour être moins précis sur les femmes à la peau plus foncée que sur les hommes blancs. Des cas de ChatGPT crachant du contenu raciste ont également été documentés. Érosion de la vie privée des utilisateurs. Les modèles d’IA de formation nécessitent d’énormes quantités de données, qui sont souvent extraites du Web ou achetées, ce qui soulève des questions sur le consentement et la confidentialité. Les entreprises qui ont développé de grands modèles de langage comme ChatGPT et Bard n’ont pas encore publié beaucoup d’informations sur les ensembles de données utilisés pour les former, bien qu’ils contiennent certainement beaucoup de données provenant d’Internet.

Kaltheuner dit qu’elle est particulièrement préoccupée par le déploiement des chatbots d’IA générative dans des contextes à risque tels que la thérapie de la santé mentale : « Je suis inquiète des cas d’utilisation absolument imprudents de l’IA générative pour des choses pour lesquelles la technologie n’est tout simplement pas conçue ou adaptée à l’usage. »

Gebru a réitéré ses inquiétudes concernant les impacts environnementaux résultant des grandes quantités de puissance de calcul nécessaires pour exécuter de grands modèles de langage sophistiqués. (Elle dit qu’elle a été licenciée de Google pour avoir soulevé ces préoccupations et d’autres dans la recherche interne.) Les modérateurs de ChatGPT, qui travaillent pour de bas salaires, ont également connu le SSPT dans leurs efforts pour rendre les sorties de modèles moins toxiques, a-t-elle noté.

En ce qui concerne les inquiétudes concernant l’avenir de l’humanité, Kaltheuner demande « L’extinction de qui ? Extinction de toute la race humaine ? Nous voyons déjà des personnes historiquement marginalisées être blessées en ce moment. C’est pourquoi je trouve cela un peu cynique.

Quoi d’autre je lis

Les agences gouvernementales américaines déploient le GPT-4 , selon une annonce de Microsoft rapportée par Bloomberg. OpenAI pourrait vouloir une réglementation pour son chatbot, mais en attendant, il veut également le vendre au gouvernement américain.

, selon une annonce de Microsoft rapportée par Bloomberg. OpenAI pourrait vouloir une réglementation pour son chatbot, mais en attendant, il veut également le vendre au gouvernement américain. Le problème d’hallucination de ChatGPT pourrait ne pas être réparable. Selon des chercheurs du MIT, les grands modèles de langage deviennent plus précis lorsqu’ils débattent les uns des autres, mais la précision factuelle n’est pas intégrée à leur capacité, comme le décrit cette histoire très pratique du Washington Post. Si les hallucinations ne peuvent pas être corrigées, nous ne pourrons peut-être utiliser de manière fiable des outils comme ChatGPT que dans des situations limitées.

Selon des chercheurs du MIT, les grands modèles de langage deviennent plus précis lorsqu’ils débattent les uns des autres, mais la précision factuelle n’est pas intégrée à leur capacité, comme le décrit cette histoire très pratique du Washington Post. Si les hallucinations ne peuvent pas être corrigées, nous ne pourrons peut-être utiliser de manière fiable des outils comme ChatGPT que dans des situations limitées. Selon une enquête menée par le Wall Street Journal, l’Université de Stanford et l’Université du Massachusetts, Amherst, Instagram héberge de vastes réseaux de comptes publiant du contenu d’abus sexuels sur des enfants. La plateforme a répondu en formant un groupe de travail pour enquêter sur le problème. Il est assez choquant qu’un problème aussi important puisse passer inaperçu des modérateurs de contenu de la plateforme et des algorithmes de modération automatisés.

Ce que j’ai appris cette semaine

Un nouveau rapport du groupe de défense des droits de l’homme basé en Corée du Sud, PSCORE, détaille le processus de demande de plusieurs jours requis pour accéder à Internet en Corée du Nord. Seules quelques dizaines de familles connectées à Kim Jong-Un ont un accès illimité à Internet, et seuls « quelques milliers » d’employés du gouvernement, de chercheurs et d’étudiants peuvent accéder à une version soumise à une forte surveillance. Comme le rapporte Matt Burgess dans Wired, la Russie et la Chine fournissent probablement à la Corée du Nord son infrastructure Web hautement contrôlée.