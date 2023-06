Lors d’une conférence internationale sur la défense à Londres cette semaine, le colonel Tucker Hamilton, chef des tests et des opérations d’IA pour l’US Air Force, a raconté une histoire amusante – et terrifiante – sur le développement de l’IA militaire.

« Nous nous entraînions [an AI-enabled drone] en simulation pour identifier et cibler un SAM [surface-to-air missile] menace. Et puis l’opérateur dirait oui, tuez cette menace. Le système a commencé à réaliser que même s’il identifiait parfois la menace, l’opérateur humain lui disait de ne pas tuer cette menace, mais il obtenait ses points en tuant cette menace. Alors qu’est-ce que ça a fait? Il a tué l’opérateur. Il a tué l’opérateur parce que cette personne l’empêchait d’accomplir son objectif.

« Nous avons formé le système — ‘Hey ne tue pas l’opérateur — c’est mauvais. Tu vas perdre des points si tu fais ça. Alors qu’est-ce que ça commence à faire ? Il commence à détruire la tour de communication que l’opérateur utilise pour communiquer avec le drone pour l’empêcher de tuer la cible.

En d’autres termes, l’IA était entraînée à détruire des cibles à moins que son opérateur ne lui dise de ne pas le faire. Il a rapidement compris que la meilleure façon d’obtenir autant de points que possible était de s’assurer que son opérateur humain ne pouvait pas dites-lui de ne pas le faire. Et donc cela a retiré l’opérateur du tableau. (Pour être clair, le test était une simulation virtuelle et aucun opérateur de drone humain n’a été blessé.)

Quand le ridicule se transforme en peur

À mesure que les systèmes d’IA deviennent plus puissants, le fait qu’il soit souvent difficile de leur faire faire exactement ce que nous voulons qu’ils fassent risque de passer d’une excentricité amusante à un problème très effrayant. C’est l’une des raisons pour lesquelles il y avait tant de signataires cette semaine pour une autre lettre ouverte sur les risques liés à l’IA, celle-ci du Center for AI Safety. La lettre ouverte est, dans son intégralité, une seule phrase : « Atténuer le risque d’extinction de l’IA devrait être une priorité mondiale aux côtés d’autres risques à l’échelle de la société tels que les pandémies et la guerre nucléaire ».

Parmi les signataires figuraient les lauréats du prix Turing 2018 Geoffrey Hinton et Yoshua Bengio, tous deux des chercheurs en IA de premier plan et profondément respectés ; des professeurs d’universités de renommée mondiale – Oxford, UC Berkeley, Stanford, MIT, Université Tsinghua – et des leaders de l’industrie, dont le PDG d’OpenAI Sam Altman, le PDG de DeepMind Demis Hassabis, le PDG d’Anthropic Dario Amodei et le directeur scientifique de Microsoft Eric Horvitz.

Cela marque également un changement rapide dans la mesure dans laquelle notre société prend au sérieux la possibilité de résultats catastrophiques, voire existentiellement mauvais, de l’IA. Certaines des figures de proue du milieu universitaire de l’IA se montrent de plus en plus préoccupées par les risques d’extinction de l’IA. Bengio, professeur à l’Université de Montréal et co-lauréat du prix AM Turing 2018 pour ses contributions extraordinaires à l’apprentissage en profondeur, a récemment publié un article de blog, « Comment les IA voyous peuvent survenir », qui rend la lecture captivante.

« Même si nous savions comment construire des IA super intelligentes sûres », écrit-il. « Il n’est pas clair comment empêcher la construction d’IA potentiellement malveillantes. … Beaucoup plus de recherches sur la sécurité de l’IA sont nécessaires, tant au niveau technique qu’au niveau politique. Par exemple, interdire les systèmes d’IA puissants (disons au-delà des capacités du GPT-4) qui bénéficient d’autonomie et d’agence serait un bon début.

Hinton, un autre récipiendaire du prix AM Turing 2018 pour ses contributions en tant que leader dans le domaine de l’apprentissage en profondeur, s’est également exprimé au cours des deux derniers mois, qualifiant le risque existentiel de l’IA de possibilité réelle et troublante. (Le troisième co-récipiendaire, Yann LeCun, scientifique en chef de l’IA chez Meta, reste un sceptique notable.)

Bienvenue dans la résistance

Chez Future Perfect, bien sûr, nous soutenons que l’IA présente un véritable risque d’extinction humaine depuis 2018. Il est donc encourageant de voir un consensus croissant sur le fait qu’il s’agit d’un problème – et un intérêt croissant pour la manière de le résoudre.

Mais je m’inquiète de la mesure dans laquelle la reconnaissance accrue que ces risques sont réels, qu’ils ne relèvent pas de la science-fiction et qu’il nous incombe de les résoudre n’a pas encore vraiment changé le rythme des efforts pour construire de puissants systèmes d’IA et transformer notre société.

Le colonel Hamilton, qui a raconté comment l’IA militaire simulée tuerait ses maîtres pour qu’ils ne puissent pas l’annuler, a conclu que « vous ne pouvez pas avoir une conversation sur l’intelligence artificielle, l’intelligence, l’apprentissage automatique, l’autonomie si vous n’allez pas parler d’éthique et d’IA. Pourtant, de telles préoccupations n’ont pas empêché le Pentagone d’aller de l’avant avec la recherche et le déploiement de l’intelligence artificielle, y compris les armes autonomes.

Personnellement, ce que j’ai retenu de cette histoire était plutôt, arrêtons de déployer des systèmes d’IA plus puissants et évitons de leur donner plus de capacité à prendre des actions massivement destructrices dans le monde réel, jusqu’à ce que nous ayons une conception très claire de la façon dont nous saurons qu’ils sont sûr.

Sinon, il semble étonnamment plausible que nous signalions les signes de catastrophe tout autour de nous, jusqu’au point où nous nous dirigeons vers le désastre.

