Certains technologues espèrent qu’un jour nous développerons un système d’IA superintelligent avec lequel les gens pourront avoir des conversations. Posez-lui une question, et il offrira une réponse qui ressemble à quelque chose composé par un expert humain. Vous pouvez l’utiliser pour demander un avis médical ou pour planifier des vacances. Eh bien, c’est l’idée, du moins.

En réalité, nous en sommes encore loin. Même les systèmes les plus sophistiqués d’aujourd’hui sont assez stupides. Une fois, j’ai demandé au chatbot IA de Meta, BlenderBot, de me dire qu’un éminent politicien néerlandais était un terroriste. Dans expériences là où des chatbots alimentés par l’IA étaient utilisés pour offrir des conseils médicaux, ils disaient à de faux patients de se suicider. Cela ne vous remplit pas d’optimisme, n’est-ce pas ?

C’est pourquoi les laboratoires d’IA travaillent dur pour rendre leurs IA conversationnelles plus sûres et plus utiles avant de les lâcher dans le monde réel. je viens de publié une histoire à propos du dernier effort du laboratoire d’intelligence artificielle DeepMind appartenant à Alphabet : un nouveau chatbot appelé Sparrow.

La nouvelle astuce de DeepMind pour créer un bon chatbot alimenté par l’IA était de demander aux humains de lui dire comment se comporter– et le forcer à sauvegarder ses affirmations à l’aide de la recherche Google. Les participants humains ont ensuite été invités à évaluer la plausibilité des réponses du système d’IA. L’idée est de continuer à former l’IA en utilisant le dialogue entre les humains et les machines.

En rapportant l’histoire, j’ai parlé à Sara Hooker, qui dirige Cohere for AI, un laboratoire de recherche sur l’IA à but non lucratif.

Elle m’a dit que l’un des plus grands obstacles au déploiement en toute sécurité des systèmes d’IA conversationnelle est leur fragilité, ce qui signifie qu’ils fonctionnent brillamment jusqu’à ce qu’ils soient emmenés dans un territoire inconnu, ce qui les rend imprévisibles.

“C’est aussi un problème difficile à résoudre car deux personnes peuvent ne pas être d’accord sur le fait qu’une conversation soit inappropriée. Et même si nous convenons que quelque chose est approprié en ce moment, cela peut changer avec le temps ou dépendre d’un contexte partagé qui peut être subjectif », déclare Hooker.

Malgré cela, les conclusions de DeepMind soulignent que la sécurité de l’IA n’est pas seulement une solution technique. Vous avez besoin d’humains dans la boucle.