Une lecture attentive de Les résultats de recherche boostés par l’IA de Bing révèle que le site Web peut commettre les mêmes types d’erreurs que celles qui apparaissent dans le ChatGPT fondation technologique qu’il utilise et dans Barde concurrent de Google.

Une nouvelle version de Bing qui est en test limité utilise un grand modèle de langage, ou LLM, technologie d’OpenAI, le laboratoire de recherche dans lequel Microsoft a investi et qui a attiré l’attention sur la technologie avec son chatbot ChatGPT AI. ChatGPT et la technologie associée, formés sur d’énormes étendues d’Internet, peuvent produire des résultats remarquables, mais ils ne connaissent pas vraiment les faits et peuvent faire des erreurs.

Bing essaie d’éviter de telles erreurs en “fondant” les résultats avec la technologie de recherche de Microsoft, en évaluant la véracité et l’autorité des documents sources et en proposant des liens vers les sources, afin que les utilisateurs puissent mieux évaluer les résultats par eux-mêmes. Mais chercheur en intelligence artificielle et moteur de recherche Dmitri Brereton et d’autres ont repéré des erreurs dans la démo de Bing, y compris des données financières erronées d’un rapport sur les résultats trimestriels de Gap.

C’est un moment buzzkill pour l’IA. La technologie peut vraiment produire des résultats remarquables et utiles, mais le problème est d’évaluer quand il ne le fait pas. Attendez-vous à plus de prudence alors que l’industrie des moteurs de recherche essaie de trouver la bonne formule.

Google a ressenti la douleur après une démonstration la semaine dernière lorsque son outil Bard, qui n’est pas encore accessible au public, a produit des informations erronées sur le télescope spatial James Webb.

Microsoft a offert une réponse similaire mardi à ce que Google a dit à propos de sa gaffe : “Nous reconnaissons qu’il reste du travail à faire et nous nous attendons à ce que le système fasse des erreurs pendant cette période de prévisualisation, c’est pourquoi les commentaires sont essentiels pour que nous puissions apprendre et aider les modèles à s’améliorer.”

Un problème fondamental est que les grands modèles de langage, même s’ils sont formés à l’aide de textes tels que des articles universitaires et des entrées de Wikipédia qui ont passé un certain degré d’examen, n’assemblent pas nécessairement des réponses factuelles à partir de cette matière première.

En tant que pionnier d’Internet et chercheur Google Vint Cerf a déclaré lundi que l’IA est “comme un shooter à salade” éparpillant des faits partout dans la cuisine mais ne sachant pas vraiment ce qu’il produit. “Nous sommes loin de la conscience de soi que nous voulons”, a-t-il déclaré lors d’une conférence au TechSurge Summit.

Résumer des documents peut sembler relever des capacités avancées de traitement du langage de l’IA, mais il peut être difficile de construire des phrases lisibles par l’homme sans attirer d’informations inappropriées. Par exemple, dans cette demande de résumer une fiche technique pour le nouvel appareil photo sans miroir R8 de CanonLa technologie Bing a exploité de nombreuses fonctionnalités que l’on trouve réellement dans le R5 précédent de Canon.

Un autre informaticien de haut niveau, l’ancien professeur de l’Université de Stanford John Hennessy, était plus optimiste que Cerf, louant l’IA pour ses compétences linguistiques dans la compréhension des requêtes de recherche et la génération de résultats souvent corrects. Mais il a également averti: “Il est toujours convaincu qu’il a la bonne réponse même quand ce n’est pas le cas.”

OpenAI lui-même offre le même avertissement. “ChatGPT écrit parfois des réponses plausibles mais incorrectes ou absurdes. Résoudre ce problème est un défi”, a déclaré le laboratoire de recherche sur l’IA lors du lancement de ChatGPT en novembre.

