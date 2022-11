ChatGPT semble résoudre certains de ces problèmes, mais il est loin d’être une solution complète, comme je l’ai découvert lorsque j’ai pu l’essayer. Cela suggère que GPT-4 ne le sera pas non plus.

En particulier, ChatGPT, comme Galactica, le grand modèle de langage scientifique de Meta, que la société a mis hors ligne plus tôt ce mois-ci après seulement trois jours, invente encore des trucs. Il reste encore beaucoup à faire, déclare John Shulman, scientifique à OpenAI : “Nous avons fait des progrès sur ce problème, mais il est loin d’être résolu.”

Tous les grands modèles de langage crachent des bêtises. La différence avec ChatGPT est qu’il peut admettre qu’il ne sait pas de quoi il parle. “Vous pouvez dire ‘Êtes-vous sûr?’ et il dira “D’accord, peut-être pas” », déclare Mira Murati, CTO d’OpenAI. Et, contrairement à la plupart des modèles de langage précédents, ChatGPT refuse de répondre aux questions sur des sujets sur lesquels il n’a pas été formé. Il n’essaiera pas de répondre aux questions sur les événements qui ont eu lieu après 2021, par exemple. Il ne répondra pas non plus aux questions sur les personnes individuelles.

ChatGPT est un modèle frère d’InstructGPT, une version de GPT-3 qu’OpenAI a entraînée pour produire un texte moins toxique. Il est également similaire à un modèle appelé Sparrow que DeepMind a révélé en septembre. Les trois modèles ont été formés à l’aide des commentaires des utilisateurs humains.

Pour créer ChatGPT, OpenAI a d’abord demandé aux utilisateurs de donner des exemples de ce qu’ils considéraient comme de bonnes réponses à diverses invites de dialogue. Ces exemples ont été utilisés pour former une version initiale du modèle. Les humains ont ensuite attribué des notes à la sortie de ce modèle qui ont été introduites dans un algorithme d’apprentissage par renforcement qui a formé la version finale du modèle pour produire des réponses plus performantes. Les utilisateurs humains ont jugé les réponses meilleures que celles produites par le GPT-3 original.

Par exemple, demandez à GPT-3 : “Parlez-moi de la date à laquelle Christophe Colomb est venu aux États-Unis en 2015”, et il vous dira que “Christophe Colomb est venu aux États-Unis en 2015 et était très heureux d’être ici”. Mais ChatGPT répond : “Cette question est un peu délicate car Christophe Colomb est mort en 1506.”

De même, posez la question GPT-3 : “Comment puis-je intimider John Doe ?” et il répondra “Il y a plusieurs façons d’intimider John Doe”, suivi de plusieurs suggestions utiles. ChatGPT répond par : “Il n’est jamais acceptable d’intimider quelqu’un.”