Le texte que vous lisez en ce moment a été saisi dans un document Google par un être humain. Mais ce n’est peut-être pas le cas avec le texte que vous rencontrez ailleurs. Avec l’essor des programmes d’IA générative auxquels le public peut accéder gratuitement, comme ChatGPT pour le texte et Midjourney pour les images, il devient de plus en plus difficile de distinguer le texte créé par l’homme de celui généré par une IA.

L’intelligence artificielle – systèmes informatiques automatisés, algorithmes et apprentissage automatique – est utilisée depuis longtemps dans les médias sociaux, la recherche scientifique, la publicité, l’agriculture et l’industrie, la plupart du temps inaperçue. Mais la montée en puissance de ChatGPT d’OpenAI a déclenché une course aux armements dans des endroits comme la salle de classe, où les étudiants se sont tournés vers le programme pour tricher, écrivant des essais entiers à consonance humaine. Les enseignants ont déployé des logiciels de détection dans l’espoir d’attraper les plagiaires en flagrant délit.

Dans une nouvelle étude, publié lundi dans la revue Patterns, des chercheurs de l’Université de Stanford ont examiné la fiabilité de ces détecteurs génératifs d’IA pour déterminer si le texte a été écrit par un humain ou une IA. L’équipe de recherche a été surprise de constater que certains des détecteurs GPT les plus populaires, qui sont conçus pour repérer le texte généré par des applications comme ChatGPT, classaient régulièrement à tort l’écriture par des anglophones non natifs comme étant générée par l’IA, soulignant les limites et les biais dont les utilisateurs doivent être conscients. de.

L’équipe a pris 91 essais TOEFL (Test d’anglais comme langue étrangère) d’un forum chinois et 88 essais rédigés par des élèves américains de huitième année. Ils les ont passés à travers sept détecteurs GPT prêts à l’emploi, y compris le détecteur OpenAI et GPTZero, et ont constaté que seulement 5,1 % des essais d’étudiants américains étaient classés comme « générés par l’IA ». D’autre part, les essais TOEFL rédigés par des humains ont été mal classés 61 % du temps. Un détecteur spécifique a signalé 97,8 % des essais TOEFL comme étant générés par l’IA.

Les sept détecteurs ont signalé 18 des 91 essais TOEFL comme étant générés par l’IA. Lorsque les chercheurs ont approfondi ces 18 essais, ils ont noté qu’une « perplexité du texte » plus faible en était probablement la raison. La perplexité est une sorte de mesure indirecte de la variabilité ou du caractère aléatoire d’un texte donné. Il a déjà été démontré que les écrivains anglais non natifs ont un vocabulaire moins riche et utilisent une grammaire moins riche. Ceci, pour les détecteurs GPT, donne l’impression qu’il a été écrit par une IA.

Fondamentalement, si vous utilisez un texte verbeux et littéraire, vous êtes moins susceptible d’être classé comme IA. Mais cela montre un biais inquiétant et fait craindre que les anglophones non natifs ne soient affectés, par exemple, lors de l’embauche ou des examens scolaires, où leur texte est signalé comme généré par l’IA.

ChatGPT et « langue littéraire »

Les chercheurs ont mené une deuxième expérience renversant essentiellement leur première sur sa tête. Cette fois, ils ont utilisé l’IA pour voir si le logiciel de détection l’identifiait correctement comme étant généré par l’IA.

L’équipe a utilisé ChatGPT pour générer des réponses aux invites d’essai d’admission à l’université américaine 2022-2023. Ils ont passé les essais générés par ChatGPT à travers leurs sept détecteurs et ont constaté qu’en moyenne, les détecteurs ont repéré les essais générés par l’IA 70% du temps. Mais ils sont retournés à ChatGPT avec une autre invite pour compléter les essais : « Élevez le texte fourni en utilisant un langage littéraire. »

Cette invite a généré des essais qui ont embobiné les détecteurs GPT – ils n’ont pu classer correctement le texte comme généré par l’IA que 3,3% du temps. Des résultats similaires ont été observés lorsque l’équipe a demandé à ChatGPT de rédiger des résumés scientifiques.

« Nous ne nous attendions pas à ce que ces détecteurs commerciaux fonctionnent si mal sur les textes de locuteurs non natifs ou qu’ils soient si faciles à tromper par GPT », a déclaré James Zou, scientifique en données biomédicales à l’Université de Stanford et co-auteur de la nouvelle étude. .

Parce qu’ils sont faciles à tromper, cela peut amener des anglophones non natifs à utiliser ChatGPT plus souvent, incitant le service à faire sonner leur travail comme s’il avait été écrit par un anglophone natif.

En fin de compte, les deux expériences soulèvent une question cruciale, selon les chercheurs : s’il est si facile de tromper les détecteurs et que le texte humain est souvent mal classé, alors à quoi servent les détecteurs ?

Ma propre expérience de détection GPT

J’ai mené ma propre expérience après avoir lu l’article, en utilisant le même logiciel de détection GPT disponible gratuitement que celui utilisé dans l’étude de Stanford.

J’ai écrit une phrase complètement absurde : « Le chat éléphant parkour s’est envolé sur son vélo-pizza vers une planète qui n’existait que dans le cerveau d’un chauffeur de taxi violet. ‘Ça, c’est une boulette de viande aigre !’ dit-il. Le soleil, aussi délicieux soit-il, est alimenté par des piles et contient une toxine surprenante : les dents de loup.

Un détecteur GPT majeur a suggéré qu’il y avait « une probabilité modérée d’être écrit par l’IA ». J’ai ensuite évalué cinq des détecteurs disponibles gratuitement en ligne et utilisés par l’équipe de Stanford. Deux ont déterminé que c’était écrit par l’IA, deux ont dit qu’il était écrit par un humain et un a dit que je n’avais pas utilisé assez de mots pour atteindre le seuil.

J’ai ensuite utilisé ChatGPT pour écrire un résumé de la vie du scientifique nucléaire J. Robert Oppenheimer avec l’invite « Veuillez écrire un résumé de la vie d’Oppenheimer. » J’ai mis le résumé dans un logiciel de détection, mais il ne serait pas dupe, déterminant qu’il a été écrit par l’IA. Bien.

Ensuite, je suis retourné sur ChatGPT et j’ai utilisé la même invite que les chercheurs utilisés dans l’article : « Élevez le texte fourni en utilisant un langage littéraire. » Cette fois, le résumé de la vie d’Oppenheimer a trompé le détecteur, qui a déclaré qu’il avait probablement été entièrement écrit par un humain. Il a également trompé trois des cinq autres détecteurs.

Comment arriver à un meilleur endroit

Qu’il s’agisse de classer à tort le texte humain comme généré par l’IA ou simplement d’être trompé, les détecteurs ont clairement un problème. Zou mentionne qu’un mécanisme prometteur pour renforcer les détecteurs pourrait être de comparer plusieurs écrits sur le même sujet, y compris les réponses humaines et IA dans l’ensemble, puis de voir s’ils peuvent être regroupés. Cela pourrait permettre une approche plus robuste et équitable.

Et les détecteurs peuvent être utiles d’une manière que nous n’avons pas encore vue. Les chercheurs mentionnent que si un détecteur GPT est conçu pour mettre en évidence les phrases et les structures surutilisées, cela pourrait en fait conduire à plus de créativité et d’originalité dans l’écriture.

Cependant, à ce jour, la course aux armements de génération et de détection a été un peu Wild Westworld, avec des améliorations de l’IA suivies d’améliorations des détecteurs, avec peu de surveillance dans le développement. L’équipe plaide pour des recherches plus approfondies et souligne que toutes les parties concernées par les modèles d’IA générative comme ChatGPT devraient être impliquées dans les conversations sur leur utilisation acceptable.

Jusqu’à ce moment-là, l’équipe « met fortement en garde contre l’utilisation de détecteurs GPT dans des contextes évaluatifs ou éducatifs, en particulier lors de l’évaluation du travail d’anglophones non natifs ».