Les modèles d’intelligence artificielle (IA) peuvent obtenir de meilleures notes moyennes dans les devoirs de rédaction universitaires que les étudiants réels, suggère un nouveau rapport.

La recherche, publiée dans Scientific Reports, a révélé que ChatGPT égalait ou dépassait les efforts des étudiants pour répondre aux questions d’évaluation dans des matières telles que l’informatique, les études politiques, l’ingénierie et la psychologie.

L’étude a également révélé que près des trois quarts des étudiants interrogés (74 %) utiliseraient ChatGPT pour les aider dans leurs devoirs, bien que 70 % des enseignants le considèrent comme du plagiat.

ChatGPT – un chatbot capable de fournir des réponses détaillées et d’engager des conversations de type humain à l’aide d’invites – a fait irruption dans la conscience publique après sa sortie en novembre de l’année dernière.

Dans le cadre de la recherche, les membres du corps professoral de 32 cours de l’Université de New York à Abu Dhabi (NYUAD) ont soumis trois soumissions d’étudiants chacune pour 10 questions d’évaluation.

ChatGPT a également été invité à produire trois séries de réponses aux 10 questions, qui ont ensuite été évaluées parallèlement aux réponses des étudiants par trois évaluateurs aveugles.

Les résultats ont montré que les réponses générées par ChatGPT ont obtenu une note moyenne similaire ou supérieure à celle des étudiants dans 12 des 32 cours, les mathématiques et l’économie étant les deux seules disciplines dans lesquelles les étudiants ont systématiquement surpassé l’IA.

L’écart de performance entre ChatGPT et les étudiants était beaucoup plus faible sur les questions nécessitant des niveaux élevés de connaissances et de processus cognitifs, par rapport à celles nécessitant des niveaux intermédiaires.





Cela suggère que les enseignants doivent trouver des solutions alternatives pour intégrer, plutôt que prévenir, l’utilisation de l’IA dans le travail scolaire. Talal Rahwan et Yasir Zaki, chercheurs

ChatGPT n’a surpassé les étudiants que sur les questions nécessitant des connaissances factuelles, par opposition à des compétences telles que la créativité, et a connu le plus de difficultés par rapport aux étudiants pour lesquels des questions pièges étaient incluses dans le devoir.

Selon le rapport, il y avait un consensus général parmi les éducateurs et les étudiants selon lequel l’utilisation de ChatGPT dans le travail scolaire devrait être reconnue.

Les étudiants ont également convenu que, dans leur futur emploi, ils pourraient sous-traiter des tâches banales à ChatGPT, leur permettant ainsi de se concentrer sur un travail de fond et créatif.

Talal Rahwan et Yasir Zaki, professeurs d’informatique à NYUAD qui ont dirigé le projet, ont déclaré : « Les outils d’IA tels que ChatGPT ont déjà atteint un niveau où ils peuvent surpasser les étudiants dans un nombre considérable de cours de niveau universitaire.

« De plus, comme l’indique notre enquête, la majorité des étudiants ont l’intention d’utiliser de tels outils pour résoudre leurs devoirs.

« Ces résultats suggèrent que l’évaluation des étudiants par le biais de devoirs à la maison pourrait ne plus servir son objectif à l’ère de l’IA, ce qui soulève un défi de taille pour les établissements d’enseignement du monde entier. »

M. Rahwan et M. Zaki ont ajouté que les établissements d’enseignement doivent « élaborer de toute urgence des politiques d’intégrité académique appropriées » comme moyen de réglementation.

Deux outils utilisés pour identifier le texte généré par l’IA ont également eu du mal à indiquer correctement l’origine des affectations dans la recherche.

Le Text Classifier d’OpenAI a confondu près de la moitié (49 %) des soumissions de ChatGPT avec des données générées par des humains, tandis que GPTZero a mal classé environ un tiers (32 %) des soumissions de la même manière.

M. Rahwan et M. Zaki ont déclaré : « Les classificateurs de texte IA actuels ne peuvent pas détecter de manière fiable l’utilisation de ChatGPT dans le travail scolaire, en raison à la fois de leur propension à classer les réponses écrites par l’homme comme générées par l’IA, ainsi que de la relative facilité avec laquelle le texte généré par l’IA peut être modifié pour échapper à la détection.

« Cela suggère que les éducateurs doivent trouver des solutions alternatives pour intégrer, plutôt que prévenir, l’utilisation de l’IA dans le travail scolaire. »

Un porte-parole du ministère de l’Éducation a déclaré : « L’intelligence artificielle a le pouvoir de transformer l’éducation. Cependant, pour que ce potentiel se réalise, nous devons être capables de comprendre à la fois les opportunités et les risques qu’apporte cette nouvelle technologie.

« C’est pourquoi nous avons lancé un appel à preuves afin que nous puissions apprendre de ceux qui travaillent dans l’éducation – nous aidant ainsi à prendre les bonnes décisions pour tirer le meilleur parti de l’IA générative de manière sûre et sécurisée. »