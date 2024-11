Cadre expérimental pour mesurer l’impact de l’utilisation de l’IA sur la créativité humaine. Les participants s’engagent dans une série de cycles d’exposition au cours desquels ils sont randomisés pour recevoir – (A) Aucune assistance, (B) Solution LLM (standard) : cela pourrait être analogue à l’utilisation d’un LLM de chat tel que ChatGPT pour la tâche, ou (C ) Conseils LLM (de type coach) : dans ce cas, les participants reçoivent une réponse d’un LLM personnalisé qui les guide tout au long du processus créatif. Enfin, lors du dernier tour, tous les participants sont invités à effectuer la même tâche créative sans aucune aide, à titre de test. (D) Les performances et les résultats créatifs de ce cycle non assisté sont les principales mesures permettant d’évaluer l’impact de l’utilisation des LLM sur la cognition humaine. Crédit: arXiv (2024). DOI : 10.48550/arxiv.2410.03703



Les grands modèles linguistiques (LLM), des systèmes d’IA capables de traiter le langage humain et de générer de nouveaux textes en réponse à des invites écrites, sont désormais largement utilisés par les personnes du monde entier pour accomplir diverses tâches. Ces systèmes peuvent être utilisés pour créer rapidement divers textes à des fins spécifiques, notamment des courriels professionnels, des rapports, des listes, des articles et des essais, ainsi que des poèmes, des histoires, des scripts et même des paroles de chansons.

Certaines personnes utilisent les LLM comme source d’inspiration ou d’idées, qu’elles adaptent ensuite dans leurs propres mots, tandis que d’autres peuvent choisir d’utiliser directement les textes générés par l’IA sans les modifier. Malgré leur efficacité globale en tant qu’outils créatifs, leur impact réel sur la créativité humaine est encore mal compris.

Des chercheurs de l’Université de Toronto ont récemment entrepris d’explorer comment l’utilisation des LLM lors de tâches créatives affecte la créativité des utilisateurs humains. Leurs découvertes, publié sur le arXiv serveur de prépublication, suggèrent que ces modèles peuvent altérer la capacité des humains à penser de manière créative, ce qui donne lieu à des idées moins variées et innovantes.

« Les outils d’IA générative, tels que ChatGPT, sont de plus en plus utilisés pour des tâches créatives, de la rédaction d’e-mails au brainstorming d’idées », a déclaré Harsh Kumar, co-auteur de l’article, à Tech Xplore.

« Cependant, l’impact à long terme de ces outils sur la créativité humaine suscite de plus en plus d’inquiétudes, qui n’ont pas encore reçu suffisamment d’attention. Nous avons émis l’hypothèse que l’utilisation répétée de grands modèles de langage (LLM) pourrait nuire à notre capacité à penser de manière créative. par nous-mêmes, malgré l’amélioration des performances pendant l’utilisation de l’outil, similaire à l’amélioration temporaire fournie par les stéroïdes améliorant les performances dans le sport.

L’objectif principal de l’étude récente menée par Kumar et ses collègues était de mesurer les effets résiduels de l’utilisation du LLM sur la créativité des utilisateurs humains dans un cadre expérimental. Pour ce faire, ils ont mené deux expériences axées sur différents aspects de la créativité humaine, connus sous le nom de pensée divergente et convergente.

« Les tâches de chaque expérience ont été adaptées de la littérature établie en psychologie », a expliqué Kumar. « Dans l’expérience de pensée divergente, il a été demandé aux participants de générer des utilisations alternatives pour un objet donné à chaque tour, tandis que dans l’expérience de pensée convergente, on leur a présenté trois mots et on leur a demandé de trouver un quatrième mot pour les relier (par exemple, ‘ book’ relie ‘étagère’, ‘journal’ et ‘ver’). »

La première et la deuxième expérience ont été divisées en deux phases distinctes : une phase d’exposition et une phase de test. Au cours de la phase d’exposition, les participants à la condition expérimentale ont reçu des réponses à des questions spécifiques à l’aide de GPT-4o, le LLM conversationnel largement utilisé développé par OpenAI.

Différentes approches de la collaboration LLM : à gauche, les humains et le LLM créent ensemble, mélangeant des idées ; au milieu, les LLM fournissent des conseils que les humains mettent en œuvre ; à droite, l’humain accomplit la tâche de manière indépendante, sans l’aide du LLM. Crédit : Harsh Kumar et al.



Les réponses reçues par GPT-4o étaient spécifiques à la tâche à accomplir. Pour la tâche de réflexion divergente, GPT-4o a fourni des listes d’idées pertinentes, tandis que pour la tâche de réflexion convergente, il a généré un mot qui relierait les trois mots fournis au participant.

« Nous avons également exploré le potentiel du modèle pour servir de coach en fournissant un cadre de réflexion structuré plutôt qu’en proposant directement des solutions », a déclaré Kumar. « Dans la condition de contrôle, les participants n’avaient pas accès à l’assistance LLM. Pendant la phase de test, tous les participants ont effectué les tâches de manière indépendante, ce qui nous a permis de mesurer les effets résiduels de l’utilisation du LLM pendant les cycles d’exposition. »

Les chercheurs ont constaté que dans les deux expériences, l’utilisation du GPT-4o avait amélioré les performances des participants pendant la phase d’exposition. Il est toutefois intéressant de noter que les participants qui n’avaient pas initialement utilisé GPT-4o ont surpassé les participants qui avaient accès au modèle pendant la phase de test.

« Cela suggère que les concepteurs d’outils de créativité basés sur le LLM, ainsi que les développeurs de LLM, devraient considérer non seulement les avantages immédiats de l’utilisation du LLM, mais également l’impact potentiel à long terme sur les capacités cognitives des utilisateurs », a déclaré Kumar. « Sinon, ces outils pourraient par inadvertance contribuer au déclin cognitif au fil du temps. Nous avons également observé, conformément à la littérature existante, que l’utilisation d’idées générées par LLM pendant l’exposition peut conduire à une homogénéisation des idées au sein d’un groupe. »

Les chercheurs ont également été surpris de constater que l’effet d’homogénéisation signalé précédemment (c’est-à-dire la tendance signalée des utilisateurs de LLM à proposer des idées moins diverses au fil du temps) persistait même après que les participants avaient arrêté d’utiliser GPT-4o. Cet effet persistant s’est avéré particulièrement accentué lorsque le modèle leur offrait un cadre général structuré destiné à guider leur réflexion pendant la phase d’exposition des expériences.

Dans l’ensemble, les résultats recueillis par Kumar et ses collègues offrent des informations précieuses qui pourraient guider les efforts futurs visant à développer des LLM et des outils créatifs basés sur l’IA. L’équipe a jusqu’à présent mené ses expériences dans un laboratoire contrôlé, où les participants n’ont été exposés au GPT-4o que pendant une durée limitée, mais elle prévoit bientôt de mener des études supplémentaires dans des scénarios plus réalistes.

« Les contextes du monde réel sont plus complexes et impliquent des périodes d’exposition prolongées », a ajouté Kumar. « Pour résoudre ce problème, nous prévoyons de mener des expériences sur le terrain avec des tâches plus naturelles, comme écrire une histoire créative.

« En outre, nous pensons que la question de l’homogénéisation des idées est importante et entraîne des implications négatives à long terme pour la culture et la société. Dans la prochaine étape, nous avons l’intention d’explorer la conception d’agents LLM capables d’atténuer l’homogénéisation des idées. »

