En 2020, des chercheurs du Center on Terrorism, Extremism and Counterterrorism du Middlebury Institute of International Studies ont découvert que GPT-3, la technologie sous-jacente de ChatGPT, possédait «une connaissance impressionnante et approfondie des communautés extrémistes» et pourrait être incité à produire des polémiques dans le style de tireurs de masse, de faux fils de discussion sur le nazisme, une défense de QAnon et même des textes extrémistes multilingues.

Intelligence artificielle : Pour la première fois, des personnages générés par l’IA ont été détectés dans une campagne de désinformation alignée sur l’État, ouvrant un nouveau chapitre de la manipulation en ligne.

Faux faux Règles: Dans la plupart des pays du monde, les autorités ne peuvent pas faire grand-chose contre les deepfakes, car il existe peu de lois pour réglementer la technologie. La Chine espère être l’exception.

Leçons pour une nouvelle génération : La Finlande teste de nouvelles façons d’enseigner aux élèves la propagande. Voici ce que d’autres pays peuvent apprendre de son succès.

Mythes Covid: Les experts disent que la propagation de la désinformation sur les coronavirus – en particulier sur les plateformes d’extrême droite comme Gab – est susceptible d’être un héritage durable de la pandémie. Et il n’y a pas de solutions faciles

OpenAI utilise des machines et des humains pour surveiller le contenu qui est introduit et produit par ChatGPT, a déclaré un porte-parole. L’entreprise s’appuie à la fois sur ses formateurs humains en intelligence artificielle et sur les commentaires des utilisateurs pour identifier et filtrer les données de formation toxiques tout en apprenant à ChatGPT à produire des réponses mieux informées.

Les politiques d’OpenAI interdisent l’utilisation de sa technologie pour promouvoir la malhonnêteté, tromper ou manipuler les utilisateurs ou tenter d’influencer la politique ; l’entreprise propose un outil de modération gratuit pour gérer les contenus incitant à la haine, à l’automutilation, à la violence ou au sexe. Mais pour le moment, l’outil offre un support limité pour les langues autres que l’anglais et n’identifie pas le matériel politique, le spam, la tromperie ou les logiciels malveillants. ChatGPT avertit les utilisateurs qu’il “peut occasionnellement produire des instructions nuisibles ou un contenu biaisé”.

La semaine dernière, OpenAI a annoncé un outil distinct pour aider à discerner quand le texte a été écrit par un humain par opposition à l’intelligence artificielle, en partie pour identifier les campagnes de désinformation automatisées. La société a averti que son outil n’était pas entièrement fiable – identifiant avec précision le texte de l’IA seulement 26% du temps (tout en étiquetant incorrectement le texte écrit par l’homme 9% du temps) – et pouvait être éludé. L’outil a également eu du mal avec des textes de moins de 1 000 caractères ou écrits dans des langues autres que l’anglais.

Arvind Narayanan, professeur d’informatique à Princeton, écrit sur Twitter en décembre qu’il avait posé à ChatGPT quelques questions de base sur la sécurité de l’information qu’il avait posées aux étudiants lors d’un examen. Le chatbot a répondu avec des réponses qui semblaient plausibles mais qui étaient en fait absurdes, a-t-il écrit.

“Le danger est que vous ne pouvez pas dire quand c’est faux à moins que vous ne connaissiez déjà la réponse.” il a écrit. “C’était tellement troublant que j’ai dû regarder mes solutions de référence pour m’assurer que je ne perdais pas la tête.”

Des tactiques d’atténuation existent – ​​campagnes d’éducation aux médias, données « radioactives » qui identifient le travail des modèles génératifs, restrictions gouvernementales, contrôles plus stricts des utilisateurs, voire exigences de preuve de personnalité par les plateformes de médias sociaux – mais beaucoup sont problématiques à leur manière. Les chercheurs ont conclu qu’il “n’y a pas de solution miracle qui démantèlera singulièrement la menace”.