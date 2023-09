À la une cette semaine

Ce qui sera certainement une bonne nouvelle pour les employés de bureau paresseux du monde entier, vous pouvez désormais payer 30 $ par mois pour avoir Google. Duo IA écrire des emails

Google a également lancé un outil de filigrane, SynthID, pour l’une de ses filiales de génération d’images IA. Nous avons interviewé un professeur d’informatique pour expliquer pourquoi cela pourrait (ou non) être une bonne nouvelle.

Dernier point mais non le moindre : c’est maintenant votre chance de dire au gouvernement ce que vous pensez des problèmes de droits d’auteur entourant les outils d’intelligence artificielle. Le US Copyright Office a officiellement ouvert ses portes commentaire public

Les amis créateurs de ChatGPT jusqu’au Congrès | Technologie du futur

Photo : VegaTews ( Shutterstock )

L’histoire à la une : le sommet sur l’IA de Schumer

Chuck Schumer a annoncé que son bureau rencontrera les meilleurs acteurs du domaine de l’intelligence artificielle plus tard ce mois-ci, dans le but de recueillir des commentaires susceptibles d’éclairer les réglementations à venir. En tant que leader de la majorité au Sénat, Schumer détient un pouvoir considérable pour orienter la forme future des réglementations fédérales, si elles émergent. Cependant, les personnes qui participent à cette réunion ne représentent pas exactement l’homme ordinaire. Le mégamilliardaire de la technologie Elon Musk, son ancien président, est invité au prochain sommet. partenaire d’entraînement hypothétique Mark Zuckerberg, PDG de Meta, Sam Altman, PDG d’OpenAI, Sundar Pichai, PDG de Google, Jensen Huang, président de NVIDIA, et Alex Karpy, PDG de l’entrepreneur de défense Palantir, parmi d’autres grands noms des échelons supérieurs de la Silicon Valley.

La prochaine réunion de Schumer – que son bureau a surnommée « AI Insight Forum » – semble montrer que quelques Une sorte de mesure réglementaire est peut-être en préparation, mais – d’après la liste des invités (un groupe de vautours de l’entreprise) – il ne semble pas nécessairement que cette mesure soit adéquate.

La liste des personnes participant à la réunion avec Schumer a ga suscité de nombreuses critiques en ligne, de la part de ceux qui y voient un véritable who’s who des acteurs corporate. Cependant, le bureau de Schumer a déclaré que le sénateur se réunira également avec certains dirigeants des droits civiques et des syndicats, notamment l’AFL-CIO, la plus grande fédération de syndicats d’Amérique, dont la présidente, Liz Schuler, comparaîtra à la réunion. Pourtant, il est difficile de ne pas voir cette réunion à huis clos comme une opportunité pour l’industrie technologique de implorer l’un des politiciens les plus puissants d’Amérique de faire preuve de clémence en matière de réglementation. Seul le temps nous dira si Chuck aura le courage d’écouter ses meilleurs anges ou s’il cédera aux diablotins gorgés d’argent qui envisagent de se percher sur son épaule et de lui murmurer des mots doux.

Question du jour : quel est le problème avec SynthID ?

Comme IA générative Des outils comme ChatGPT et DALL-E ont explosé en popularité, les critiques craignent que l’industrie, qui permet aux utilisateurs de générer de faux textes et images, ne génère une quantité massive de désinformation en ligne. La solution qui a été proposée s’appelle filigrane, un système par lequel le contenu de l’IA est automatiquement et invisiblement estampillé d’un identifiant interne lors de sa création, lui permettant d’être identifié comme synthétique ultérieurement. Cette semaine, DeepMind de Google a lancé une version bêta d’un outil de filigrane qui, selon lui, facilitera cette tâche. ID de synthétiseur est conçu pour fonctionner pour les clients DeepMind et leur permettra de marquer les actifs qu’ils créent comme synthétiques. Malheureusement, Google a également rendu l’application facultative, ce qui signifie que les utilisateurs n’auront pas à tamponner leur contenu s’ils ne le souhaitent pas.

Photo : Université de Waterloo

L’interview : Florian Kerschbaum sur les promesses et les pièges du filigrane IA

Cette semaine, nous avons eu le plaisir de nous entretenir avec le Dr Florian Kerschbaum, professeur à la David R. Cheriton School of Computer Science de l’Université de Waterloo. Kerschbaum a étudié de manière approfondie les systèmes de filigrane dans l’IA générative. Nous voulions interroger Florian sur le récent lancement de SynthID par Google et s’il pensait que c’était un pas dans la bonne direction ou non. Cette interview a été éditée par souci de concision et de clarté.

Pouvez-vous nous expliquer un peu comment fonctionne le filigrane IA et quel est son objectif ?

Le filigrane fonctionne essentiellement en intégrant un message secret à l’intérieur d’un support particulier que vous pourrez ensuite extraire si vous connaissez la bonne clé. Ce message doit être conservé même si l’actif est modifié d’une manière ou d’une autre. Par exemple, dans le cas d’images, si je les redimensionne, les éclaircit ou y ajoute d’autres filtres, le message doit toujours être conservé.

Il semble que ce système puisse présenter certaines failles de sécurité. Existe-t-il des situations dans lesquelles un mauvais acteur pourrait tromper un système de tatouage ?

Les filigranes d’images existent depuis très longtemps. Ils existent depuis 20 à 25 ans. En gros, tous les systèmes actuels peuvent être contournés si l’on connaît l’algorithme. Cela pourrait même suffire si vous avez accès au système de détection d’IA lui-même. Même cet accès pourrait suffire à casser le système, car une personne pourrait simplement effectuer une série de requêtes, au cours desquelles elle apporterait continuellement de petites modifications à l’image jusqu’à ce que le système ne reconnaisse finalement plus l’actif. Cela pourrait fournir un modèle pour tromper globalement la détection de l’IA.

La personne moyenne exposée à la mésinformation ou à la désinformation ne vérifiera pas nécessairement chaque élément de contenu qui apparaît sur son fil d’actualité pour voir s’il est filigrané ou non. Cela ne semble-t-il pas être un système présentant de sérieuses limites ?

Nous devons faire la distinction entre le problème de l’identification du contenu généré par l’IA et le problème de contenir la propagation des fausses nouvelles. Ils sont liés dans le sens où l’IA facilite grandement la prolifération de fausses nouvelles, mais vous pouvez également créer de fausses nouvelles manuellement – ​​et ce type de contenu ne sera jamais détecté par un tel système. [watermarking] système. Nous devons donc considérer les fausses nouvelles comme un problème différent mais lié. De plus, il n’est pas absolument nécessaire que chaque utilisateur de la plateforme vérifie [whether content is real or not]. Hypothétiquement, une plateforme, comme Twitter, pourrait automatiquement vous rechercher. Le fait est que Twitter n’est en réalité aucunement incité à le faire, car il diffuse effectivement de fausses nouvelles. Ainsi, même si je pense qu’à terme, nous serons capables de détecter le contenu généré par l’IA, je ne crois pas que cela résoudra le problème des fausses nouvelles.

Outre le filigrane, quelles autres solutions potentielles pourraient aider à identifier le contenu synthétique ?

Nous en avons essentiellement trois types. Nous avons un filigrane, qui nous permet de modifier légèrement la distribution de sortie d’un modèle afin que nous puissions le reconnaître. L’autre est un système dans lequel vous stockez tout le contenu d’IA généré par une plate-forme et pouvez ensuite demander si un élément de contenu en ligne apparaît ou non dans cette liste de matériaux… Et la troisième solution consiste à essayer de détecter des artefacts. [i.e., tell tale signs] de matière générée. À titre d’exemple, de plus en plus d’articles universitaires sont rédigés par ChatGPT. Si vous accédez à un moteur de recherche d’articles universitaires et saisissez « En tant que grand modèle de langage… » [a phrase a chatbot would automatically spit out in the course of generating an essay] vous trouverez tout un tas de résultats. Ces artefacts sont bel et bien présents et si nous entraînons des algorithmes à reconnaître ces artefacts, c’est une autre façon d’identifier ce type de contenu.

Donc, avec cette dernière solution, vous utilisez essentiellement l’IA pour détecter l’IA, n’est-ce pas ?

Ouais.

Et puis, avec la solution précédente – celle impliquant une base de données géante de matériel généré par l’IA – il semble qu’elle poserait des problèmes de confidentialité, n’est-ce pas ?

C’est exact. Le défi en matière de confidentialité avec ce modèle particulier réside moins dans le fait que l’entreprise stocke chaque élément de contenu créé, car toutes ces entreprises l’ont déjà fait. Le plus gros problème est que pour qu’un utilisateur puisse vérifier si une image est une IA ou non, il devra soumettre cette image au référentiel de l’entreprise pour la vérifier. Et les entreprises en conserveront probablement également une copie. Donc ça m’inquiète.

Alors, laquelle de ces solutions est la meilleure, selon vous ?

En matière de sécurité, je suis convaincu qu’il ne faut pas mettre tous ses œufs dans le même panier. Je pense donc que nous devrons utiliser toutes ces stratégies et concevoir un système plus large autour d’elles. Je crois que si nous le faisons – et nous le faisons avec précaution – alors nous avons une chance de réussir.

Rattrapez tout L’actualité de l’IA de Gizmodo iciou voir toutes les dernières nouvelles ici. Pour les mises à jour quotidiennes, abonnez-vous à la newsletter gratuite Gizmodo.