À la une cette semaine

Dans une grande victoire pour les artistes humains, un juge de Washington DC a gouverné que l’art généré par l’IA ne bénéficie pas de protections par le droit d’auteur.

que l’art généré par l’IA ne bénéficie pas de protections par le droit d’auteur. Meta a libéré SeamlessM4T, un traducteur automatisé de parole et de texte qui fonctionne dans des dizaines de langues.

SeamlessM4T, un traducteur automatisé de parole et de texte qui fonctionne dans des dizaines de langues. Nouveau recherche montre que les fermes de contenu utilisent l’IA pour extraire et reconditionner des articles d’actualité provenant de sites médiatiques existants. Nous avons ci-dessous une interview avec l’un des chercheurs qui ont découvert ce gâchis.

montre que les fermes de contenu utilisent l’IA pour extraire et reconditionner des articles d’actualité provenant de sites médiatiques existants. Nous avons ci-dessous une interview avec l’un des chercheurs qui ont découvert ce gâchis. Dernier point mais non le moindre : Stephen King a quelques réflexions

Les flics arrêtent une voiture autonome

L’histoire à la une : le grand trébuchement de Cruise

Image : Pavel Vinnik ( Shutterstock )

Depuis des années, la Silicon Valley nous promet voitures autonomes. Pendant autant d’années, imparfait technologie a contrecarré ces promesses. Ces dernières semaines, cependant, il semble que nos rêves d’un avenir sans conducteur pourraient enfin se réaliser. Dans une décision rendu le 10 août, la California Public Utilities Commission approuvé opérations élargies pour deux grands «robot-taxi« Waymo de Google et Cruise de GM. Les deux sociétés, qui testent leurs véhicules automatisés dans la Bay Area depuis des années, ont eu essentiellement carte blanche pour s’ouvrir et commencer à gagner de l’argent grâce à leurs voitures sans conducteur.

Cela a été à juste titre salué comme une très grosse affaire pour l’industrie du transport autonome, car c’est pratiquement la première fois que des voitures autonomes sont lancées de cette manière. Selon la décision de la CPUC, Waymo est désormais autorisée à exploiter un « service commercial de passagers » via ses véhicules sans conducteur, et ses voitures pourront voyager librement à la fois dans San Francisco et dans certaines zones du comté de San Mateo ; ils seront autorisés à le faire à toute heure de la journée, à des vitesses allant jusqu’à 65 mph, dans toutes les conditions météorologiques. La croisière a bénéficié de privilèges similaires à SF, à des vitesses allant jusqu’à 35 mph. De plus, aucune des deux sociétés n’a besoin de doter ses taxis autonomes de « opérateurs de sécurité » les chaperons humains qui aident traditionnellement à guider les véhicules automatisés.

En bref : la semaine dernière, il semblait vraiment que les deux sociétés étaient prêtes à prendre la route et à ne jamais regarder en arrière.

Mais ce bref moment de triomphe fut presque immédiatement interrompu par une malheureuse série d’événements. Tard jeudi soir, l’un des taxis de Cruise percuté un camion de pompiers dans le quartier de Tenderloin, envoyant un employé de Cruise à l’hôpital. Peu de temps après, un autre taxi Cruise s’est arrêté à un carrefour de la ville, provoquant d’importants retards de circulation dans la région. Du jour au lendemain, les succès de Cruise semblaient s’évaporer. Vendredi, le ministère des Véhicules automobiles a ordonné à l’entreprise à réduire de moitié le nombre de véhicules qu’elle avait sur les routes de la ville, citant de « récents incidents préoccupants » impliquant ses voitures. L’entreprise s’est scrupuleusement conformée, réduisant de 50 % sa flotte.

Les taxis autonomes bloqués obstruent les rues de San Francisco

Cette tournure des événements place désormais le voyage autonome à un étrange carrefour. Avec l’assouplissement des restrictions réglementaires, il est probable que ces voitures occuperont une place de plus en plus grande dans nos vies. L’avenir qui nous a été promis est celui dans lequel les déplacements quotidiens sont un expérience de luxe entièrement automatisée; votre robotaxi dévalera l’autoroute en utilisant uniquement ses algorithmes conçus par des experts pour naviguer, pendant que vous ferez une sieste dans le siège du conducteur ou regarderez un film sur votre iPhone. Mais est-ce vraiment ainsi que les choses vont se passer ? Ou les véhicules autonomes serviront-ils principalement à boucher les intersections, à provoquer des accrochages, ou pire encore ?

Barry Brown, professeur d’informatique à l’Université de Stockholm à Copenhague, a déclaré à Gizmodo que, malgré le battage médiatique, les voitures autonomes sont encore loin de ce qu’elles devraient être lorsqu’il s’agit de naviguer dans des systèmes routiers complexes. Brun a étudié des voitures autonomes depuis des années et dit qu’il y a une chose pour laquelle ils ne sont pas particulièrement doués : lire la pièce ou la route, pour ainsi dire. « Ils ont du mal à comprendre les intentions des autres conducteurs », a-t-il déclaré. « Nous, les humains, sommes en fait très doués pour cela, mais ces voitures autonomes ont vraiment du mal à résoudre ce problème. »

Le problème, du point de vue de Brown, est que les routes sont en réalité des domaines sociaux, riches en signaux interpersonnels subtils qui indiquent aux conducteurs comment interagir les uns avec les autres et avec leur environnement. Malheureusement, les voitures autonomes ne sont pas très douées pour capter ces signaux et s’apparentent davantage à des enfants qui n’ont pas encore été socialisés correctement.

« Nous ne laissons pas les enfants de cinq ans conduire. Nous attendons que les gens atteignent un âge où ils aient beaucoup d’expérience dans la compréhension de la façon dont les autres bougent », a déclaré Brown. « Nous sommes tous des experts dans l’art de naviguer parmi des foules de gens et nous mettons également cette compréhension à profit lorsque nous conduisons. Les voitures autonomes, même si elles sont très efficaces pour prédire la trajectoire et les mouvements, ont du mal à capter les signaux des autres usagers de la route pour comprendre ce qui se passe. Les environnements urbains complexes sont une situation dans laquelle ces véhicules ne seront pas prêts à circuler de si tôt, ajoute-t-il. « Il y a des problèmes fondamentaux comme le passage à la vitesse, mais si vous obtenez des situations plus compliquées – s’il y a des cyclistes, quand il y a des piétons sur la route, quand il y a un trafic très dense, comme à New York – ces problèmes s’aggravent et deviennent encore plus graves. Plus fort. »

L’interview : Jack Brewster de NewsGuard sur la montée du robot anti-plagiat

Photo : Jack Brewster

Cette semaine, nous avons discuté avec Jack Brewster, analyste senior chez NewsGuard, dont l’équipe a récemment publié un rapport sur la façon dont les outils d’IA sont utilisés par des sites Web de mauvaise qualité pour plagier le contenu d’actualité des sites médiatiques traditionnels. Le rapport, qui met en lumière le monde étrange et émergent de Agriculture de contenu IA, montre que certains sites semblent avoir entièrement automatisé le processus de création d’articles, en utilisant des robots pour gratter les sites d’actualités, puis en utilisant des chatbots IA pour réécrire ce contenu dans des actualités agrégées, qui sont ensuite monétisées via des accords publicitaires. Cette interview a été éditée par souci de concision et de clarté.

Comment avez-vous entendu parler de cette tendance pour la première fois ??

Nous suivons ce que nous aimons appeler les UAIN, des sites Web d’information peu fiables générés par l’IA. Fondamentalement, il s’agit de n’importe quel site qui semble être une ferme de contenu de nouvelle génération qui utilise l’IA pour publier des articles. En parcourant ces sites, je remarquais ces erreurs de publication [many of the articles included blatant remnants of chatbot use, including phrases like “As an AI language model, I am not sure about the preferences of human readers…”]. J’ai réalisé que jamais auparavant nous n’avions eu la possibilité de brouiller et de réécrire un article de presse en un clin d’œil. Je voulais voir combien de sites utilisaient l’IA pour ce faire – et c’était en quelque sorte le début.

Guidez-moi à travers le processus de plagiat de l’IA. Comment une personne ou un site Web pourrait-il prendre un article du New York Times, l’introduire dans un chatbot et obtenir une histoire « originale » ?

L’un des principaux points à retenir est que beaucoup de ces sites semblent faire cela. automatiquement– ce qui signifie qu’ils ont totalement automatisé le processus de copie. Il est probable que les programmeurs d’un site mettent en place du code là où ils ont quelques sites Web cibles ; ils utilisent des robots pour explorer le contenu de ces sites Web, puis alimentent les données dans une API de modèle de langage à grande échelle, comme ChatGPT. Les articles sont ensuite publiés automatiquement, sans intervention humaine. C’est pourquoi je pense que nous voyons apparaître ces messages « d’erreur », car le processus n’est pas encore transparent, du moins pas pour les sites que nous avons interrogés. Évidemment, la question suivante est la suivante : eh bien, si ce sont les sites qui sont les plus négligents, combien de centaines, voire de milliers, sont un peu plus prudents et suppriment ces messages d’erreur ou ont rendu le processus complètement transparent.

Selon vous, quelles sont les implications pour l’industrie de l’information ? On pourrait affirmer que, si cette tendance devient suffisamment importante, elle siphonnera une grande partie du trafic Web des organisations médiatiques légitimes.

Je dirai deux choses. La première et la plus importante chose que l’industrie de l’information doit comprendre est de savoir comment définir cette tendance… S’agit-il d’un plagiat suralimenté ou d’une agrégation efficace ? Je pense que c’est aux médias qui sont touchés d’en parler, et aussi aux tribunaux de décider. L’autre chose que je dirai, c’est que…[this trend] a un impact sur notre écosystème d’information. Même si ces sites ne diffusent pas de fausses informations en soi, s’ils augmentent de façon exponentielle le nombre d’articles qui inondent les voies par lesquelles nous obtenons de nouvelles informations, il sera très difficile pour l’individu moyen de distinguer le contenu de qualité du contenu de mauvaise qualité. Cela a un impact sur notre expérience de lecture et sur la difficulté d’accéder à des informations de qualité.

Qu’en est-il de l’industrie de l’IA ? Quelle responsabilité les entreprises d’IA ont-elles pour aider à résoudre ce problème ??

Ce que je dirai, c’est que l’une des choses les plus importantes que nous avons rencontrées lors de nos recherches sur cette histoire est le filigrane… c’est l’une des choses que nous avons rencontrées lorsque nous faisions des recherches sur certaines mesures de sécurité qui pourraient être mises en place pour arrete ca. Encore une fois, c’est aux gouvernements, aux politiciens et aux entreprises d’IA elles-mêmes de décider. [whether they want to pursue that].

Pensez-vous que les journalistes humains devraient s’inquiéter de cela ? Un pourcentage important de l’industrie du journalisme tourne désormais autour de l’agrégation d’informations. Si vous pouvez amener un robot à faire cela avec très peu d’effort, ne semble-t-il pas probable que les entreprises de médias s’orienteront vers ce modèle parce qu’elles n’auront pas à payer un algorithme pour générer du contenu pour elles ?

Oui, je suppose que ce que je dirai, c’est que vous pouvez imaginer un monde dans lequel quelques sites créent du contenu original et des milliers et des milliers de robots copient, réécrivent et crachent des versions de ce contenu original. Je pense que c’est quelque chose dont nous devrions tous nous préoccuper.