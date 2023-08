L’IA est, en théorie, sur le point de perturber le travail tel que nous le connaissons aujourd’hui. Mais il est toujours confronté au même problème que tous les nouveaux produits technologiques à la mode avant qu’il n’ait été confronté : le financement du capital-risque est là, mais le modèle commercial à long terme ne l’est pas, en particulier pour les particuliers. Que faites-vous d’un grand modèle d’IA de langage à ce stade, alors que tout ce que vous savez avec certitude, c’est qu’il produira du texte sur commande, avec des degrés de précision variables ?

Une réponse assez simple est d’essayer de vendre ce texte. De préférence, vous voudriez le vendre quelque part où peu importe qu’il soit exact ou non, ou même où l’inexactitude pourrait devenir une fiction et donc une valeur : le marché du livre. Le marché du livre est aussi, commodément, le dernier média textuel où les utilisateurs ont encore l’habitude de payer directement (même un tout petit peu). L’édition est actuellement le point faible que les utilisateurs d’IA de mauvaise foi tentent d’infiltrer.

Légalement parlant, vous ne pouvez pas vendre de texte généré par l’IA, car le texte généré par des machines n’est pas soumis au droit d’auteur (à quelques exceptions près). Néanmoins, les escrocs et les escrocs qui circulent le long du ventre de l’édition intègrent l’IA dans leurs escroqueries et escroqueries existantes. Les éditeurs étudieraient des moyens d’utiliser l’IA lors de réunions discrètes à huis clos. Et les auteurs sont à l’affût de tout ce qui ressemble à une arme à feu pour éliminer ce que beaucoup d’entre eux croient être une menace existentielle pour leur métier.

Tout a commencé en janvier, lorsque des magazines de science-fiction ont rapporté qu’ils étaient inondés de soumissions générées par l’IA. Les rédacteurs en chef pensaient que les influenceurs «side hustle» recommandaient à leurs abonnés d’utiliser l’IA pour générer des nouvelles, puis de les vendre, apparemment en pensant que les auteurs de nouvelles rapportaient beaucoup d’argent. En décembre 2022, a expliqué le rédacteur en chef de Clarkesworld Neil Clarke, le magazine a reçu 50 soumissions frauduleuses; dans la première quinzaine de février 2023, ils en ont reçu près de 350.

En juillet, la Guilde des auteurs commençait à s’inquiéter. Les grands modèles de langage sont entraînés à partir de gros tas de texte. Un livre blanc Meta a nommé un corpus populaire utilisé pour former de grands modèles de langage; ce corpus comprend du texte extrait de soi-disant «bibliothèques fantômes», de vastes collections de livres piratés. Comment n’était-ce pas une violation du droit d’auteur ?

« Nous comprenons que de nombreux livres utilisés pour développer des systèmes d’IA proviennent de sites Web de piratage notoires », a écrit la Guilde des auteurs dans une lettre ouverte aux PDG de diverses sociétés d’IA. « Il n’est que juste que vous nous rémunériez pour l’utilisation de nos écrits, sans lesquels l’IA serait banale et extrêmement limitée. »

La lettre a ensuite appelé les PDG à obtenir l’autorisation d’utiliser du matériel protégé par le droit d’auteur pour la programmation de l’IA, à indemniser les auteurs pour l’utilisation passée et actuelle de leur travail dans la formation à l’IA et à les indemniser davantage pour l’utilisation de leur travail sous la sortie de l’IA.

La Guilde avait raison de s’inquiéter. Le même genre d’influenceur secondaire qui a conseillé à son public de commencer à envoyer des histoires générées par l’IA à des magazines littéraires a également commencé à conseiller à son public de commencer à vendre des livres électroniques générés par l’IA sur Amazon.

« Gagner de l’argent avec Amazon KDP est un jeu de chiffres », conseille l’un de ces articles. « Les arnaqueurs intelligents peuvent cibler un créneau particulier et tirer parti de l’IA pour produire rapidement plusieurs livres tout en accumulant lentement ces douces redevances. »

« Cibler un créneau particulier » peut parfois devenir très spécifique – aussi spécifique que, par exemple, « cibler le créneau des personnes intéressées par les livres d’un auteur particulier en se faisant passer pour cet auteur ». En août, l’écrivain Jane Friedman a rapporté que des « livres poubelles » qu’elle n’avait jamais vus auparavant étaient vendus sur Amazon sous son nom et avaient été ajoutés à son profil Goodreads. Les livres se lisent, dit-elle, exactement comme ce que ChatGPT crache lorsqu’on lui demande son nom. Si c’était le cas, cela signifie qu’une IA entraînée sur le corpus de Friedman (sans la rémunérer) générait maintenant un nouveau texte à vendre sous son nom (là encore sans la rémunérer).

« Celui qui fait cela s’en prend manifestement aux écrivains qui font confiance à mon nom et pensent que j’ai écrit ces livres », a écrit Friedman.

Aucun de ces régimes n’est précisément nouveau. Il y a longtemps qu’il y a des « livres poubelles » en vente sur Amazon : des livres plagiés et des livres avec du texte volé parcourus plusieurs fois par Google Traduction et des livres avec du charabia comme texte. Il n’est pas rare que ces livres aient la signature d’un auteur légitime, pour mieux inciter les lecteurs sans méfiance à les acheter. De même, les gens envoient depuis longtemps des soumissions plagiées à des magazines littéraires.

Ce qui est nouveau en ce moment, c’est l’ampleur de l’opération. L’IA permet aux escrocs et aux arnaqueurs secondaires de faire leur travail en quantités massives.

En juillet, les auteurs Christopher Golden et Richard Kadrey ont rejoint Sarah Silverman pour déposer un recours collectif contre OpenAI et Meta, alléguant que les entreprises utilisaient plusieurs livres, dont les mémoires de Silverman, dans le cadre de leurs ensembles de formation.

Les auteurs, a déclaré Geraldine Brooks au Festival du livre de Martha’s Vineyard ce mois-ci, « sont ceux qui devraient se mettre en grève ». Elle était de plus en plus préoccupée par le fait qu’aucun de ses contrats ne contenait de langage sur l’IA.

C’est dans cette ambiance de plus en plus agitée que le site Prosecraft a fait son apparition début août. Un produit de la société de logiciels Shaxpir qui a été lancé en 2019, Prosecraft classe les livres en fonction du nombre de mots qu’ils ont, de la fréquence à laquelle ils utilisent la voix passive, de la fréquence à laquelle ils utilisent des adjectifs et de la vivacité de leur langage. Sa base de données comprend des analyses pour de nombreux livres déjà sous copyright, bien qu’elle n’inclue pas leur texte.

« Cette société Prosecraft semble avoir volé beaucoup de livres, entraîné une IA et propose désormais un service basé sur ces données », écrit le romancier Hari Kunzru sur Twitter.

Prosecraft n’utilise pas l’IA. Il utilise un algorithme sans aucune propriété d’IA générative. Ce n’est pas non plus particulièrement rentable. Selon le créateur Benji Smith, il « n’a jamais généré de revenus ». Pourtant, les auteurs en masse y voyaient juste plus de la même menace urgente à laquelle ils étaient déjà confrontés : une interface technique élégante que personne n’avait demandée, toute sa valeur retirée de leur propre travail, sans leur permission. Face à un tollé virulent sur les réseaux sociaux, Smith a fait tomber Prosecraft.

Pendant ce temps, le New York Times rapporte qu’environ 50 entreprises qui utilisent réellement l’IA pour créer, emballer, éditer et commercialiser des livres ont été lancées au cours de l’année écoulée. L’ironie ici est que l’édition est une activité dont les marges sont notoirement faibles, et ces marges diminuent. Une enquête de 2018 de la Guilde des auteurs a révélé que le revenu annuel médian des auteurs était de 6 080 $, contre 12 850 $ en 2007. Elle a également révélé que seulement 21 % des auteurs publiés à temps plein tiraient 100 % de leur revenu individuel du revenu lié au livre, et pour ceux qui l’ont fait, le revenu médian était de 20 300 $.

Les gens qui racontent nos histoires sont déjà très, très minces. En tant que culture, nous avons passé des décennies à sous-évaluer leur travail, traitant l’écriture comme un projet passionné qui ne mérite pas de rémunération plutôt que comme un travail qualifié qui devrait être accompagné d’un salaire.

Maintenant, l’IA est devenue un outil puissant que les escrocs peuvent utiliser pour essayer d’aspirer le peu d’argent que nous accordons aux écrivains. L’agitation latérale continue.