Un groupe d’auteurs intente un procès intelligence artificielle La start-up Anthropic, qui accuse la société d’avoir commis un « vol à grande échelle » en formant son célèbre chatbot Claude sur des copies piratées de livres protégés par le droit d’auteur.
Alors que poursuites similaires En bataille depuis plus d’un an contre son concurrent OpenAI, créateur de ChatGPT, c’est la première fois que les auteurs ciblent Anthropic et son chatbot Claude.
La petite entreprise basée à San Francisco, fondée par d’anciens dirigeants d’OpenAI, s’est présentée comme le développeur le plus responsable et le plus axé sur la sécurité de modèles d’IA génératifs capables de rédiger des e-mails, de résumer des documents et d’interagir avec les gens de manière naturelle.
Mais la plainte déposée lundi devant un tribunal fédéral de San Francisco allègue que les actions d’Anthropic « ont tourné en dérision ses nobles objectifs » en exploitant des référentiels d’écrits piratés pour construire son produit d’IA.
« Il n’est pas exagéré de dire que le modèle d’Anthropic cherche à tirer profit de l’exploitation de l’expression et de l’ingéniosité humaines derrière chacune de ces œuvres », indique la poursuite.
Anthropic n’a pas immédiatement répondu à une demande de commentaire lundi.
Le procès a été intenté par un trio d’écrivains – Andrea Bartz, Charles Graeber et Kirk Wallace Johnson – qui cherchent à représenter une classe d’auteurs de fiction et de non-fiction se trouvant dans une situation similaire.
Bien qu’il s’agisse de la première affaire intentée contre Anthropic par des auteurs de livres, la société se bat également contre un procès intenté par de grands éditeurs de musique alléguant que Claude régurgite les paroles de chansons protégées par le droit d’auteur.
Le cas des auteurs s’ajoute à un nombre croissant de poursuites intentées contre les développeurs de grands modèles de langage d’IA à San Francisco et à New York.
OpenAI et son partenaire commercial Microsoft sont déjà aux prises avec une série de poursuites pour violation de droits d’auteur menées par des personnalités connues comme John Grisham, Jodi Picoult et le romancier de « Game of Thrones » George RR Martin ; et une autre série de poursuites intentées par des médias tels que Le New York TimesChicago Tribune et Mother Jones.
Le point commun de toutes ces affaires est l’affirmation selon laquelle les entreprises technologiques auraient ingéré d’énormes quantités d’écrits humains pour entraîner des chatbots IA à produire des passages de texte de type humain, sans obtenir la permission ni rémunérer les personnes qui ont écrit les œuvres originales. Les contestations judiciaires ne viennent pas seulement des écrivains, mais aussi artistes visuels, étiquettes de musique et d’autres créateurs qui affirment que les profits de l’IA générative ont été construits sur des détournements.
Anthropic et d’autres entreprises technologiques ont fait valoir que la formation des modèles d’IA s’inscrit dans la doctrine du « fair use » des lois américaines qui autorisent des utilisations limitées de documents protégés par le droit d’auteur, par exemple pour l’enseignement, la recherche ou la transformation de l’œuvre protégée par le droit d’auteur en quelque chose de différent.
Mais le procès intenté contre Anthropic l’accuse d’avoir utilisé un ensemble de données appelé The Pile, qui comprenait un trésor de livres piratés. Il conteste également l’idée selon laquelle les systèmes d’IA apprennent de la même manière que les humains.
« Les personnes qui apprennent à partir de livres en achètent des copies légales ou les empruntent à des bibliothèques qui les achètent, offrant ainsi au moins une certaine mesure de compensation aux auteurs et aux créateurs », indique le procès.
———
L’Associated Press et OpenAI ont un accord de licence et de technologie qui permet à OpenAI d’accéder à une partie des archives textuelles d’AP.