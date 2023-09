Les auteurs poursuivent Meta pour avoir prétendument utilisé leurs œuvres pour former son logiciel d’intelligence artificielle Llama, selon un recours collectif déposé mardi. L’auteur Michael Chabon, lauréat du prix Pulitzer, fait partie des plaignants répertoriés dans le procèsqui accuse Meta de porter atteinte à sa propriété intellectuelle.

Meta a publié son outil linguistique Llama AI en février, et depuis lors, les auteurs affirment dans le procès que l’entreprise a utilisé leur texte pour entraîner son ensemble de données. Les outils d’IA ajustent la sortie des informations sur la base du texte auquel ils ont été exposés dans le passé et les auteurs affirment : « Une grande partie du matériel contenu dans l’ensemble de données de formation de Meta provient cependant d’œuvres protégées par le droit d’auteur, y compris des œuvres écrites par les plaignants, qui ont été copiées par Meta sans consentement, sans crédit et sans compensation. »

Selon le procès, Meta a déclaré dans un tableau décrivant l’ensemble de données utilisé pour entraîner son modèle d’IA que 85 gigaoctets de données d’entraînement provenaient d’une catégorie « Livres ». Dans cette catégorie, Meta aurait rassemblé des livres du Projet Gutenberg, une archive en ligne composée d’environ 70 000 livres qui sont plus sous copyright et une section Books3 de ThePile.

Bien que Meta n’a pas décrit le contenu de ThePile, selon le procès, selon des informations fournies ailleurs, il est compilé par Bibliotik private tracker, qui est une « bibliothèque fantôme », ce qui signifie que les documents sont disponibles via des systèmes torrent. Les bibliothèques fantômes sont « manifestement illégales », indique le procès.

Un nombre important d’œuvres de Chabon sont disponibles sur Books3, indique le procès, ainsi que de nombreuses œuvres écrites encore protégées par le droit d’auteur des autres auteurs visés par le recours collectif. Parmi les autres plaignants figurent le dramaturge et lauréat d’un Grammy Award David Henry Hwang, l’auteur Matthew Klam, l’auteur et nominé aux Grammy Awards et aux Golden Globes Ayelet Waldman et l’auteur Rachel Louise Snyder.

Le procès déclare : « Les demandeurs et les membres du groupe n’ont pas consenti à l’utilisation de leurs livres protégés par le droit d’auteur comme matériel de formation pour LLaMA. » Il ajoute : « Néanmoins, leurs œuvres protégées par le droit d’auteur ont été copiées et ingérées dans le cadre de la formation LLaMA. Les livres protégés par le droit d’auteur des plaignants apparaissent dans l’ensemble de données que Meta a admis avoir utilisé pour former LLaMA.

Meta a publié sa dernière version, Llama 2 en collaboration avec Microsoft en juillet, il a déclaré qu’il était gratuit pour la recherche et l’utilisation commerciale pour les entreprises comptant moins de 700 millions d’utilisateurs actifs.

Vendredi, les mêmes auteurs ont également déposé un recours collectif procès contre le fabricant de ChatGPT, OpenAI, citant des allégations similaires. Ils prétendent dans le procès que OpenAI a copié leurs travaux pour enseigner leur Système d’IA comment répondre aux invites demandées par les utilisateurs.

Des poursuites ont également été intentées contre d’autres sociétés, notamment Microsoft et Stability AI, qui ont également été accusées d’utiliser du matériel protégé par le droit d’auteur pour former leurs outils d’IA. Les entreprises ont affirmé qu’elles n’enfreignaient pas les lois sur le droit d’auteur car, puisque l’IA aurait transformé l’œuvre originale, elles prétendent qu’elle est considérée comme une utilisation équitable.

« Les modèles d’IA apprennent essentiellement de toutes les informations disponibles. C’est comme si un étudiant allait lire des livres dans une bibliothèque et apprenait ensuite à écrire et à lire », a déclaré Kent Walker, président des affaires mondiales de Google. Le Washington Post. « En même temps, vous devez vous assurer que vous ne reproduisez pas les œuvres d’autrui et que vous ne faites pas des choses qui constitueraient une violation du droit d’auteur », a-t-il ajouté.

Cependant, les auteurs affirment dans les deux procès qu’ils ont été lésés par les entreprises qui auraient utilisé leur matériel protégé par le droit d’auteur pour leurs efforts en matière d’ensembles de données d’IA. Le procès intenté contre Meta indique que les auteurs impliqués dans le recours collectif « ont droit à des dommages-intérêts légaux, à des dommages-intérêts réels, à la restitution des bénéfices et à d’autres recours prévus par la loi ».

Meta et OpenAI n’ont pas immédiatement répondu à la demande de commentaires de Gizmodo.