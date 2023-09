La plus ancienne bibliothèque numérique du monde, le Projet Gutenberg, a transformé des milliers de livres électroniques en livres audio à l’aide de l’IA, en contournant le processus plus long (et plus coûteux) d’embauche d’un lecteur humain pour faire le travail. C’est exactement le genre d’application d’IA que les acteurs, qui sont actuellement en grève Aux États-Unis, pour la première fois depuis quatre décennies, la peur pourrait mettre leur carrière en danger.

Grâce à la technologie vocale synthétique, le projet Gutenberg, en partenariat avec Microsoft et le MIT, a transformé plus de 5 000 des ebooks de sa collection en accès libre et gratuit en livres audio. Disponible sur Spotify, Apple Podcasts et Google Podcasts, la bibliothèque contient désormais un mélange éclectique de titres tels que Les poèmes de guerre de Siegfried Sassoon et L’Angleterre, mon Angleterre par DH Lawrence, tous sous licence ouverte.

Le recueil est lu avec une voix masculine – jeune, avec un accent américain – dans une prestation qui (pour cet écrivain)les oreilles) est assez naturaliste. Mis à part une pause occasionnelle, jeil serait difficile de le reconnaître comme Discours généré par l’IA.

L’audio IA du projet Gutenbergle lecteur de livre n’est pas à la hauteur de Stephen Fry



Ce qui manque à la lecture, c’est la polyvalence et la profondeur qui les acteurs humains apportent au même travail. C’est un loin de, disons, Stephen Fry, qui a créé une voix unique pour des dizaines de personnages en lisant les livres audio de Harry Potter. Mais les livres audio du Projet Gutenberg sont gratuit, le processus est rapide, et le système de synthèse vocale utilisé est évolutif. La menace qui de telles technologies La pose au travail d’acteur est claire.

La méthodologie du projet Gutenberg a été publiée dans un rapport (pdf) intitulé « Création automatique de livres audio à grande échelle », en septembre. 7, et tLe code du projet est open source. En introduction, l’équipe de recherche mentionne que « la création, l’édition et la publication des livres audio peuvent nécessiter des centaines d’heures d’efforts humains ». Plus tard, les auteurs disent : « Notre système permet aux utilisateurs de personnaliser la vitesse et le style de parole d’un livre audio, l’intonation émotionnelle et peut même faire correspondre une voix souhaitée à l’aide d’une petite quantité d’échantillons audio. »

Project Gutenberg est une organisation à but non lucratif gérée par des bénévoles. dont la mission est d’« encourager la création et la distribution d’ebooks ». Ironiquement, les archives elles-mêmes ont été utilisées pour entraîner l’IA des modèles comme Le lama de Meta.

Quartz a contacté le projet Gutenberg pour commentaires.

UNLes cteurs en grève veulent protéger leurs moyens de subsistance contre l’IA

L’IA a été un point de négociation central dans la grève actuelle des acteurs américains. La Screen Actors Guild et la Fédération américaine des artistes de télévision et de radio (SAG-AFTRA) sont en grève depuis le 14 juillet, exigeant non seulement de meilleurs salaires et des actions de résiduel, mais aussi des protections contre la technologie IA qui peut créer un «réplique numérique» d’un acteur sans son consentement. Les répliques numériques comprennent un l’image de la personne et ainsi que leur voix.

En septembre. 5, Fran Drescher, la présidente de SAG-AFTRA, a écrit dans une lettre au syndicat Les membres ont estimé que les protections contre l’IA étaient non seulement « justes et équitables », mais également nécessaires pour se prémunir contre sa « menace existentielle » pour leur travail, surtout compte tenu de l’absence de réglementation.

« Une grande partie du travail de nos membres dans ce domaine concerne la voix off, et la capacité de créer facilement et à moindre coût des répliques numériques convaincantes des voix des artistes est déjà là et largement disponible », a écrit Drescher dans la lettre. « Sans protections, non seulement ce sera l’avenir de la façon dont les voix des personnages de jeux vidéo seront enregistrées, mais vos propres enregistrements vocaux seront utilisés pour entraîner les systèmes d’IA qui vous remplaceront. »

Le fait que la méthode du Projet Gutenberg puisse utiliser un seul un échantillon audio pour créer une voix de synthèse vocale complète en est un bon exemple.

Cependant, la plupart des doubleurs ne sont pas syndiqués. Seulement unenviron 18 % des professionnels du commerce sont membres de la SAG-AFTRA, selon les données d’un Enquête 2022 menée par la National Association of Voice Actors. Plus que 64% des personnes interrogées ont déclaré qu’elles n’étaient pas syndiquées. Étant donné la nature relativement moins organisée du secteur, cela ne fera que devenir plus facile et Il est plus facile pour l’IA de prendre en charge des tâches que seuls les humains pouvaient effectuer autrefois. Unir leurs voix pourrait être ce qu’il faut pour garantir que les acteurs de la voix peuvent conserver leurs droits d’utilisation.

