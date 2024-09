Eli Collins, vice-président de la gestion des produits chez Google DeepMind, a présenté pour la première fois des outils vidéo d’IA générative au conseil d’administration de l’entreprise en 2022. Malgré la lenteur du modèle, son coût d’exploitation élevé et ses résultats parfois décalés, il dit que ce fut un moment révélateur pour eux de voir de nouveaux clips vidéo générés à partir d’une invite aléatoire.

Aujourd’hui, quelques années plus tard, Google a plans annoncés pour un outil à l’intérieur de l’application YouTube qui permettra à quiconque de générer des clips vidéo IA, en utilisant le modèle Veo de l’entrepriseet les publier directement dans le cadre de YouTube Shorts. « D’ici 2025, nous allons permettre aux utilisateurs de créer des clips vidéo et des courts métrages autonomes », explique Sarah Ali, directrice principale de la gestion des produits chez YouTube. « Ils pourront générer des vidéos de six secondes à partir d’une invite de texte ouverte. » Ali affirme que la mise à jour pourrait aider les créateurs à la recherche de séquences pour remplir une vidéo ou à essayer d’imaginer quelque chose de fantastique. Elle est catégorique : l’outil Veo AI n’est pas destiné à remplacer la créativité, mais à l’augmenter.

Ce n’est pas la première fois que Google introduit des outils génératifs pour YouTube, même si cette annonce sera l’intégration vidéo IA la plus complète de la société à ce jour. Au cours de l’été, Google a lancé un outil expérimental, appelé Dream Screenpour générer des arrière-plans IA pour les vidéos. Avant le déploiement complet des clips générés l’année prochaine, Google mettra à jour cet outil d’écran vert IA avec le modèle Veo dans les prochains mois.

L’entreprise technologique tentaculaire a présenté plusieurs modèles vidéo d’IA ces dernières années, comme Images et Lumièremais tente de se regrouper autour d’une vision plus unifiée avec le modèle Veo. « Veo sera d’ailleurs notre modèle à l’avenir », déclare Collins. « Il ne faut pas s’attendre à cinq autres modèles de notre part. » Oui, Google sortira probablement un autre modèle vidéo à terme, mais il prévoit de se concentrer sur Veo dans un avenir proche.

Google doit faire face à la concurrence de plusieurs startups qui développent leurs propres outils de conversion générative de texte en vidéo. Sora d’OpenAI est le concurrent le plus connu, mais le modèle vidéo IA, annoncé plus tôt en 2024, n’est pas encore disponible au public et est réservé à un petit nombre de testeurs. En ce qui concerne les outils largement disponibles, la startup d’IA Runway a publié plusieurs versions de son logiciel vidéo, dont un outil récent permettant d’adapter des vidéos originales en versions de réalité alternative du clip.

L’annonce de YouTube intervient alors que les outils d’IA génératifs sont devenus encore plus controversés pour les créateurs, qui considèrent parfois la vague actuelle d’IA comme voler leur travail et en essayant de saper le processus créatif. Ali ne voit pas les outils d’IA génératifs interférer entre les créateurs et l’authenticité de leur relation avec les spectateurs. « Il s’agit vraiment du public et de ce qui l’intéresse, pas nécessairement des outils », dit-elle. « Mais si votre public s’intéresse à la façon dont vous l’avez fait, cela sera visible via la description. » Google prévoit d’apposer un filigrane sur chaque vidéo IA générée pour YouTube Shorts SynthIDqui intègre une balise imperceptible pour aider à identifier la vidéo comme synthétique, ainsi qu’une clause de non-responsabilité « réalisé avec l’IA » dans la description.

Les influenceurs de la culture du bousculade essaient déjà de jeu l’algorithme en utilisant plusieurs outils tiers pour automatiser le processus créatif et gagner de l’argent avec un minimum d’effort. L’intégration de Veo l’année prochaine entraînera-t-elle une nouvelle avalanche de courts métrages YouTube de mauvaise qualité et de spam dominant les flux d’utilisateurs ? « Je pense que notre expérience en matière de recommandation du bon contenu au bon spectateur fonctionne dans ce monde d’IA à grande échelle, car nous le faisons à cette échelle énorme », déclare Ali. Elle souligne également que Règles standard de YouTube cela s’applique toujours quel que soit l’outil utilisé pour créer la vidéo.

L’art de l’IA a souvent un esthétique distinctece qui pourrait être inquiétant pour les créateurs de vidéos qui accordent de l’importance à l’individualité et souhaitent que leur contenu soit unique. Collins espère que les empreintes digitales de Google ne se retrouveront pas partout dans les sorties vidéo de l’IA. « Je ne veux pas que les gens regardent cela et disent : « Oh, c’est le modèle DeepMind » », dit-il. Obtenir l’invite à produire une sortie d’IA alignée sur ce que le créateur a envisagé est un objectif essentiel, et éviter l’esthétique manifeste pour Veo est essentiel pour atteindre une adaptabilité à grande échelle.

« Une grande partie du processus consiste à créer quelque chose d’utile pour les utilisateurs, évolutif et déployable », explique Collins. « Il ne s’agit pas seulement d’une démonstration. Il s’agit d’un produit réel. » Il pense que l’intégration d’outils d’IA générative directement dans l’application YouTube sera une transformation pour les créateurs, ainsi que pour DeepMind. « Nous n’avons jamais vraiment créé de produit pour les créateurs », dit-il. « Et nous ne l’avons certainement jamais fait à cette échelle. »