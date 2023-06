Rapide et pas cher

Les artistes sont souvent les premiers à expérimenter les nouvelles technologies. Mais l’avenir immédiat de la vidéo générative est façonné par l’industrie de la publicité. Balisage réalisé Le gel pour explorer comment l’IA générative pourrait être intégrée à ses produits. La société fabrique des outils de création vidéo pour les entreprises à la recherche d’un moyen rapide et peu coûteux de faire des publicités. Waymark est l’une des nombreuses startups, aux côtés d’entreprises telles que Softcube et Vedia AI, qui proposent des publicités vidéo sur mesure pour les clients en quelques clics.

La technologie actuelle de Waymark, lancée au début de l’année, rassemble plusieurs techniques d’IA différentes, notamment de grands modèles de langage, la reconnaissance d’images et la synthèse vocale, pour générer une publicité vidéo à la volée. Waymark s’est également appuyé sur son vaste ensemble de données de publicités non générées par l’IA créées pour d’anciens clients. « Nous avons des centaines de milliers de vidéos », déclare le PDG Alex Persky-Stern. « Nous avons tiré le meilleur de ceux-ci et l’avons formé sur ce à quoi ressemble une bonne vidéo. »

Pour utiliser l’outil de Waymark, qu’il propose dans le cadre d’un service d’abonnement à plusieurs niveaux à partir de 25 $ par mois, les utilisateurs fournissent l’adresse Web ou les comptes de médias sociaux de leur entreprise, et il se déclenche et rassemble tout le texte et les images qu’il peut trouver. Il utilise ensuite ces données pour générer une publicité, en utilisant le GPT-3 d’OpenAI pour écrire un script qui est lu à haute voix par une voix synthétisée sur des images sélectionnées qui mettent en valeur l’entreprise. Une publicité d’une minute peut être générée en quelques secondes. Les utilisateurs peuvent modifier le résultat s’ils le souhaitent, peaufiner le script, éditer des images, choisir une voix différente, etc. Waymark indique que plus de 100 000 personnes ont utilisé son outil jusqu’à présent.

Le problème est que toutes les entreprises ne disposent pas d’un site Web ou d’images sur lesquelles s’appuyer, explique Parker. « Un comptable ou un thérapeute peut ne pas avoir d’actifs du tout », dit-il.

La prochaine idée de Waymark est d’utiliser l’IA générative pour créer des images et des vidéos pour les entreprises qui n’en ont pas encore ou qui ne veulent pas utiliser celles qu’elles ont. « C’est l’idée derrière la fabrication Le gel« , explique Parker. « Créer un monde, une ambiance. »

Le gel a une ambiance, c’est sûr. Mais c’est aussi janky. « Ce n’est pas encore un support parfait par tous les moyens », dit Rubin. « C’était un peu difficile d’obtenir certaines choses de DALL-E, comme des réponses émotionnelles dans les visages. Mais à d’autres moments, cela nous ravissait. Nous serions comme, ‘Oh mon Dieu, c’est de la magie qui se passe sous nos yeux.’

Ce processus aléatoire s’améliorera à mesure que la technologie s’améliorera. DALL-E 2, que Waymark fabriquait Le gel, est sorti il ​​y a tout juste un an. Les outils de génération vidéo qui génèrent de courts clips n’existent que depuis quelques mois.

L’aspect le plus révolutionnaire de la technologie est de pouvoir générer de nouveaux plans quand vous le souhaitez, explique Rubin : « Avec 15 minutes d’essais et d’erreurs, vous obtenez le plan que vous vouliez qui s’intègre parfaitement dans une séquence. » Il se souvient avoir coupé le film ensemble et avoir eu besoin de plans particuliers, comme un gros plan d’une botte à flanc de montagne. Avec DALL-E, il pouvait simplement l’appeler. « C’est époustouflant », dit-il. « C’est à ce moment-là que cela a commencé à être une véritable expérience révélatrice en tant que cinéaste. »