Vidéo d’un streamer IA généré par Silicon Intelligence. INTELLIGENCE DU SILICIUM

Une fois l’avatar généré, sa bouche et son corps bougent au rythme de l’audio scripté. Alors que les scripts étaient autrefois pré-écrits par des humains, les entreprises utilisent désormais également de grands modèles de langage pour les générer.

Désormais, tout ce que les travailleurs humains ont à faire est de saisir des informations de base telles que le nom et le prix du produit vendu, de relire le script généré et de regarder l’influenceur numérique passer en direct. Une version plus avancée de la technologie peut repérer les commentaires en direct et trouver les réponses correspondantes dans sa base de données pour répondre en temps réel, de sorte qu’il semble que le streamer IA communique activement avec le public. Elle peut même ajuster sa stratégie marketing en fonction du nombre de téléspectateurs, explique Sima.

Ces clones d’IA en direct sont formés sur les scripts et les gestes courants vus dans les vidéos de commerce électronique, explique Huang Wei, directeur de l’activité de diffusion en direct d’influenceurs virtuels au sein de la société chinoise d’IA Xiaoice. L’entreprise dispose d’une base de données de près d’une centaine de mouvements préconçus.

« Par exemple, [when human streamers say] ‘Bienvenue sur ma chaîne de diffusion en direct. Déplacez vos doigts et appuyez sur le bouton « Suivre », ils pointent définitivement leur doigt vers le haut, car c’est là que se trouve le bouton « Suivre » sur l’écran de la plupart des applications mobiles de diffusion en direct », explique Huang. De même, lorsque les streamers présentent un nouveau produit, ils pointent vers le panier, où les téléspectateurs peuvent trouver tous les produits. Les streamers IA de Xiaoice reproduisent toutes ces astuces courantes. « Nous voulons nous assurer que le langage parlé et le langage corporel correspondent. Vous ne voulez pas qu’il parle du bouton Suivre pendant qu’il applaudit. Cela aurait l’air bizarre », dit-elle.

Issu du Microsoft Software Technology Center Asia en 2020, Xiaoice s’est toujours concentré sur la création d’une IA plus humaine, en particulier d’avatars capables de montrer des émotions. « Pour la plupart des clients, les sites de commerce électronique traditionnels ressemblent à une étagère de produits. Il fait froid. Dans la diffusion en direct, il existe plus de lien émotionnel entre l’hôte et les téléspectateurs, et ils peuvent mieux présenter les produits », explique Huang.

Après avoir testé avec quelques clients l’année dernière, Xiaoice a officiellement lancé cette année son service de génération de clones numériques à moins de 1 000 $ ; comme Silicon Intelligence, Xiaoice n’a besoin que de streamers humains pour fournir une vidéo d’eux-mêmes d’une minute.

Et comme ses concurrents, les clients de Xiaoice peuvent dépenser davantage pour peaufiner les détails. Par exemple, Liu Jianhong, un présentateur sportif chinois, a créé un clone exquis de lui-même pendant la Coupe du Monde de la FIFA 2022 pour lire les résultats du match et d’autres informations pertinentes sur Douyin.

Le clone d’IA de Liu Jianhong annonçant des nouvelles de la Coupe du monde.

Un remplacement bon marché pour les streamers humains

Ces streamers générés ne seront pas en mesure de battre les influenceurs vedettes du commerce électronique, dit Huang, mais ils sont assez bons pour remplacer ceux de niveau intermédiaire. Les créateurs humains, y compris ceux qui ont utilisé leurs vidéos pour entraîner leurs clones d’IA, ressentent déjà dans une certaine mesure la pression de leurs rivaux numériques. Il est plus difficile de trouver un emploi en tant qu’hôte de livestream de commerce électronique cette année, et le salaire moyen des hébergeurs de livestream en Chine a baissé de 20 % par rapport à 2022, selon la société d’analyse iiMedai Research.