Un changeur de jeu pour la création de contenu

Parmi les technologies liées à l’IA qui ont émergé au cours des dernières années, il y a l’IA générative, des algorithmes d’apprentissage en profondeur qui permettent aux ordinateurs de générer du contenu original, tel que du texte, des images, de la vidéo, de l’audio et du code. Et la demande pour ce type de contenu augmentera probablement dans les années à venir – Gartner prédit que d’ici 2025, l’IA générative représentera 10 % de toutes les données crééescontre 1 % en 2022.

Capture d’écran de l’œuvre de Jason Allen “Théâtre D’opéra Spatial”, Discord

« Théâtre D’opéra Spatial » est un exemple de contenu généré par l’IA (AIGC), créé avec le programme générateur de texte vers l’art Midjourney. Plusieurs autres programmes de génération d’art basés sur l’IA ont également vu le jour en 2022, capables de créer des peintures à partir d’invites de texte sur une seule ligne. La diversité des technologies reflète un large éventail de styles artistiques et les différentes demandes des utilisateurs. DALL-E 2 et Stable Diffusion, par exemple, se concentrent principalement sur les œuvres d’art de style occidental, tandis que Baidu ERNIE-ViLG et Wenxin Yige produisent des images influencées par l’esthétique chinoise. Lors de la conférence des développeurs d’apprentissage en profondeur de Baidu Wave Summit + 2022, la société a annoncé que Wenxin Yige avait été mis à jour avec de nouvelles fonctionnalités, notamment la transformation de photos en art généré par l’IA, l’édition d’images et la production vidéo en un clic.

Pendant ce temps, AIGC peut également inclure des articles, des vidéos et diverses autres offres multimédias telles que la synthèse vocale. Technologie qui génère une parole audible indiscernable de la voix du locuteur d’origine, la synthèse vocale peut être appliquée dans de nombreux scénarios, y compris la navigation vocale pour les cartes numériques. Cartes Baidupar exemple, permet aux utilisateurs de personnaliser sa navigation vocale à leur propre voix en enregistrant simplement neuf phrases.

Les avancées récentes des technologies d’intelligence artificielle ont également créé des modèles de langage génératifs capables de composer des textes de manière fluide en un seul clic. Ils peuvent être utilisés pour générer des textes marketing, traiter des documents, extraire des résumés et d’autres tâches textuelles, libérant ainsi une créativité que d’autres technologies telles que la synthèse vocale n’ont pas réussi à exploiter. L’un des principaux modèles de langage génératif est ERNIE 3.0 de Baiduqui a été largement appliqué dans diverses industries telles que les soins de santé, l’éducation, la technologie et le divertissement.

« Au cours de l’année écoulée, l’intelligence artificielle a fait un grand bond en avant et a changé d’orientation technologique », déclare Robin Li, PDG de Baidu. “L’intelligence artificielle est passée de la compréhension d’images et de textes à la génération de contenu.” Allant plus loin, Baidu App, une application de recherche et de flux d’actualités populaire avec plus de 600 millions d’utilisateurs mensuels, dont cinq millions de créateurs de contenu, a récemment publié une fonction de montage vidéo qui peut produire une courte vidéo accompagnée d’une voix off créée à partir des données fournies dans un article. .

Améliorer l’efficacité et la croissance

À mesure que l’AIGC devient de plus en plus courant, il pourrait rendre la création de contenu plus efficace en éliminant les tâches répétitives et chronophages pour les créateurs, telles que le tri des ressources sources et des enregistrements vocaux et le rendu des images. Les cinéastes en herbe, par exemple, ont longtemps dû payer leur dû en passant d’innombrables heures à maîtriser le processus complexe et fastidieux du montage vidéo. L’AIGC pourrait bientôt rendre cela inutile.

En plus d’augmenter l’efficacité, l’AIGC pourrait également accroître la croissance des activités de création de contenu dans un contexte de demande croissante de contenu numérique personnalisé avec lequel les utilisateurs peuvent interagir de manière dynamique. Prévisions InsightSLICE que le marché mondial de la création numérique croîtra en moyenne de 12 % par an entre 2020 et 2030 et atteindra 38,2 milliards de dollars. La consommation de contenu dépassant rapidement la production, les méthodes de développement traditionnelles auront probablement du mal à répondre à une telle demande croissante, créant un vide qui pourrait être comblé par l’AIGC. “L’IA a le potentiel de répondre à cette demande massive de contenu à un dixième du coût et cent fois ou milliers de fois plus vite au cours de la prochaine décennie”, a déclaré Li.

L’IA avec l’humanité comme fondement

L’AIGC peut également servir d’outil pédagogique en aidant les enfants à développer leur créativité. HistoireTiroirpar exemple, est un programme basé sur l’IA conçu pour stimuler la pensée créative des enfants, qui décline souvent à mesure que l’accent de leur éducation se déplace vers l’apprentissage par cœur.