Nvidia Corp. (NASDAQ : NVDA) a présenté une IA générative révolutionnaire modèle nommé Fugatto. Ce modèle est conçu comme un outil polyvalent permettant de créer et de modifier des sons à l’aide d’invites textuelles et audio. Fugatto peut générer et transformer un mélange de musique, de voix et de paysages sonores, offrant des capacités sans précédent aux musiciens, développeurs et créateurs de contenu.
Lire aussi : Les actions d’EchoStar coulent alors que DirecTV met fin à l’accord d’acquisition
Fugatto, abréviation de Foundational Generative Audio Transformer Opus 1, prend en charge plusieurs tâches, telles que la génération de nouvelle musique, la modification des accents ou des émotions des voix et la création de paysages sonores entièrement nouveaux. Ces fonctionnalités marquent une avancée significative dans l’innovation de l’IA audio.
Fugatto permet aux utilisateurs de créer un son combinant diverses instructions et invites. Par exemple, il peut produire un son de trompette imitant un chien qui aboie ou générer une voix avec un accent et un ton spécifiques.
Au-delà de la musique, Fugatto ouvre des possibilités en matière de publicité, d’éducation et de jeux. Les annonceurs peuvent ajuster les voix off des campagnes en fonction des audiences régionales, tandis que les enseignants peuvent personnaliser le contenu avec des voix familières aux apprenants. Les développeurs de jeux peuvent modifier les ressources audio ou les générer dynamiquement en fonction du gameplay.
Fugatto, alimenté par un transformateur génératif de 2,5 milliards de paramètres, a été formé sur les systèmes Nvidia DGX avec 32 GPU H100 Tensor Core. Son développement a impliqué une équipe diversifiée couvrant plusieurs pays, ce qui a amélioré ses capacités multilingues et multiaccents. La formation du modèle s’est appuyée sur des millions d’échantillons audio, soigneusement sélectionnés pour permettre des tâches complexes et diverses.
Les débuts de Fugatto marquent une étape importante dans l’IA générative, promettant de remodeler la façon dont les professionnels interagissent avec le son.
Le modèle permet aux utilisateurs de combiner des attributs tels que l’accent, le ton et l’émotion en un seul son cohérent. Par exemple, il peut créer un paysage sonore dynamique passant d’un orage à une aube tranquille.
L’action Nvidia a bondi de 186 % depuis le début de l’année.
La semaine dernière, Nvidia a signalé un chiffre d’affaires du troisième trimestre de 35,1 milliards de dollars, en hausse de 94 %, dépassant l’estimation consensuelle de 33,12 milliards de dollars.
La société a déclaré un BPA de 81 cents, ce qui dépasse l’estimation consensuelle de Street de 75 cents. Nvidia s’attend à ce que le chiffre d’affaires du quatrième trimestre s’élève à 37,5 milliards de dollars, à plus ou moins 2 %.
Les analystes ont souligné le leadership de Nvidia dans les technologies d’IA et de centres de données, avec une forte demande pour ses Blackwell et Hopper des gammes de produits qui stimuleront la croissance jusqu’en 2025.
Les investisseurs peuvent s’exposer à Nvidia via Semi-conducteurs ProShares Ultra (NYSE : USD) et FNB de semi-conducteurs américains EA Series Trust Strive (NYSE : SHOC).