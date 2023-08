Meta a pris un mardi, un pas vers un traducteur de langue universel avec la sortie de son nouveau modèle d’IA Seamless M4T, qui, selon la société, peut comprendre rapidement et efficacement la langue à partir de la parole ou du texte dans jusqu’à 100 langues et générer une traduction dans l’un ou l’autre mode de communication. Plusieurs entreprises technologiques ont publié un rapport similaire modèles de traduction d’IA avancés ces derniers mois.

Dans un article de blog, Meta décrit son nouveau système de traduction comme « le premier modèle de traduction d’IA multimodal et multilingue tout-en-un » capable de reconnaître la parole et de traduire la parole en texte dans près de 100 langues différentes. Le modèle peut également interpréter la parole et le texte et restituer des mots parlés traduits dans 36 et 35 langues respectivement. Seamless M4T serait également capable de comprendre quand les utilisateurs changent de langue au milieu d’une phrase, ce qui pourrait être utile lors de l’utilisation d’un modèle pour traduire des personnes qui mélangent des parties de langues lorsqu’elles parlent, ce que les chercheurs en langues appellent le changement de code.

« SeamlessM4T est un modèle multilingue unifié, ce qui signifie qu’il ne s’appuie pas sur des modèles intermédiaires pour produire des résultats », a déclaré Paco Guzmán, responsable scientifique de Meta Research, à Gizmodo. « D’autres systèmes en cascade de traduction orale le font souvent : reconnaissance vocale, traduction de texte, génération de synthèse vocale. SeamlessM4T le fait en une seule fois.

Dans une démo vidéo, Guzmán a prononcé la phrase « notre objectif est de créer un monde plus connecté ». Le modèle a rapidement reconnu que la langue parlée était l’anglais et l’a ensuite traduite en russe. Une voix russe informatisée cracha la phrase avec un timbre plus ou moins humain.

Contrairement à d’autres modèles de traduction antérieurs, SeamlessM4T utilise un système unique qui, selon Meta, entraînera à terme une réduction des erreurs et des retards et une qualité accrue. Meta a comparé cette approche de traduction tout-en-un au traducteur universel Babel Fish dans Le Guide du voyageur galactique. Pour l’instant, vous n’aurez pas à le faire mets celui-ci dans ton oreille.

Meta publie Seamless M4TT sous licence Creative Commons afin que d’autres traducteurs et chercheurs en IA puissent s’en inspirer. La société publie également les métadonnées de SeamlessAlign, qui contiennent plus de 270 000 heures de paroles et de textes extraits. Meta prétend qu’il s’agit du plus grand ensemble de données de ce type.

Même si une grande partie des nouvelles IA de ces derniers mois ont souligné le manque de fiabilité de l’utilisation de grands modèles de langage pour fournir des informations précises informations factuellesla traduction linguistique est quelque chose que ces modèles sont en fait bien- fait pour. Seamless M4T est rendu possible par les itérations précédentes de Meta dans les modèles de traduction. L’un d’eux a innové en traduire avec succès la langue principalement parlée, le Hokkien, en mots parlés, une première pour un nouveau modèle. Plus récemment, la société a publié son Discours massivement multilingue système, qui, selon Meta, peut fournir une détection automatique de la parole et une identification de la langue pour plus de 1 100 langues.