Meta mardi introduit un nouveau modèle de traduction IA « tout-en-un » qu’il a présenté comme une avancée majeure dans la «quête pour créer un traducteur universel».

Le modèle, surnommé SeamlessM4T, est capable de gérer plusieurs types de traductions – y compris le texte à la parole, la parole au texte, la parole à la parole et le texte au texte – dans près de 100 langues. Contrairement à d’autres traducteurs de langues qui utilisent plusieurs modèles, SeamlessM4T est un système unique, qui, selon Meta, « réduit les erreurs et les retards » et augmente « l’efficacité et la qualité du processus de traduction ».

SeamlessM4T s’appuie sur les précédents travaux d’IA de Meta. En juillet 2022, la société a lancé son projet No Language Left Behind, qui utilise l’IA pour effectuer des traductions de texte à texte pour 200 langues en mettant l’accent sur l’amélioration des traductions pour les langues plus rares ou moins couramment utilisées.

La société a également publié des modèles qui vous permettent de discuter avec des robots IA avec des personnalités, ainsi que plus d’informations sur la façon dont elle utilise l’IA pour organiser vos flux Facebook et Instagram.

Comme de nombreuses grandes entreprises technologiques, Meta a mis davantage l’accent cette année sur le développement et le lancement d’outils et de services basés sur l’IA. Microsoft a publié sa nouvelle recherche Bing infusée d’IA en février, qui utilise la même technologie que celle qui alimente ChatGPT d’OpenAI. Amazon a récemment déclaré qu’il utiliserait l’IA générative pour analyser et résumer les avis des clients, et Google teste une expérience générative de recherche qui « réinvente la recherche en ligne ».

L’IA est sur le point de perturber presque tous les secteurs de l’industrie et a trouvé sa place dans tout, de la forme physique à l’embauche. En matière de traduction, l’IA est également utilisée dans des outils tels que l’application Google Translate pour aider à ajouter du contexte aux résultats. L’essor rapide de l’IA générative a également soulevé des inquiétudes quant aux risques de la technologie et aux effets potentiels sur la société.

Comme de nombreux modèles d’IA précédents de Meta, SeamlessM4T est publié sous une licence de recherche pour permettre aux chercheurs et aux développeurs de s’appuyer sur la technologie. Meta publie également les métadonnées du projet dans un ensemble de données nommé SeamlessAlign. Meta dit qu’il s’agit du plus grand ensemble de données multimodales open source, contenant 270 000 heures d’alignement extrait de la parole et du texte sur lequel son IA a été formée.

Pour plus d’informations techniques sur SeamlessM4T, consultez Meta’s publier sur son blog IA ou la recherche de l’entreprise GithubGenericName page.

