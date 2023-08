Alibaba a lancé vendredi un nouveau modèle d’intelligence artificielle qui, selon l’entreprise, peut comprendre des images et mener des conversations plus complexes que les produits précédents de l’entreprise, alors que la course mondiale au leadership technologique s’intensifie.

Le géant chinois de la technologie a déclaré que ses deux nouveaux modèles, Qwen-VL et Qwen-VL-Chat, seront open source, ce qui signifie que les chercheurs, les universitaires et les entreprises du monde entier pourront les utiliser pour créer leurs propres applications d’IA sans avoir besoin de former leurs propres systèmes. , économisant ainsi du temps et de l’argent.

Alibaba a déclaré que Qwen-VL peut répondre à des requêtes ouvertes liées à différentes images et générer des légendes d’images.

Qwen-VL-Chat s’adresse quant à lui à des « interactions plus complexes », selon Alibaba, comme comparer plusieurs entrées d’images et répondre à plusieurs séries de questions. Selon Alibaba, Qwen-VL-Chat peut effectuer certaines tâches, notamment l’écriture d’histoires et la création d’images basées sur des photos saisies par un utilisateur, ainsi que la résolution d’équations mathématiques affichées dans une image.

Un exemple donné par Alibaba est celui d’une entrée comportant un panneau d’hôpital en langue chinoise. L’IA peut répondre à des questions sur la localisation de certains services hospitaliers en interprétant l’image du panneau.

Jusqu’à présent, une grande partie de l’IA générative – où la technologie génère des réponses basées sur des entrées humaines – s’est concentrée sur la réponse au texte. La dernière version de ChatGPT d’OpenAI a également la capacité de comprendre les images et de répondre sous forme de texte, un peu comme Qwen-VL-Chat.