Résumé
- Gemini 2.0 Flash Thinking Experimental est un nouveau modèle de raisonnement publié par Google.
- Il s’agit de la première incursion majeure de Google dans les modèles de raisonnement de l’IA.
- Le Gemini 2.0 Flash de Google promet des capacités d’image et audio plus avancées que ses prédécesseurs sous une forme légère.
Il existe aujourd’hui tellement de produits d’intelligence artificielle qu’il peut être difficile de suivre les progrès réalisés par chacun d’eux, en particulier lorsque les mots à la mode marketing se mélangent à la technologie sous-jacente. Google Gemini a été lancé pour la première fois au grand public plus tôt en 2024, et bien qu’il ne s’agisse de loin pas du premier produit d’IA sur lequel Google a travaillé et publié, il s’agit certainement du meilleur effort que l’entreprise ait déployé dans ce domaine. Tous les quelques mois, Gemini sort une nouvelle version, et fin 2024, le modèle expérimental de Gemini 2.0 a été publié, ce qui s’accompagne de meilleures performances sous-jacentes. Avec lui, un nouveau modèle de raisonnement expérimental a été publié.
En rapport
Le modèle expérimental Gemini 2.0 Advanced de Google est là, mais pas pour tout le monde
L’abonnement gratuit de votre Pixel pourrait s’avérer utile
Google a publié le Modèle expérimental Gemini 2.0 Flash Thinking aujourd’hui dans AI Studiola plateforme de prototypage d’IA de l’entreprise. Il est construit à partir du modèle Gemini 2.0 récemment dévoilé et semble être similaire au modèle de raisonnement o1 d’OpenAI, selon TechCrunch. Jeff Dean, scientifique en chef de Google DeepMind, affirme que ce nouveau modèle de raisonnement expérimental est « entraîné à utiliser des pensées pour renforcer son raisonnement », mais lorsque Kyle Wiggers de TechCrunch a testé le modèle, il a eu du mal à répondre à la simple question de savoir combien de fois la lettre « » R » est dans le mot « fraise » (les Gémeaux ont dit qu’il apparaissait deux fois).
Raisons du raisonnement
De toute évidence, l’explosion des produits d’IA a conduit les entreprises à tenter de se différencier de la concurrence, et cela passe généralement par leurs conventions de dénomination et de marketing. Tous les modèles d’IA « raisonnent » dans une certaine mesure. Gemini 2.0 Flash est censé fonctionner en « flash » en tant que modèle léger, et l’IA qui peut raisonner fonctionne toujours à partir de ce à quoi elle a déjà accès. Un avantage distinctif des modèles de raisonnement est qu’ils vérifient eux-mêmes les faits, montrant essentiellement le travail que votre professeur de mathématiques de l’école primaire vous a dit être nécessaire à l’époque. C’est génial, mais cela utilise une tonne de puissance supplémentaire et prend plus de temps que les modèles d’IA « typiques ».
Quoi qu’il en soit, les modèles de raisonnement sont là, mais il reste à savoir si l’on continuera à voir autant de progrès dans des délais aussi courts à l’avenir. Gemini 2.0 Flash, également disponible sur les appareils Android, promet des capacités d’image et audio plus avancées sous une forme légère, comme mentionné précédemment. Il surpasse le Gemini 1.5 Pro complet dans de nombreux tests clés, même avec ses réponses deux fois plus rapides. Google fait rapidement de sérieux progrès, et c’est impressionnant à regarder. Les abonnés Gemini Advanced bénéficient cependant des fonctionnalités les plus avancées, mais vous devrez déterminer si cela vaut le prix pour votre propre cas d’utilisation.