Tech

La fuite du « Projet Jarvis » met en évidence la superpuissance de Google Gemini 2.0

Points clés à retenir

  • Un nouveau rapport a mis en lumière le prochain agent d’IA de Google, nommé « Projet Jarvis ».
  • Le projet Jarvis serait capable d’automatiser des tâches Web, telles que la réservation de vols, et serait alimenté par Gemini 2.0.
  • Google devrait officialiser le projet Jarvis en décembre, mais son déploiement pourrait être limité à quelques personnes à des fins de tests.




Google a de grandes ambitions en matière d’IA, comme le montrent les nombreux ajustements et mises à niveau apportés au chatbot Gemini au cours des derniers mois. Lors de la conférence des développeurs d’E/S en mai, la société a brièvement parlé d’un « agent IA universel utile dans la vie de tous les jours« , Google affirmant que certaines fonctionnalités de cet agent IA pourraient atterrir sur Gemini cette année. Un nouveau rapport publié ce week-end a révélé de nouveaux détails sur les plans de Google pour cet agent IA.

En rapport

Le projet Astra de Google emmène Gemini AI dans le monde réel

L’idée des Google Glass évolue en pause


Selon un rapport exclusif de Les informations (paywalled), ce projet en cours de développement — soi-disant nommé Projet Jarvis – exploitera le navigateur Web d’un utilisateur pour effectuer l’une des nombreuses tâches, telles que la réservation de vols, la recherche d’informations ou l’achat d’un produit (via Le bord). Google prévoit de présenter le projet Jarvis en décembre, avec une expérience adaptée à Google Chrome, affirme le rapport.

Il sera propulsé par Gemini 2.0, qui devrait atterrir d’ici décembre, le moment ne pourrait donc pas être mieux choisi. Google souhaite déployer les capacités de cet agent IA auprès d’un petit groupe d’utilisateurs dans un premier temps à des fins de test. Nous ne nous attendons donc pas à trouver un large accès à Jarvis lors de son introduction officielle. Il convient également de rappeler que le calendrier de sortie de décembre n’est pas gravé dans le marbre et que Google pourrait choisir de ne pas montrer Jarvis et ses capacités d’ici là, comme le souligne The Information.


Alors comment ça marche ?

Gemini Live fonctionne sur le Google Pixel 9 Pro XL


Sur la base des rapports de la publication, le projet Jarvis est conçu pour « automatiser les tâches quotidiennes basées sur le Web » en capturant des captures d’écran de l’écran en continu et en les comprenant avant que l’utilisateur puisse proposer une saisie supplémentaire via la zone de texte ou en appuyant sur un bouton. Cependant, il convient de noter que les réponses sont quelque peu lentes à l’heure actuelle, « car le modèle doit réfléchir quelques secondes avant d’entreprendre chaque action ». Cela suggère que Jarvis n’est peut-être pas encore prêt pour les heures de grande écoute.

La publication aurait parlé avec trois personnes qui avaient une connaissance directe du sujet, bien qu’il n’y ait aucune image ou vidéo disponible pour démontrer comment Jarvis fonctionnerait. Mais comme notre propre Will Sattelberg l’a noté dans sa couverture d’I/O 2024, cet agent IA ressemble à « une version fonctionnelle de ce que Humane et Rabbit ont promis sur leur matériel dédié » Alors que décembre approche à grands pas, nous espérons en apprendre davantage sur le projet Jarvis et sur ce qu’il peut faire au cours des semaines à venir.


Source link