Lorsque Apple a lancé le premier iPhone sur la scène technologique en 2007, la société a réécrit les règles du smartphone. Près d’une décennie plus tard, les smartphones sont devenus des appareils sur lesquels nous passons des heures, plutôt que des outils qui nous font gagner un temps précieux. Quelques startups technologiques se mobilisent maintenant pour se recentrer sur le côté pratique des smartphones, afin que vous puissiez enfin donner à votre cou une pause.
Après les débuts de Humane avec AI Pin en novembre dernier, un nouvel acteur est entré en scène avec une approche innovante consistant à remplacer les dalles rectangulaires empochables par une autre dalle rectangulaire plus petite. « Notre mission est de créer l’ordinateur le plus simple, quelque chose de si intuitif que vous n’avez pas besoin d’apprendre à l’utiliser », a déclaré Jesse Lyu, fondateur de Rabbit, au Consumer Electronics Show de Las Vegas. Et à en juger par le discours d’ouverture, l’idée semble plutôt prometteuse.
Entrez dans le Rabbit R1, un appareil de poche de la taille d’une pinte alimenté par un système d’exploitation en langage naturel. L’objectif est d’écrire l’histoire des interactions avec les applications en présentant une nouvelle approche de la gestion de nos vies. Lyu a souligné que les smartphones sont devenus des centres de divertissement chronophages, renversant leur objectif initial. Il a également jeté de l’ombre sur le concept même des applications, le qualifiant de lourd et lui reprochant de nous faire plisser les yeux devant les écrans pendant des éternités.
Rabbit vise à démêler ce désordre en lançant un petit appareil de poche qui répond à votre voix pour toutes les tâches imaginables sur un smartphone : appeler un trajet, commander de la nourriture et des courses, et les choses habituelles comme envoyer des messages, passer des appels et brouiller sur Spotify. Lors du discours d’ouverture, Lyu a démontré comment Rabbit OS, le système d’exploitation propriétaire derrière le R1, s’intègre de manière transparente à ces services. Ce qui distingue Rabbit OS, c’est qu’il ne se connecte pas seulement à des services tiers ; essentiellement, il « voit » les applications et effectue des actions en votre nom, en rationalisant le tout grâce à de simples commandes vocales.
Par exemple, lire un morceau sur Spotify devient un jeu d’enfant grâce au LAM (Large Action Model) de Rabbit qui comprend les étapes et les traduit en action via Rabbit OS. L’entreprise se vante que ce modèle est formé pour reconnaître « tous les environnements mobiles et de bureau », promettant une gestion robuste des tâches.
La magie derrière ces capacités réside, sans surprise, dans l’intelligence artificielle. Rabbit OS est livré avec un modèle d’IA connu sous le nom de Large Action Model (LAM). « Le grand modèle de langage comprend ce que vous dites, tandis que le grand modèle d’action fait avancer les choses », a expliqué Lyu. Équiper un système d’exploitation de ce modèle lui permet d’exécuter des actions uniquement via votre voix, éliminant ainsi le besoin de tâtonner dans les applications. Rabbit OS peut même apprendre par démonstration, en se souvenant de la manière dont vous effectuez une tâche et en la reproduisant lorsque cela vous est demandé. Les créateurs de Rabbit affirment avoir entraîné de nombreuses séquences pour des applications populaires, et les capacités du R1 ne feront qu’augmenter avec le temps.
Aujourd’hui, la question brûlante est de savoir comment tout cela va se dérouler dans le monde réel. Le R1 offre des fonctionnalités autonomes et il existe un portail Web appelé Rabbit Hole sur lequel vous pouvez vous connecter à tous vos services. Si vous souhaitez enseigner à l’appareil quelque chose comme Photoshop, Rabbit vous propose des machines virtuelles sur son portail Web. Cependant, le véritable défi consiste à faire en sorte que cela fonctionne de manière transparente pour une myriade d’utilisateurs sur divers appareils et plates-formes. C’est un problème difficile à résoudre, mais Rabbit semble déterminé à le comprendre.
En quoi le Rabbit R1 diffère-t-il du Humane AI Pin ?
À première vue, Rabbit R1 et Humane AI Pin peuvent sembler assez semblables. Les deux disposent de systèmes d’exploitation sans application – Rabbit OS pour le R1 et Cosmos pour le Humane AI Pin. Ils visent tous deux à rationaliser vos requêtes en les dirigeant automatiquement vers les bons outils au lieu de vous obliger à télécharger et à gérer des applications.
Mais il existe encore quelques différences essentielles. À en juger par les démos AI Pin, l’appareil semble fonctionner davantage comme un moteur de recherche portable alimenté par LLM. Ses capacités actuelles véhiculent l’idée qu’il s’agit d’un compagnon de type ChatGPT avec lequel vous pouvez converser. Mais il existe également des fonctionnalités pratiques améliorant la productivité. Par exemple, une option « rattrapez-moi » résume votre boîte de réception e-mail et vos SMS. Vous pouvez même utiliser sa caméra intégrée pour numériser les aliments et recevoir des informations nutritionnelles, offrant ainsi un aperçu de votre consommation alimentaire quotidienne. La traduction en temps réel est une autre fonctionnalité pratique pour une communication transparente au-delà des barrières linguistiques.
Humane AI a également une approche complètement différente du « problème des applications ». Rabbit R1 adopte une approche directe en imitant les actions de votre téléphone sans s’appuyer sur des API spécifiques aux applications – et traite probablement tout dans le cloud. Cela signifie aucun partenariat formel avec les applications qu’il prévoit de prendre en charge. D’un autre côté, Humane prévoit d’ajouter des fonctionnalités similaires à l’avenir, telles que la navigation et les achats, mais avec une stratégie différente. L’entreprise vise à collaborer avec les développeurs d’applications, leur permettant de créer leurs propres outils d’intégration.
En fin de compte, étant donné que l’approche de Rabbit est plus ouverte et qu’elle n’exige pas que l’entreprise mette en commun ses ressources avec les applications qu’elle souhaite prendre en charge, le potentiel de ce qu’elle peut faire est illimité. Vous pouvez entraîner l’IA à effectuer n’importe quelle tâche que vous pouvez effectuer sur votre smartphone. D’un autre côté, Humane adopte une approche plus stricte puisqu’il souhaite que les développeurs créent leurs propres outils qui exécuteront la plate-forme Humane.
Ensuite, il y a des différences dans le département matériel. Le Humane AI Pin est un appareil très différent et semble viser bien plus. Il dispose d’un appareil photo 13MP, d’un projecteur intégré affichant des informations sur votre main, d’un pavé tactile et d’un Trust Light signalant lorsque vous enregistrez. Il propose également divers accessoires pour le fixer à votre chemise, le tout alimenté par une puce Qualcomm octa-core. Essentiellement, c’est un compagnon invocable chaque fois que vous en avez besoin.
Pendant ce temps, le Rabbit R1 vise à reposer là où se trouve votre smartphone – et peut-être même à le remplacer un jour – plutôt que sur votre poitrine. Avec un haut-parleur, un écran tactile de 2,88 pouces et une caméra rotative appelée « œil de lapin » pour les photos et les vidéos, le R1 diffère considérablement en termes de matériel, ce qui contribue probablement à son prix inférieur de 199 $ par rapport au Humane AI Pin de 699 $.
L’essentiel
Au moment de la rédaction, Humane a à peine démontré des fonctionnalités au-delà de celles mentionnées ci-dessus, même s’il travaille sur des cas d’utilisation supplémentaires, tels que la possibilité de magasiner et de naviguer. D’un autre côté, le discours d’ouverture de Rabbit R1, bien que tentant d’élargir son réseau pour couvrir un éventail beaucoup plus large de capacités, manquait de démonstrations appropriées. Il est concevable que les futures mises à jour logicielles comblent les lacunes des deux appareils, les rendant ainsi plus semblables. En fin de compte, puisque les deux appareils visent à remplacer les smartphones, ils pourraient converger vers quelque chose de plus similaire à l’avenir. Mais bien sûr, nous devrons attendre et voir comment tout cela se déroulera.