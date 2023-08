L’IA générative comme ChatGPT et Midjourney a ébloui les imaginations et bouleversé les industries, mais leurs débuts se sont principalement limités aux fenêtres de navigateur sur les ordinateurs de bureau. L’année prochaine, vous pourrez utiliser l’IA générative en déplacement une fois que les téléphones haut de gamme seront lancés avec les puces de premier plan de Qualcomm.

Les téléphones utilisent l’IA depuis des années pour retoucher les photos et améliorer la correction automatique, mais les outils d’IA générative pourraient apporter un nouveau niveau d’amélioration à l’expérience mobile. Qualcomm intègre l’IA générative dans sa prochaine génération de puces haut de gamme, qui devraient faire leurs débuts lors de son sommet annuel Qualcomm à Hawaï fin octobre.

Les participants au sommet pourront découvrir par eux-mêmes ce que l’IA générative apportera aux téléphones, mais Ziad Asghar, vice-président senior de la gestion des produits de Qualcomm, a expliqué à CNET pourquoi les utilisateurs devraient s’enthousiasmer pour l’IA sur les appareils. D’une part, avoir accès aux données d’un utilisateur (modèles de conduite, recherches de restaurants, photos et plus encore) en un seul endroit rendra les solutions générées par l’IA sur votre téléphone beaucoup plus personnalisées et utiles que les réponses générales de l’IA générative basée sur le cloud.

« Je pense que ça va être le Saint Graal », a déclaré Asghar. « C’est la véritable promesse qui nous rend vraiment enthousiasmés quant à l’avenir de cette technologie. »

Il existe d’autres avantages à disposer d’une IA générative sur l’appareil. Plus important encore, les requêtes et les données personnelles recherchées restent confidentielles et ne sont pas relayées via un serveur distant. L’utilisation de l’IA locale est également plus rapide que d’attendre le calcul dans le cloud, et elle peut fonctionner lors de voyages en avion ou dans d’autres zones dépourvues de service cellulaire.

Mais une solution sur appareil est également rentable et efficace. À mesure que les modèles d’apprentissage automatique sont devenus plus complexes (de centaines de milliers de paramètres à des milliards, a déclaré Asghar), il est plus coûteux d’exécuter des serveurs répondant aux requêtes, comme le fait Qualcomm. expliqué dans un livre blanc publié le mois dernier. En avril, OpenAI était estimé à dépenser environ 700 000 $ par jour amener ChatGPT à répondre aux invites, et cette prévision des coûts était basée sur l’ancien modèle GPT-3, et non sur le nouveau GPT-4 qui est plus complexe et susceptible d’être plus coûteux à maintenir à grande échelle. Au lieu d’avoir besoin d’une batterie de serveurs entière, la solution de Qualcomm consiste à laisser le cerveau en silicium existant d’un appareil effectuer toute la réflexion nécessaire, sans frais supplémentaires.

« L’exécution de l’IA sur votre téléphone est effectivement gratuite : vous avez payé la puissance de calcul d’avance », a déclaré Avi Greengart, analyste de Techsponential, à CNET par courrier électronique.

Greengart a vu l’IA générative intégrée à l’appareil de Qualcomm en action lorsque le fabricant de puces l’a exposée au Mobile World Congress en février, en utilisant un téléphone Android alimenté par Snapdragon 8 Gen 2 pour exécuter le logiciel de génération d’images Stable Diffusion. Bien qu’il s’agisse d’une première démo, il l’a trouvé « extrêmement excitant ».

Un chipset Snapdragon 8 Gen 2. David Lumb/CNET

Ce que l’IA générative intégrée aux appareils offre aux utilisateurs

Qualcomm a des idées sur ce que les gens pourraient faire avec l’IA générative basée sur le téléphone, améliorant tout, des tâches de productivité au visionnage de divertissements en passant par la création de contenu.

Comme l’a montré la démo de Stable Diffusion, l’IA générative intégrée à l’appareil pourrait permettre aux utilisateurs de modifier les images sur commande, par exemple en lui demandant de changer l’arrière-plan pour vous placer devant les canaux de Venise, a déclaré Asghar. Ou bien ils pourraient le faire générer une image complètement nouvelle – mais ce n’est que le début, car de grands modèles d’apprentissage textuels et visuels pourraient fonctionner successivement pour passer d’une idée à un résultat prêt.

En utilisant plusieurs modèles, a déclaré Asghar, un utilisateur pourrait faire traduire son discours par reconnaissance vocale automatique en texte qui serait ensuite introduit dans un générateur d’images. Allez plus loin et demandez à votre téléphone de restituer le visage d’une personne, qui utilise l’IA générative pour effectuer des mouvements de bouche réalistes et une synthèse vocale pour vous répondre, et boum, vous disposez d’un assistant virtuel génératif alimenté par l’IA. peut avoir des conversations complètes avec.

Cet exemple spécifique pourrait être alimenté en partie par une IA tierce, comme le grand modèle de langage Llama 2, récemment lancé par la société mère de Facebook, Meta, en partenariat avec Microsoft et Qualcomm.

« [Llama 2] « Ces nouvelles expériences d’IA sur appareil, alimentées par par Snapdragon, peut fonctionner dans des zones sans connectivité ou même en mode avion.

À l’intérieur du musée sur rendez-vous du siège de Qualcomm rempli de téléphones rétro

Qualcomm ne limitera pas ces fonctionnalités aux téléphones. Lors de son prochain sommet, la société prévoit également d’annoncer des solutions d’IA générative pour PC et automobile. Cet assistant personnel pourrait vous aider avec vos listes de tâches, planifier des réunions et envoyer des e-mails. Si vous êtes coincé à l’extérieur du bureau et devez faire une présentation, a déclaré Asghar, l’IA pourrait générer un nouvel arrière-plan afin de ne pas donner l’impression que vous êtes assis dans votre voiture et que vous affichez un diaporama (ou même que vous aidez à présenter). il).

« Pour ceux d’entre nous qui ont grandi en regardant Knight Rider, eh bien, KITT va désormais être réel », a déclaré Asghar, faisant référence à la voiture intelligente emblématique de la série télévisée.

Quelle que soit la plateforme, la solution principale d’IA générative existera sur l’appareil. Cela pourrait aider avec les tâches de bureau, comme générer automatiquement des notes à partir d’un appel et créer un jeu de cinq diapositives résumant ses points clés (« C’est comme Clippy, mais sous stéroïdes, n’est-ce pas ? », a déclaré Asghar). Ou encore, il pourrait créer des mondes numériques à partir de zéro en AR et VR.

Au-delà des mondes fantastiques, l’IA générative pourrait aider les personnes aveugles à naviguer dans le monde réel. Asghar a décrit une situation dans laquelle les transferts de modèles d’image à image 3D à texte à parole pourraient utiliser l’appareil photo du téléphone pour reconnaître quand un utilisateur se trouve à une intersection et l’informer du moment où s’arrêter, ainsi que du nombre de voitures. venant de quelles directions.

Sur le plan de l’éducation – peut-être en utilisant une webcam ou l’appareil photo d’un téléphone – l’IA générative pourrait évaluer dans quelle mesure les élèves absorbent une leçon, peut-être en suivant leurs expressions et leur langage corporel. Et puis, l’IA générative pourrait adapter le matériel aux forces et aux faiblesses de chaque élève, a théorisé Asghar.

Ce sont toutes des prédictions de Qualcomm, mais les tiers devront décider de la meilleure façon d’exploiter la technologie pour améliorer leurs propres produits et services. Pour les téléphones, l’IA générative pourrait avoir un réel impact une fois intégrée aux applications mobiles pour des expériences de jeu, des médias sociaux et une création de contenu plus personnalisés, a déclaré Greengart de Techsponential.

Il est difficile de dire ce que cela signifie pour les utilisateurs jusqu’à ce que les créateurs d’applications disposent d’une technologie d’IA générative pour bricoler et intégrer dans leurs applications. Il est plus facile d’extrapoler ce qu’elle pourrait faire en fonction de la manière dont l’IA aide les gens à l’heure actuelle. Roger Entner, analyste chez Recon Analytics, prédit que l’IA générative aidera à corriger les défauts des photos sous-optimales, à générer des filtres pour les médias sociaux et à affiner la correction automatique – des problèmes qui existent actuellement.

« L’IA générative crée ici une amélioration de la qualité d’utilisation que nous prendrons bientôt pour acquise », a déclaré Entner à CNET par courrier électronique.

Un Snapdragon 8 Gen 2 enfermé dans une rondelle rouge devant une plate-forme utilisée pour tester les puces en production. David Lumb/CNET

L’IA générative arrive en premier sur les téléphones premium

Les solutions actuelles d’IA générative s’appuient sur de grandes fermes de serveurs pour répondre aux requêtes à grande échelle, mais Qualcomm est convaincu que son silicium intégré à l’appareil peut répondre aux besoins d’un seul utilisateur. Dans les laboratoires d’Asghar, les puces de l’entreprise géraient des modèles d’IA avec 7 milliards de paramètres (des aspects qui évaluent les données et modifient le ton ou la précision de leur sortie), ce qui est bien en dessous des 175 milliards de paramètres du modèle GPT-3 d’OpenAI qui alimente ChatGPT, mais devrait adapté aux recherches mobiles.

« Nous serons effectivement en mesure de montrer que l’exécution sur l’appareil au [Hawaii] sommet », a déclaré Asghar.

L’appareil de démonstration contiendra probablement la prochaine puce haut de gamme de Qualcomm, vraisemblablement le Snapdragon 8 Gen 3 qui finira dans les téléphones Android haut de gamme de l’année prochaine. L’appareil de démonstration exécutant Stable Diffusion au MWC 2023 utilisait le Snapdragon 8 Gen 2 annoncé lors du Snapdragon Summit de l’année dernière à Hawaï.

À une époque où les téléphones durent à peine toute la journée avant de devoir être rechargés, on se demande également si l’invocation du génie génératif de l’IA tout au long de la journée épuisera votre batterie encore plus rapidement. Nous devrons attendre des tests réels pour voir comment les téléphones implémentent et optimisent la technologie, mais Asghar a souligné que la démo du MWC 2023 exécutait des requêtes pour les participants toute la journée et n’épuisait pas la batterie ni même réchauffait au toucher. . Il pense que le silicium de Qualcomm est unique en son genre, avec une IA générative fonctionnant principalement sur le processeur Hexagon et l’unité de traitement neuronal d’un chipset Snapdragon, avec « une très bonne consommation d’énergie ».

« Je pense qu’il y aura des inquiétudes pour ceux qui ne disposent pas de matériel dédié pour effectuer ce traitement », a déclaré Asghar.

Asghar estime que les téléphones Android haut de gamme de l’année prochaine, équipés du silicium de Qualcomm, pourront utiliser l’IA générative. Mais il faudra un certain temps pour que cela se répercute sur des téléphones moins chers. Tout comme sur les téléphones actuels, l’assistance de l’IA pour le nettoyage des images, de l’audio et de la vidéo est meilleure en haut de la gamme et devient moins efficace pour les téléphones moins chers, les capacités d’IA générative seront moindres (mais toujours présentes) à mesure que vous descendez dans la gamme de Qualcomm. catalogue de puces.

« Peut-être que vous pouvez créer un modèle de paramètres de plus de 10 milliards dans la prime, et le niveau inférieur pourrait être inférieur à cela, si vous êtes en dessous de cela, il pourrait être inférieur à cela », a déclaré Asghar. « Il s’agira donc d’une dégradation gracieuse de ces expériences, mais elles s’étendront également aux autres produits. »

Comme pour la 5G, Qualcomm est peut-être le premier à adopter une nouvelle technologie basée sur l’IA générative, mais ce ne sera pas le dernier. Apple a discrètement amélioré son IA intégrée aux appareils, comme l’a souligné le vice-président senior des logiciels, Craig Federighi, dans un communiqué. Discussion après la Conférence mondiale des développeurs qu’ils ont échangé dans un modèle de langage de transformateur plus puissant pour améliorer la correction automatique. Apple aurait même testé son propre chatbot « Apple GPT » en interne. Le géant de la technologie développerait son propre cadre pour créer de grands modèles de langage afin d’être compétitif dans l’espace de l’IA, qui s’est réchauffé depuis qu’OpenAI a rendu ChatGPT au public fin 2022.

Regarde ça: Comparaison de Bing Chat, Bard Chat et ChatGPT 11h37

L’IA d’Apple pourrait entrer dans la course contre l’IA Bard de Google et l’IA Bing de Microsoft, qui ont toutes deux eu des versions limitées cette année pour des tests publics. Ceux-ci suivent le modèle plus traditionnel de « chatbot intelligent » de logiciel d’amélioration de l’IA générative, mais il est possible qu’ils arrivent sur les téléphones via des applications ou soient accessibles via un navigateur Web. Google et Microsoft intègrent déjà l’IA générative dans leurs plates-formes de productivité. Les utilisateurs verront donc probablement leurs efforts d’abord dans les versions mobiles de Google Docs ou de Microsoft Office.

Mais pour la plupart des propriétaires de téléphones, l’IA générative basée sur une puce de Qualcomm pourrait être la première utilisation impactante d’une nouvelle technologie. Nous devrons attendre le Snapdragon Summit pour voir à quel point notre expérience mobile pourrait changer dès l’année prochaine.