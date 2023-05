Mercredi, Google aperçu ce qui pourrait être l’un des plus grands changements apportés au moteur de recherche de son histoire.

Google utilisera des modèles d’intelligence artificielle pour combiner et résumer les informations provenant du Web en réponse aux requêtes de recherche, un produit qu’il appelle Search Generative Experience.

Au lieu de « dix liens bleus », l’expression qui décrit les résultats de recherche habituels de Google, Google affichera à certains utilisateurs des paragraphes de texte généré par l’IA et une poignée de liens en haut de la page de résultats.

La nouvelle recherche basée sur l’IA est testée pour un groupe restreint d’utilisateurs et n’est pas encore largement disponible. Mais les éditeurs de sites Web s’inquiètent déjà si cela devient le moyen par défaut de Google de présenter les résultats de recherche, cela pourrait leur nuire en envoyant moins de visiteurs sur leurs sites et en les gardant sur Google.com.

La controverse met en évidence une tension de longue date entre Google et les sites Web qu’il indexe, avec une nouvelle tournure d’intelligence artificielle. Les éditeurs craignent depuis longtemps que Google réutilise leur contenu textuel dans des extraits sur son propre site Web, mais Google utilise maintenant des modèles avancés d’apprentissage automatique qui grattent de grandes parties du Web pour « former » le logiciel à cracher du texte et des réponses de type humain.

Rutledge Daugette, PDG de Tech Raptorun site axé sur les actualités et les critiques de jeux, a déclaré que la décision de Google avait été prise sans tenir compte des intérêts des éditeurs et que l’IA de Google équivalait à augmenter le contenu.

« Ils se concentrent sur les recherches sans clic qui utilisent les informations des éditeurs et des écrivains qui consacrent du temps et des efforts à créer un contenu de qualité, sans offrir d’autre avantage que le potentiel d’un clic », a déclaré Daugette à CNBC. « Jusqu’à présent, l’IA a été rapide à réutiliser les informations des autres sans aucun avantage pour eux, et dans des cas comme Google, Bard n’offre même pas d’attribution quant à l’origine des informations qu’il utilise. »

Luther Lowe, critique de longue date de Google et chef de la politique publique à Japper a déclaré que la mise à jour de Google faisait partie d’une stratégie de plusieurs décennies visant à garder les utilisateurs sur le site plus longtemps, au lieu de les envoyer vers les sites qui hébergeaient à l’origine les informations.

« L’auto-préférence exclusive du clone ChatGPT de Google dans la recherche est le dernier chapitre de l’effusion de sang sur le Web », a déclaré Lowe à CNBC.

Selon à Search Engine Land, un site Web d’actualités qui suit de près les modifications apportées au moteur de recherche de Google, les résultats générés par l’IA sont affichés au-dessus des résultats de recherche organiques lors des tests effectués jusqu’à présent. CNBC a précédemment signalé les plans de Google pour repenser sa page de résultats afin de promouvoir le contenu généré par l’IA.

SGE est livré dans une boîte de couleur différente – verte dans l’exemple – et comprend des liens encadrés vers trois sites Web sur le côté droit. Dans l’exemple principal de Google, les trois titres du site Web ont été coupés.

Google dit que l’information n’est pas tirée des sites Web, mais plutôt corroboré par les liens. Search Engine Land a déclaré que l’approche SGE était une amélioration et un moyen « plus sain » de créer des liens que le chatbot Bard de Google, qui était rarement lié aux sites Web des éditeurs.

Certains éditeurs se demandent s’ils peuvent empêcher les entreprises d’intelligence artificielle telles que Google de scraper leur contenu pour former leurs modèles. Des entreprises comme celle à l’origine de Stable Diffusion sont déjà confronté à des poursuites des propriétaires de données, mais le droit de récupérer des données Web pour l’IA reste une frontière indécise. D’autres sociétés, telles que Reddit, ont annoncé leur intention de facturer accéder à leurs données.

Menant la charge dans le monde de l’édition, Barry Diller, président de IAC qui possède des sites Web tels que All Recipes, People Magazine et The Daily Beast.

« Si toutes les informations du monde peuvent être aspirées dans cette gueule et ensuite essentiellement reconditionnées dans des phrases déclaratives, dans ce qu’on appelle le chat, mais ce n’est pas du chat – autant de grafs que vous voulez, 25 sur n’importe quel sujet – il y aura pas de publication, car ce sera impossible », a déclaré Diller le mois dernier lors d’une conférence.

« Ce que vous devez faire, c’est faire dire à l’industrie que vous ne pouvez pas supprimer notre contenu tant que vous n’avez pas mis au point des systèmes permettant à l’éditeur d’obtenir un moyen de paiement », a poursuivi Diller, affirmant que Google serait confronté à ce problème.

Diller dit qu’il pense que les éditeurs peuvent poursuivre les entreprises d’IA en vertu de la loi sur le droit d’auteur et que les restrictions actuelles d' »utilisation équitable » doivent être redéfinies. Le Financial Times signalé Mercredi Diller dirige un groupe d’éditeurs « qui va dire que nous allons changer la loi sur le droit d’auteur si nécessaire ». Un porte-parole de l’IAC a refusé une demande de mise à disposition de Diller pour un entretien.

L’un des défis auxquels sont confrontés les éditeurs est de confirmer que leur contenu est utilisé par l’IA. Google n’a pas révélé de sources de formation pour son grand modèle de langage qui sous-tend SGE PaLM 2, et Daugette dit que bien qu’il ait vu des exemples de citations et de notes d’examen de concurrents réutilisés sur Bard sans attribution, il est difficile de dire quand l’information provient de son site sans directement sources liées.

Un porte-parole de Google a déclaré que la société n’avait pas l’intention de partager la rémunération des éditeurs pour les données de formation.

« Nous introduisons cette nouvelle expérience d’IA générative en tant qu’expérience dans Search Labs pour nous aider à itérer et à nous améliorer, tout en intégrant les commentaires des utilisateurs et d’autres parties prenantes », a déclaré Google dans un communiqué.

« PaLM 2 est formé sur un large éventail de données librement disponibles sur Internet et nous apprécions évidemment la santé de l’écosystème Web. Et cela fait vraiment partie de la façon dont nous pensons à la façon dont nous construisons nos produits, pour nous assurer que nous avons un environnement sain écosystème où les créateurs font partie de cet écosystème florissant », a déclaré le vice-président de la recherche de Google, Zoubin Ghahramani, lors d’un point de presse plus tôt cette semaine.

Daugette dit que les décisions de Google rendent difficile le fait d’être un éditeur indépendant.

« Je pense que c’est vraiment frustrant pour notre industrie de devoir s’inquiéter de la perte de notre travail, alors que tant de collègues sont licenciés », a déclaré Daugette. « Ce n’est tout simplement pas correct. »

– Jordan Novet de CNBC a contribué au reportage.