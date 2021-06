Hristo Georgiev a récemment reçu un message troublant d’un ami : Google dit qu’il est un tueur en série. Si vous cherchiez son nom sur Google, le moteur de recherche afficherait le portrait professionnel de Georgiev à côté d’un article de Wikipédia sur un tueur en série bulgare du même nom décédé en 1980. C’est une erreur regrettable, mais ce n’est pas non plus la première fois que les algorithmes de Google le font. quelque chose comme ça.

L’article de Wikipédia qui a fait surface dans les résultats de Georgiev n’incluait pas sa photo dans la tête, et si vous lisez attentivement, vous apprendrez rapidement que le tueur en série éponyme est mort par un peloton d’exécution il y a des décennies. Pourtant, les systèmes automatisés de Google avaient donné à Georgiev, un ingénieur logiciel basé en Suisse, l’apparence de quelqu’un qu’il n’était pas. Les algorithmes de l’entreprise avaient déposé les informations dans l’un de ses « panneaux de connaissances », les petites cases qui apparaissent en haut des résultats du moteur de recherche et sont censées offrir une réponse rapide et faisant autorité aux requêtes de recherche afin que vous n’ayez pas à cliquer dessus. sur les résultats. Mais depuis que Google a lancé ces panneaux en 2012, ils ont promu à plusieurs reprises la désinformation.

Il a fallu quelques heures à Google pour résoudre le problème après que plusieurs personnes l’ont signalé et cela a attiré l’attention sur le forum Web Hacker News, a déclaré Georgiev à Recode. Pourtant, il dit que le mauvais résultat, qui a peut-être été en place pendant des semaines, l’a fait se sentir au moins « un peu mal à l’aise ». Il a rappelé qu’une personne qui avait recherché son nom avait eu une « mini crise cardiaque » momentanée.

Le problème qui a conduit aux résultats incorrects de Georgiev peut être attribué au Knowledge Graph de Google, que le moteur de recherche appelle une encyclopédie virtuelle géante des faits. « L’organisation de milliards d’entités dans notre Knowledge Graph nécessite que nous utilisions des systèmes automatisés, qui fonctionnent souvent bien mais ne sont pas parfaits », a déclaré un porte-parole de Google à Recode. « Nous sommes désolés pour les problèmes causés par cette confusion. »

Google dispose d’un processus formel pour signaler et supprimer les informations inexactes dans ses panneaux de connaissances, mais il repose en grande partie sur les utilisateurs pour détecter tout problème. Cela laisse aux utilisateurs la responsabilité de remarquer si Google fait apparaître des informations incorrectes à leur sujet dans ses premiers résultats de recherche, puis de signaler l’erreur à la plate-forme de recherche. La société a lancé un système permettant aux organisations et aux personnes de vérifier leur identité auprès de Google afin qu’elles puissent plus facilement fournir des commentaires directs à Google sur l’exactitude du panneau de connaissances qui les concerne.

Pourtant, dans le passé, des personnes se sont plaintes que la suppression de fausses informations de ces panneaux était un processus fastidieux, et d’autres ont déclaré que cela pouvait prendre des mois, voire des années. Le porte-parole de Google a déclaré à Recode que l’entreprise examinait régulièrement les commentaires sur ses résultats du Knowledge Graph, mais n’a pas commenté la fréquence à laquelle l’entreprise reçoit des demandes de modifications.

En fin de compte, le problème fait partie du problème plus large de Google : s’appuyer sur des algorithmes pour identifier et offrir les informations correctes ne fonctionne pas toujours et peut en fait risquer d’amplifier la désinformation.

Google affirme que son Knowledge Graph fonctionne en connectant des éléments d’information du Web concernant une personne, un lieu ou une chose en particulier, en particulier pour des personnes, des lieux et des choses notables. C’est plus avancé et spécifique que de faire apparaître des résultats basés uniquement sur des mots-clés, comme l’a expliqué la société lors du lancement de l’outil en 2012. Google a utilisé les informations collectées à partir de ce système, qui, selon la société, comprend 500 milliards d’informations concernant 5 milliards d’entités, pour gérer les sections spéciales de ses résultats de recherche que l’entreprise appelle des panneaux de connaissances. Ces cases encouragent les internautes à rester sur la page de résultats de Google plutôt que de cliquer sur les résultats et de visiter d’autres sites Web.

Le Knowledge Graph de Google se concentre sur la mise en évidence de différentes informations sur le Web concernant un sujet ou une chose en particulier plutôt que de rechercher des informations qui incluent simplement les mêmes mots-clés.

Parfois, ces panneaux permettent d’obtenir des réponses plus rapidement et plus facilement sur Google. Mais Georgiev n’est qu’une des nombreuses personnes frustrées lorsque des informations sur des meurtriers apparaissent dans les panneaux de connaissances lorsque les gens recherchent leurs noms. D’autres fois, ces résultats rapporteront à tort qu’une personne est mariée ou décédée. Plus inquiétant encore, ces panneaux ont augmenté le contenu haineux, comme ils l’ont fait il y a deux ans lorsqu’un panneau associé au terme « juif qui se déteste » – un terme antisémite – a joint une image de la comédienne juive Sarah Silverman.

Eni Mustafaraj, professeur d’informatique à Wellesley, a déclaré à Recode que ces problèmes surviennent souvent lorsqu’un système informatique ne correspond pas à des informations provenant de deux sources différentes – dans le cas de Georgiev, une image et une page Wikipedia.

Dans le même temps, l’incident montre clairement à quel point les panneaux de connaissances de Google dépendent des informations éditées par les utilisateurs sur Wikipedia. « Ce genre d’histoire n’est qu’un rappel de la dépendance générale des moteurs de recherche vis-à-vis de ce qui est essentiellement du travail bénévole non rémunéré et non rémunéré d’un énorme groupe de personnes du monde entier », a déclaré Nicholas Vincent, doctorant à Northwestern qui a étudié les moteurs de recherche, dit Recode.

Google dit que les erreurs sont rares dans ces panneaux, mais il semble qu’il appartient toujours aux humains de détecter et de corriger leurs erreurs. « Vous travaillez avec d’énormes quantités d’informations, n’est-ce pas ? » Georgiev a déclaré à Recode. « Il y a forcément des erreurs. C’est juste que lorsque vous êtes Google, vous devez être très prudent avec ce genre de choses. »

En attendant, dit-il, vous devriez commencer à rechercher vous-même sur Google.