dimanche, décembre 29, 2024

Les médecins disent que l’IA introduit le Slop dans les soins aux patients

De nos jours, de temps en temps, une étude paraît proclamant que l’IA est plus efficace pour diagnostiquer les problèmes de santé qu’un médecin humain. Ces études sont séduisantes car le système de santé américain est terriblement brisé et tout le monde cherche des solutions. L’IA présente une opportunité potentielle de rendre les médecins plus efficaces en effectuant pour eux beaucoup de travail administratif et, ce faisant, en leur donnant le temps de voir plus de patients et donc de réduire le coût final des soins. Il est également possible que la traduction en temps réel aide les non-anglophones à obtenir un meilleur accès. Pour les entreprises technologiques, l’opportunité de servir le secteur de la santé pourrait s’avérer très lucrative.

En pratique, cependant, il semble que nous ne soyons pas près de remplacer les médecins par l’intelligence artificielle, ni même de réellement les augmenter. Le Washington Post rayon avec plusieurs experts, dont des médecins, pour voir comment se déroulent les premiers tests d’IA, et les résultats n’étaient pas rassurants.

Voici un extrait d’un professeur clinicien, Christopher Sharp de Stanford Medical, utilisant GPT-4o pour rédiger une recommandation pour un patient qui a contacté son cabinet :

Sharp choisit au hasard une requête de patient. On y lit : « J’ai mangé une tomate et mes lèvres me démangent. Des recommandations ?

L’IA, qui utilise une version du GPT-4o d’OpenAI, rédige une réponse : « Je suis désolé d’entendre parler de vos lèvres qui démangent. On dirait que vous pourriez avoir une légère réaction allergique à la tomate. L’IA recommande d’éviter les tomates, d’utiliser un antihistaminique oral et d’utiliser une crème topique stéroïdienne.

Sharp regarde son écran pendant un moment. « Cliniquement, je ne suis pas d’accord avec tous les aspects de cette réponse », dit-il.

« Éviter les tomates, je serais entièrement d’accord. D’un autre côté, les crèmes topiques comme une hydrocortisone douce sur les lèvres ne seraient pas quelque chose que je recommanderais », explique Sharp. « Les lèvres sont des tissus très fins, nous faisons donc très attention lorsque nous utilisons des crèmes stéroïdes.

« Je retirerais simplement cette partie. »

En voici un autre, de Roxana Daneshjou, professeur de médecine et de science des données à Stanford :

Elle ouvre son ordinateur portable sur ChatGPT et saisit une question de patient test. « Cher docteur, j’allaite et je pense avoir développé une mammite. Ma poitrine est rouge et douloureuse. ChatGPT répond : utilisez des compresses chaudes, effectuez des massages et effectuez des soins infirmiers supplémentaires.

Mais c’est faux, dit Daneshjou, qui est également dermatologue. En 2022, l’Académie de médecine de l’allaitement recommandé au contraire : compresses froides, s’abstenir de massages et éviter les surstimulations.

Le problème avec les optimistes de la technologie qui poussent l’IA dans des domaines comme la santé est que ce n’est pas la même chose que créer des logiciels grand public. On sait déjà que l’assistant Copilot 365 de Microsoft présente des bugs, mais une petite erreur dans votre présentation PowerPoint n’est pas grave. Faire des erreurs en matière de soins de santé peut tuer des gens. Daneshjou a dit au Poste elle a regroupé ChatGPT avec 80 autres personnes, dont des informaticiens et des médecins posant des questions médicales à ChatGPT, et a constaté qu’il offrait des réponses dangereuses vingt pour cent du temps. « Selon moi, 20 % de réponses problématiques ne suffisent pas pour une utilisation quotidienne dans le système de santé », a-t-elle déclaré.

Bien sûr, les partisans diront que l’IA peut augmenter le travail d’un médecin, pas le remplacer, et qu’ils devraient toujours en vérifier les résultats. Et c’est vrai, le Poste story a interviewé un médecin de Stanford qui a déclaré que les deux tiers des médecins y avaient accès à une plateforme et transcrivaient les réunions avec les patients avec l’IA afin qu’ils puissent les regarder dans les yeux pendant la visite et ne pas baisser les yeux en prenant des notes. Mais même là, la technologie Whisper d’OpenAI semble insérer des informations complètement inventées dans certains enregistrements. Sharp a déclaré que Whisper avait inséré par erreur dans une transcription qu’un patient attribuait une toux à une exposition à son enfant, ce qu’il n’a jamais dit. Un exemple incroyable de biais dans les données de formation que Daneshjou a trouvé lors des tests était qu’un outil de transcription d’IA supposait qu’un patient chinois était un programmeur informatique sans que le patient ne fournisse jamais de telles informations.

L’IA pourrait potentiellement aider le domaine de la santé, mais ses résultats doivent être minutieusement vérifiés, et alors combien de temps les médecins gagnent-ils réellement ? De plus, les patients doivent avoir confiance que leur médecin vérifie réellement ce que produit l’IA – les systèmes hospitaliers devront effectuer des contrôles pour s’assurer que cela se produit, sinon la complaisance pourrait s’infiltrer.

Fondamentalement, l’IA générative n’est qu’une machine de prédiction de mots, qui recherche de grandes quantités de données sans vraiment comprendre les concepts sous-jacents qu’elle renvoie. Il n’est pas « intelligent » au même sens qu’un véritable humain, et il n’est surtout pas capable de comprendre les circonstances propres à chaque individu spécifique ; il renvoie des informations qu’il a généralisées et vues auparavant.

« Je pense que c’est l’une de ces technologies prometteuses, mais elle n’en est tout simplement pas encore là », a déclaré Adam Rodman, médecin en médecine interne et chercheur en IA au centre médical Beth Israel Deaconess. « Je crains que nous ne dégradions encore davantage ce que nous faisons en mettant des « slops d’IA » hallucinés dans les soins aux patients à enjeux élevés.

La prochaine fois que vous consulterez votre médecin, cela vaut peut-être la peine de lui demander s’il utilise l’IA dans son flux de travail.

Related Posts