Des chercheurs de Harvard ont présenté une étude démontrant une réalisation qui mettrait au défi tout étudiant en médecine. ChatGPT, un grand modèle linguistique, a réussi l’examen américain de licence médicale, surpassant environ 10 % des étudiants en médecine qui échouent au test chaque année.

La question inévitable n’est pas tant de savoir si, mais quand, ces dispositifs d’intelligence artificielle peuvent se mettre à la place des médecins. Pour certaines tâches, cet avenir médical est plus tôt qu’on ne le pense.

Pour saisir le potentiel de ces outils pour révolutionner la pratique de la médecine, il est utile de commencer par une taxonomie des différentes technologies et de la manière dont elles sont utilisées dans les soins médicaux.

Les outils d’IA appliqués aux soins de santé peuvent généralement être divisés en deux catégories principales. Le premier est l’apprentissage automatique qui utilise des algorithmes pour permettre aux ordinateurs d’apprendre des modèles à partir de données et de faire des prédictions. Ces algorithmes peuvent être formés sur une variété de types de données, y compris des images.

La deuxième catégorie englobe le traitement du langage naturel, qui est conçu pour comprendre et générer le langage humain. Ces outils permettent à un ordinateur de transformer le langage humain et le texte non structuré en données organisées lisibles par machine. Ils apprennent d’une multitude de décisions humaines par essais et erreurs et imitent les réponses d’une personne.

Une différence essentielle entre les deux approches réside dans leur fonctionnalité. Alors que les modèles d’apprentissage automatique peuvent être formés pour effectuer des tâches spécifiques, les grands modèles de langage peuvent comprendre et générer du texte, ce qui les rend particulièrement utiles pour reproduire les interactions avec les fournisseurs.

En médecine, l’utilisation de ces technologies suit généralement l’une des quatre voies différentes. Les premiers englobent de grands modèles de langage qui sont appliqués à des fonctions administratives telles que le traitement des réclamations médicales ou la création et l’analyse de dossiers médicaux. HealthScribe d’Amazon est une interface programmable qui transcrit les conversations entre médecins et patients et peut extraire des informations médicales, permettant aux prestataires de créer des enregistrements structurés des rencontres.

Le deuxième seau implique l’utilisation de l’apprentissage automatique supervisé pour améliorer l’interprétation des données cliniques. Des spécialités telles que la radiologie, la pathologie et la cardiologie utilisent déjà l’IA pour l’analyse d’images, pour lire des IRM, évaluer des lames de pathologie ou interpréter des électrocardiogrammes. En fait, jusqu’à 30 % des cabinets de radiologie ont déjà adopté des outils d’IA. Donc avoir d’autres spécialités. Google Brain AI a développé un logiciel qui analyse les images du fond de l’œil pour diagnostiquer l’œdème maculaire diabétique et la rétinopathie diabétique, deux causes courantes de cécité.

Étant donné que ces outils offrent des diagnostics et peuvent avoir un impact direct sur les soins aux patients, la FDA les classe souvent comme des dispositifs médicaux, les soumettant à une réglementation pour vérifier leur exactitude. Cependant, le fait que ces outils soient formés sur des ensembles de données fermés, où les résultats des données ou de l’imagerie ont été rigoureusement confirmés, donne à la FDA une confiance accrue lors de l’évaluation de l’intégrité de ces dispositifs.

La troisième grande catégorie comprend les outils d’IA qui s’appuient sur de grands modèles de langage qui extraient des informations cliniques à partir de données spécifiques au patient, les interprétant pour inciter les prestataires à poser des diagnostics ou des traitements à envisager. Généralement connu sous le nom de logiciel d’aide à la décision clinique, il évoque l’image d’un assistant intelligent conçu pour aider, et non pour supplanter, le jugement d’un médecin. « Watson for Oncology » d’IBM utilise l’IA pour aider les oncologues à prendre des décisions plus éclairées sur les traitements contre le cancer, tandis que Google Health développe DeepMind Health pour créer des outils similaires.

Tant que le médecin reste impliqué et exerce un jugement indépendant, la FDA ne réglemente pas toujours ce type d’outil. La FDA se concentre davantage sur la question de savoir si elle est censée prendre une décision clinique définitive, plutôt que de fournir des informations pour aider les médecins dans leurs évaluations.

Le quatrième et dernier groupe représente le Saint Graal de l’IA : de grands modèles de langage qui fonctionnent de manière entièrement automatisée, analysant l’intégralité du dossier médical d’un patient pour diagnostiquer les conditions et prescrire des traitements directement au patient, sans médecin dans la boucle.

À l’heure actuelle, il n’existe que quelques modèles de langage clinique, et même les plus grands possèdent un nombre relativement restreint de paramètres. Cependant, la force des modèles et les ensembles de données disponibles pour leur formation pourraient ne pas être les obstacles les plus importants à ces systèmes entièrement autonomes. Le plus grand obstacle pourrait bien être l’établissement d’une voie réglementaire appropriée. Les régulateurs hésitent, craignant que les modèles soient sujets aux erreurs et que les ensembles de données cliniques sur lesquels ils sont formés contiennent de mauvaises décisions, ce qui conduit les modèles d’IA à reproduire ces erreurs médicales.

Surmonter les obstacles à la mise en place de ces systèmes entièrement autonomes pour les soins aux patients est très prometteur, non seulement pour améliorer les résultats, mais aussi pour relever les défis financiers.

La santé est souvent citée comme un domaine accablé par la théorie de la maladie des coûts de Baumol, une théorie économique développée par l’économiste William J. Baumol, qui explique pourquoi les coûts dans les industries à forte intensité de main-d’œuvre ont tendance à augmenter plus rapidement que dans d’autres secteurs. Dans des domaines comme la médecine, il est moins probable que les intrants technologiques fournissent des compensations importantes aux coûts de main-d’œuvre, car chaque rencontre avec un patient nécessite toujours l’intervention d’un fournisseur. Dans des secteurs comme la médecine, le travail lui-même est le produit.

Pour compenser ces défis, la médecine a intégré davantage de prestataires non médecins afin de réduire les coûts. Cependant, cette stratégie réduit, mais n’élimine pas le dilemme économique central. Cependant, lorsque la technologie devient le médecin, elle peut être un remède à la maladie des coûts de Baumol.

Au fur et à mesure que la qualité et la portée des données cliniques disponibles pour la formation de ces grands modèles linguistiques continuent de croître, leurs capacités augmenteront également. Même si le stade de développement actuel n’est pas tout à fait prêt à retirer complètement les médecins de la boucle décisionnelle, ces outils amélioreront de plus en plus la productivité des prestataires et, dans de nombreux cas, commenceront à se substituer à eux.