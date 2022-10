Une revue des études Publié dans Réseau JAMA ouvert ont trouvé peu d’essais cliniques randomisés pour les algorithmes d’apprentissage automatique médical, et les chercheurs ont noté des problèmes de qualité dans de nombreux essais publiés qu’ils ont analysés.

La revue comprenait 41 ECR d’interventions d’apprentissage automatique. Il a révélé que 39% avaient été publiés l’année dernière et que plus de la moitié avaient été menées sur des sites uniques. Quinze essais ont eu lieu aux États-Unis, tandis que 13 ont été menés en Chine. Six études ont été menées dans plusieurs pays.

Seuls 11 essais ont recueilli des données sur la race et l’origine ethnique. Parmi ceux-ci, une médiane de 21 % des participants appartenait à des groupes minoritaires sous-représentés.

Aucun des essais n’a pleinement respecté les Normes consolidées de rapport d’essais – Intelligence artificielle (CONSORT-AI), un ensemble de lignes directrices élaborées pour les essais cliniques évaluant les interventions médicales qui incluent l’IA. Treize essais remplissaient au moins huit des 11 critères CONSORT-AI.

Les chercheurs ont noté certaines raisons courantes pour lesquelles les essais ne respectaient pas ces normes, notamment le fait de ne pas évaluer les données d’entrée de mauvaise qualité ou indisponibles, de ne pas analyser les erreurs de performance et de ne pas inclure d’informations sur la disponibilité du code ou de l’algorithme.

En utilisant le Outil Cochrane sur le risque de biais pour évaluer les biais potentiels dans les ECR, l’étude a également révélé que le risque global de biais était élevé dans les sept essais cliniques.

“Cette revue systématique a révélé que malgré le grand nombre d’algorithmes médicaux basés sur l’apprentissage automatique en cours de développement, peu d’ECR pour ces technologies ont été menés. Parmi les ECR publiés, il y avait une grande variabilité dans le respect des normes de déclaration et le risque de biais et un manque de participants issus de groupes minoritaires sous-représentés. Ces résultats méritent l’attention et devraient être pris en compte dans la conception et les rapports des futurs ECR », ont écrit les auteurs de l’étude.

POURQUOI EST-CE IMPORTANT

Les chercheurs ont déclaré qu’il y avait certaines limites à leur examen. Ils ont examiné des études évaluant un outil d’apprentissage automatique qui avait un impact direct sur la prise de décision clinique afin que les recherches futures puissent examiner un plus large éventail d’interventions, comme celles pour l’efficacité du flux de travail ou la stratification des patients. L’examen n’a également évalué que les études jusqu’en octobre 2021, et d’autres examens seraient nécessaires à mesure que de nouvelles interventions d’apprentissage automatique sont développées et étudiées.

Cependant, les auteurs de l’étude ont déclaré que leur examen a démontré que davantage d’ECR de haute qualité sur les algorithmes d’apprentissage automatique des soins de santé doivent être menés. Alors que des centaines d’appareils compatibles avec l’apprentissage automatique ont été approuvés par la FDA, l’examen suggère que la grande majorité n’incluait pas d’ECR.

“Il n’est pas pratique d’évaluer formellement chaque itération potentielle d’une nouvelle technologie par le biais d’un ECR (par exemple, un algorithme d’apprentissage automatique utilisé dans un système hospitalier puis utilisé pour le même scénario clinique dans un autre lieu géographique)”, ont écrit les chercheurs.

“Un ECR de base sur l’efficacité d’une intervention aiderait à établir si un nouvel outil fournit une utilité et une valeur cliniques. Cette évaluation de base pourrait être suivie d’études de validation externes rétrospectives ou prospectives pour démontrer comment l’efficacité d’une intervention se généralise au fil du temps et dans tous les contextes cliniques.”