Les modèles informatiques ont permis de gagner beaucoup de temps lorsqu’il s’agit de prédire quelles molécules de protéines pourraient fabriquer des médicaments efficaces, mais bon nombre de ces méthodes elles-mêmes prennent beaucoup de temps et de puissance de calcul.

Aujourd’hui, des chercheurs du MIT et de Tufts ont mis au point une approche alternative basée sur un algorithme connu sous le nom de grand modèle de langage, qui peut déterminer quels mots (ou, dans ce cas, les acides aminés) sont les plus susceptibles d’apparaître ensemble. Le modèle peut faire correspondre les protéines cibles et les molécules médicamenteuses potentielles sans l’étape de calcul intensif consistant à calculer la structure 3D de chaque protéine à partir de sa séquence d’acides aminés. Le système résultant peut dépister plus de 100 millions de paires médicament-protéine en une seule journée.

Les chercheurs ont testé leur modèle en criblant une bibliothèque d’environ 4 700 molécules de médicaments candidats pour leur capacité à se lier à un ensemble de 51 enzymes. Parmi les meilleurs résultats, ils ont testé 19 paires médicament-protéine ; les tests ont révélé que 12 avaient une forte affinité de liaison, alors que presque toutes les nombreuses autres paires possibles n’auraient aucune affinité.

« Une partie de la raison pour laquelle la découverte de médicaments est si coûteuse est qu’elle a des taux d’échec élevés », explique Rohit Singh, PhD ’12, chercheur au CSAIL et l’un des principaux auteurs d’un article sur les travaux. « Si nous pouvons réduire ces taux d’échec en disant d’emblée que ce médicament ne fonctionnera probablement pas, cela pourrait grandement contribuer à réduire le coût de la découverte de médicaments. »