L’IA prédit les formes des molécules à venir

Depuis quelques années, John McGeehan, biologiste et directeur du Center for Enzyme Innovation à Portsmouth, en Angleterre, recherche une molécule capable de décomposer les 150 millions de tonnes de bouteilles de soda et autres déchets plastiques éparpillés dans le monde.

En travaillant avec des chercheurs des deux côtés de l’Atlantique, il a trouvé quelques bonnes options. Mais sa tâche est celle du serrurier le plus exigeant : repérer les composés chimiques qui, à eux seuls, se tordront et se plieront en la forme microscopique qui peut parfaitement s’intégrer dans les molécules d’une bouteille en plastique et les séparer, comme une clé ouvrant une porte .

Déterminer le contenu chimique exact d’une enzyme donnée est un défi assez simple de nos jours. Mais identifier sa forme tridimensionnelle peut nécessiter des années d’expérimentation biochimique. Ainsi, l’automne dernier, après avoir lu qu’un laboratoire d’intelligence artificielle à Londres appelé DeepMind avait construit un système qui prédit automatiquement la forme des enzymes et d’autres protéines, le Dr McGeehan a demandé au laboratoire si cela pouvait l’aider dans son projet.

Vers la fin d’une semaine de travail, il a envoyé à DeepMind une liste de sept enzymes. Le lundi suivant, le laboratoire a renvoyé les formes pour les sept. « Cela nous a fait avancer d’un an, sinon deux », a déclaré le Dr McGeehan.

Désormais, tout biochimiste peut accélérer son travail à peu près de la même manière. Jeudi, DeepMind a publié les formes prévues de plus de 350 000 protéines – les mécanismes microscopiques qui régissent le comportement des bactéries, des virus, du corps humain et de tous les autres êtres vivants. Cette nouvelle base de données comprend les structures tridimensionnelles de toutes les protéines exprimées par le génome humain, ainsi que celles des protéines qui apparaissent dans 20 autres organismes, dont la souris, la mouche des fruits et la bactérie E. coli.

Cette carte biologique vaste et détaillée – qui fournit environ 250 000 formes qui étaient auparavant inconnues – peut accélérer la capacité de comprendre les maladies, de développer de nouveaux médicaments et de réutiliser les médicaments existants. Cela peut également conduire à de nouveaux types d’outils biologiques, comme une enzyme qui décompose efficacement les bouteilles en plastique et les convertit en matériaux qui sont facilement réutilisés et recyclés.

« Cela peut vous faire avancer dans le temps – influencer la façon dont vous envisagez les problèmes et aider à les résoudre plus rapidement », a déclaré Gira Bhabha, professeure adjointe au département de biologie cellulaire de l’Université de New York. « Que vous étudiiez les neurosciences ou l’immunologie – quel que soit votre domaine de biologie – cela peut être utile. »

Cette nouvelle connaissance est sa propre sorte de clé : si les scientifiques peuvent déterminer la forme d’une protéine, ils peuvent déterminer comment d’autres molécules s’y lieront. Cela pourrait révéler, par exemple, comment les bactéries résistent aux antibiotiques – et comment contrer cette résistance. Les bactéries résistent aux antibiotiques en exprimant certaines protéines ; si les scientifiques étaient capables d’identifier les formes de ces protéines, ils pourraient développer de nouveaux antibiotiques ou de nouveaux médicaments qui les suppriment.

Dans le passé, localiser la forme d’une protéine nécessitait des mois, des années voire des décennies d’expériences par essais et erreurs impliquant des rayons X, des microscopes et d’autres outils sur la paillasse du laboratoire. Mais DeepMind peut réduire considérablement la chronologie avec sa technologie d’IA, connue sous le nom d’AlphaFold.

Lorsque le Dr McGeehan a envoyé à DeepMind sa liste de sept enzymes, il a dit au laboratoire qu’il avait déjà identifié des formes pour deux d’entre elles, mais il n’a pas précisé lesquelles. C’était une façon de tester le bon fonctionnement du système ; AlphaFold a réussi le test, prédisant correctement les deux formes.

Il était encore plus remarquable, a déclaré le Dr McGeehan, que les prédictions soient arrivées en quelques jours. Il a appris plus tard qu’AlphaFold avait en fait terminé la tâche en quelques heures seulement.

AlphaFold prédit les structures des protéines à l’aide de ce qu’on appelle un réseau neuronal, un système mathématique qui peut apprendre des tâches en analysant de grandes quantités de données – dans ce cas, des milliers de protéines connues et leurs formes physiques – et en extrapolant vers l’inconnu.

C’est la même technologie qui identifie les commandes que vous aboyez dans votre smartphone, reconnaît les visages dans les photos que vous publiez sur Facebook et qui traduit une langue dans une autre sur Google Translate et d’autres services. Mais de nombreux experts pensent qu’AlphaFold est l’une des applications les plus puissantes de la technologie.

« Cela montre que l’IA peut faire des choses utiles dans la complexité du monde réel », a déclaré Jack Clark, l’un des auteurs de l’AI Index, un effort pour suivre les progrès de la technologie de l’intelligence artificielle à travers le monde.

Comme le Dr McGeehan l’a découvert, cela peut être remarquablement précis. AlphaFold peut prédire la forme d’une protéine avec une précision qui rivalise avec les expériences physiques environ 63 pour cent du temps, selon des tests de référence indépendants qui comparent ses prédictions aux structures protéiques connues. La plupart des experts avaient supposé qu’une technologie aussi puissante était encore à des années.

« Je pensais que cela prendrait encore 10 ans », a déclaré Randy Read, professeur à l’Université de Cambridge. « Ce fut un changement complet. »

Mais la précision du système varie, donc certaines des prédictions de la base de données de DeepMind seront moins utiles que d’autres. Chaque prédiction de la base de données est accompagnée d’un « score de confiance » indiquant à quel point elle est susceptible d’être précise. Les chercheurs de DeepMind estiment que le système fournit une « bonne » prédiction environ 95 % du temps.

Toutes les actualités du site n'expriment pas le point de vue du site, mais nous transmettons cette actualité automatiquement et la traduisons grâce à une technologie programmatique sur le site et non à partir d'un éditeur humain.

Comments