DANS LES LABOS > AlphaFold, roi du pliage de… protéines
Une intelligence artificielle développée par DeepMind, filiale de Google, offre aux biologistes un formidable outil pour améliorer la connaissance du vivant
Les protéines sont les machines qui participent au fonctionnement du vivant. Ces macromolécules renouvellent les tissus, font bouger nos yeux et pousser nos cheveux, oeuvrent à la digestion sous forme d’enzymes, contribuent comme anticorps à la défense immunitaire… Sans elles, pas de vie possible. On en a recensé 200 millions à ce jour et l’on en découvre 30 millions supplémentaires chaque année. Le corps humain en compte plusieurs dizaines de milliers. Toutes ces protéines résultent de l’assemblage de 21 acides aminés, qui se combinent en de longues chaînes et se replient en une pelote à la forme bien déterminée, suivant des processus physico-chimiques complexes. C’est cette forme qui détermine leur fonction. Or seule celle d’une poignée de protéines nous est connue. Et pour cause, la méthode pour identifier cette forme est longue, complexe, coûteuse, et les échecs sont fréquents.
Prédire pour mieux créer
Mais pourquoi est-il si important de connaître la façon dont se plie la protéine? Pour pouvoir interagir avec elle ou pour en créer de nouvelles, dont la forme sera adaptée à une fonction précise. DeepMind imagine ainsi la création de nouveaux médicaments, le développement d’enzymes dévoreuses de plastique et mille autres applications ambitieuses. Si la filiale de Google se montre aussi enthousiaste, c’est qu’elle pourrait bien avoir trouvé le moyen de prédire la forme de n’importe quelle protéine à partir de l’analyse des acides aminés qui la composent. Ce problème, qui préoccupe les chercheurs depuis cinquante ans, a été résolu par une intelligence artificielle (IA), de manière assez spectaculaire!
Des milliards de combinaisons
Depuis 1994, l’expérience Critical assessment of structure prediction (en français « Évaluation critique de la prédiction de la structure ») invite les chercheurs du monde entier à prédire la structure des protéines par voie informatique. Jusqu’en 2018, aucun programme n’était parvenu à modéliser correctement l’une de ces macromolécules. Cette année-là, DeepMind avait créé la surprise, en obtenant une reproduction d’une protéine connue avec une fidélité de 60 %. En 2020, le nouvel algorithme AlphaFold 2 a fait sauter la banque avec 90 % de ressemblance ! Tout cela à partir d’une simple chaîne d’acides aminés, que l’IA est parvenue à plier bien comme il faut, malgré les milliards de milliards de combinaisons possibles. Bien sûr, il s’agit là du meilleur score obtenu, et d’autres modélisations se sont avérées moins précises. Mais les progrès de l’algorithme en seulement deux ans ont été jugés très encourageants par toute la communauté scientifique. DeepMind a annoncé poursuivre l’apprentissage d’AlphaFold 2 afin d’améliorer sa fiabilité et sa vitesse d’exécution déjà remarquable : trente minutes lui suffisent pour prédire le pliage d’une chaîne d’acides aminés.