in

L’intelligence artificielle révolutionne les sciences de la vie

30/07/2021 à 08h00 CEST

Le laboratoire de recherche DeepMind, en association avec l’Institut Européen de Bioinformatique de l’EMBL (EMBL-EBI), a créé la carte la plus complète des protéines humaines en utilisant l’Intelligence Artificielle (IA), une révolution dans les sciences de la vie.

Certains scientifiques comparent l’impact potentiel de ce développement avec celui du projet du génome humain (1990-2003), qui a réalisé une séquence complète de 90 pour cent des trois milliards de paires de bases du génome humain.

Maintenant, l’IA a réalisé quelque chose de beaucoup plus compliqué : déchiffrer la structure de plus de 20 000 protéines humaines, plus du double du nombre disponible jusqu’à présent, ainsi que de presque toutes les protéines produites par 20 organismes de référence.

C’est, comme l’expliquent les protagonistes de cet exploit dans un article publié dans Nature, la première méthode informatique capable de prédire régulièrement les structures des protéines avec une précision atomique, même lorsqu’une structure similaire n’est pas connue.

The Verge souligne à cet égard qu’il existe actuellement environ 180 000 structures protéiques disponibles dans le domaine public, chacune produite par des méthodes expérimentales et accessible via la Protein Data Bank.

DeepMind et EMBL-EBI ajoutent maintenant des prédictions pour la structure de quelque 350 000 protéines dans 20 organismes différents, y compris des animaux comme les souris et les mouches des fruits, et des bactéries comme E. coli.

Bien que la contribution de DeepMind et de l’EMBL-EBI chevauche partiellement ce qui était auparavant disponible dans la banque de données sur les protéines, la chose la plus importante à propos de leur contribution est qu’elle inclut des prédictions pour 98% de toutes les protéines humaines, environ 20 000 structures différentes, dont elles sont connues. sous le nom de protéome humain. Ce n’est pas le premier ensemble de données publiques sur les protéines humaines, mais c’est le plus complet et le plus précis, note The Verge.

AlphaFold, la clé

AlphaFold, la cléPour parvenir à ce résultat spectaculaire, DeepMind s’est appuyé sur son propre outil d’apprentissage automatique appelé AlphaFold, basé sur des réseaux de neurones.

Il y a un an, AlphaFold avait déjà résolu l’un des plus grands défis des 50 dernières années : comment les protéines se replient en formes 3D. Ce programme d’IA a pu prédire ces structures à partir de leurs séquences d’acides aminés.

Pour le nouveau développement, AlphaFold a été formé aux séquences d’ADN et aux formes déjà connues de dizaines de milliers de protéines, contenues dans une base de données de protéines d’accès public hébergée par les chercheurs de l’EBI-EMBL.

Comme les auteurs l’expliquent dans leur article, la dernière version d’AlphaFold est basée sur une nouvelle approche de l’apprentissage automatique qui intègre des connaissances physiques et biologiques sur la structure des protéines, tirant parti de plusieurs alignements de séquences.

Les protéines sont des molécules complexes qui effectuent de nombreuses tâches dans le corps, de la fabrication des tissus à la défense contre les maladies. Son but est dicté par sa structure, qui se plie comme une feuille d’origami en formes complexes et irrégulières.

Comprendre comment une protéine se replie aide à expliquer sa fonction, ce qui permet aux scientifiques d’effectuer diverses tâches, allant de la recherche fondamentale sur le fonctionnement du corps à la conception de nouveaux médicaments et traitements.

Sujet connexe : L’intelligence artificielle simplifie le chemin vers les protéines synthétiques

Transparence

TransparenceL’ensemble du processus de la nouvelle enquête s’est déroulé au grand jour, en présence de sténographes, car auparavant DeepMind avait publié le code source d’AlphaFold et détaillé comment il avait été construit.

Le travail ne s’arrête pas là, car la base de données obtenue avec l’IA sera mise à jour dans le but de visualiser 130 millions de structures protéiques d’ici la fin de cette année.

Le résultat obtenu est un formidable outil scientifique qui complète les technologies existantes et permettra aux biologistes de repousser les limites de la compréhension de la vie, explique Ewan Birney, directeur général adjoint de l’EMBL, dans le Cambridge Independent.

Dans un article complémentaire à celui des scientifiques, Nature rapporte que les biologistes structurels et autres chercheurs commencent déjà à utiliser AlphaFold pour obtenir des modèles plus précis de protéines qui ont été difficiles voire impossibles à caractériser avec les méthodes expérimentales actuelles.

Défi résolu

Défi résoluIl ajoute que prédire la forme tridimensionnelle dans laquelle les protéines se replient a été l’un des “grands défis” non résolus en biologie depuis la découverte en 1953 de la structure de l’ADN.

Avant l’IA, prédire la structure d’une protéine à partir d’une séquence était un processus fastidieux, voire laborieux, avec peu de garantie d’un résultat précis, note Nature.

Cependant, l’IA a montré qu’elle peut prédire avec précision les structures des protéines en quelques minutes ou en quelques heures, par rapport aux mois ou aux années qu’il fallait auparavant pour déterminer la structure d’une ou deux protéines.

Et cela ouvre des possibilités d’applications, par exemple, dans l’ingénierie d’enzymes pour décomposer les polluants environnementaux tels que les microplastiques, entre autres applications possibles de cette nouvelle information, selon Nature.

Nous devons continuer

Nous devons continuerLe magazine avertit également que ce développement n’est pas la fin de la route : alors que l’IA en science et technologie est bonne pour produire des résultats précis, il reste encore du travail à faire pour débloquer la science – la biologie, la chimie et la physique essentielles – de la façon dont et pourquoi les protéines se replient.

Il souligne également qu’il est trop tôt pour prédire exactement quel impact l’application de l’IA aura dans les sciences de la vie, car davantage de données expérimentales sont nécessaires pour anticiper avec précision comment l’IA changera la biologie que nous n’avons pas encore.

Le plus important de ce qui a été réalisé jusqu’à présent est que la communauté de recherche en biologie structurale et ses collaborateurs dans d’autres domaines disposent déjà d’une vaste mine de nouvelles données à explorer, conclut Nature.

Bénéfice pour l’humanité

Bénéfice pour l’humanitéDeepMind souligne que, alors que les chercheurs recherchent des remèdes contre les maladies et des solutions à d’autres grands problèmes auxquels l’humanité est confrontée, notamment la résistance aux antibiotiques ou au changement climatique, ils bénéficieront de nouvelles connaissances sur la structure des protéines.

Pour l’entreprise leader dans ce développement, il s’agit de la contribution la plus importante que l’IA ait apportée à l’avancement des connaissances scientifiques, et c’est un excellent exemple des avantages que l’IA peut apporter à l’humanité.

Référence

RéférencePrédiction très précise de la structure des protéines avec AlphaFold. John Jumper et al. Nature 2021. DOI : https : //doi.org/10.1038/s41586-021-03819-2

Photo du haut : Image de Gerd Altmann sur Pixabay.

Actions CLF : les bonnes nouvelles pour Cleveland-Cliffs devraient continuer à arriver

La foule de Hong Kong huant l’hymne chinois déclenche une enquête policière .