Une structure de protéine générée par un algorithme d’apprentissage automatique développé par l’Institute for Protein Design de l’Université de Washington. (Photo UW IPD | Ian C. Haydon)

De nouvelles structures protéiques inconnues dans la nature ont émergé du logiciel d’apprentissage en profondeur déployé par des chercheurs de l’Université de Washington et leurs collègues. L’approche est une étape vers la construction de protéines sur mesure avec des propriétés spécifiques, un exploit qui accélérerait le développement de médicaments.

« Cette approche simplifie grandement la conception des protéines », a déclaré David Baker, directeur de l’Institute for Protein Design de l’UW, dans un communiqué. La recherche a été publiée mercredi dans la revue Nature.

Un logiciel d’apprentissage en profondeur récemment développé par IPD et DeepMind d’Alphabet a stupéfié les scientifiques par leur vitesse et leur précision pour prédire la forme des protéines présentes dans la nature. Les protéines se replient en structures tridimensionnelles pour effectuer des tâches clés dans le corps, de la régulation du métabolisme à la division cellulaire.

Dans la nouvelle étude, les chercheurs de l’IPD ont utilisé l’apprentissage en profondeur pour générer par ordinateur des structures de protéines artificielles complètement nouvelles.

Les chercheurs comparent leur approche à DeepDream de Google, qui peut produire des images qu’il appelle « hallucinations » basées sur des photos qui y sont introduites. Seule l’entrée est constituée de protéines naturelles, et la sortie est constituée de nouvelles structures imaginées par le logiciel d’apprentissage en profondeur IPD. Les chercheurs ont même adopté le terme « hallucination » pour les nouvelles structures, intitulant leur étude « De novo protein design by deep network hallucination ».

« A aucun moment, nous n’avons guidé le logiciel vers un résultat particulier – ces nouvelles protéines sont exactement ce qu’un ordinateur imagine », a déclaré le premier auteur Ivan Anishchenko, chercheur postdoctoral au laboratoire Baker, dans le communiqué.

Le corps fabrique des protéines à partir de blocs de construction d’acides aminés, les assemblant comme des perles sur une ficelle. De même, les chercheurs ont commencé leur étude en générant par ordinateur des chaînes aléatoires de 100 acides aminés. Lorsqu’ils ont exécuté ces chaînes dans leur réseau de prédiction, elles ne ressemblaient à rien, ne se repliant pas dans des structures définies.

Dans leur prochaine étape, les chercheurs ont muté par ordinateur un acide aminé aléatoire dans la chaîne, le changeant en un autre acide aminé. Si la protéine résultante semblait un peu plus structurée, ils ont ajouté une autre mutation, en milliers d’étapes itératives.

L’étude a produit 129 structures protéiques qui ressemblaient à des protéines naturelles dans leurs formes prédites. Certaines structures étaient encore plus rationalisées, similaires aux structures idéales créées par les concepteurs de protéines à l’aide d’approches plus conventionnelles.

L’équipe a ensuite validé certaines des structures et les a synthétisées en laboratoire. Il y en avait 27 qui semblaient correspondre aux structures prédites dans les premières expériences ; trois d’entre eux ont été choisis pour des études structurelles plus approfondies en laboratoire et se sont avérés correspondre étroitement aux modèles.

Ivan Anishchenko, chercheur postdoctoral à l’UW IPD. (Photo UW IPD)

Leonid Sasanov, professeur et biologiste structurel à l’Institut des sciences et technologies de Klosterneuburg, en Autriche, a commenté la nouvelle étude dans un tweet : « J’admire le courage de les appeler ‘hallucinés’. Des trucs super cool!”

La nouvelle étude est une étape vers un objectif plus large de conception de protéines ayant des actions potentiellement thérapeutiques – par exemple, interférer avec une enzyme causant une maladie ou bloquer un virus. L’IPD a publié le mois dernier une étude de préimpression qui va encore plus loin vers cet objectif, suggérant que les outils d’apprentissage en profondeur peuvent générer intentionnellement des protéines avec des modules fonctionnels.

« Explorer la meilleure façon d’utiliser cette stratégie pour des applications spécifiques est désormais un domaine de recherche actif, et c’est là que j’attends les prochaines percées », a déclaré Baker.

L’étude Nature a utilisé un outil d’apprentissage en profondeur construit par IPD avant son blockbuster RoseTTAfold. Le laboratoire déploie maintenant RoseTTAfold et AlphaFold de DeepMind pour une variété de problèmes de repliement des protéines, y compris dans leur nouvelle préimpression. En novembre dernier, le laboratoire a publié une étude prédisant la structure des complexes protéiques, qui peuvent agir comme des machines pour effectuer des travaux dans le corps.

Plusieurs sociétés de découverte de protéines sont issues de l’IPD en utilisant diverses technologies. Il s’agit notamment d’A-Alpha Bio, qui a récemment levé 20 millions de dollars, et de Cyrus Biotechnology, qui a récemment signé un accord d’une valeur pouvant atteindre 1,5 milliard de dollars avec la biotechnologie immunitaire Selecta. Alphabet est également entré dans l’arène en novembre, lançant Isomorphic Laboratories pour s’appuyer sur la recherche de DeepMind sur le repliement des protéines.

L’étude Nature a également inclus des chercheurs de l’Université Harvard et du Rensselaer Polytechnic Institute de Troy, New York.