En 1950, Alan Turing, l’un des pères de l’informatique, a prédit que les machines viendraient concurrencer les hommes dans les “domaines intellectuels” et a déclaré qu’ils pouvaient même apprendre à comprendre et à parler anglais. C’est un objectif très ambitieux, car si les règles de grammaire facilitent la construction des phrases, il leur est très difficile d’en déduire des significations.

Dans le langage naturel humain, il existe de nombreuses façons d’exprimer la même idée, et les mots utilisés dans le même contexte ont souvent des significations similaires. Cependant, de petites variations de lettres peuvent totalement changer le sens d’une phrase.

Des chercheurs du MIT ont appliqué des outils de traitement automatique du langage humain pour identifier et prédire les mutations qui permettent au coronavirus, au virus de la grippe et au VIH d’échapper au système immunitaire.

Pour relever ces défis et former les ordinateurs, des scientifiques ont développé des outils de traitement du langage naturel basés sur l’apprentissage automatique, et maintenant, des ingénieurs du Massachusetts Institute of Technology (MIT, USA) se sont inspirés d’eux pour les appliquer dans un domaine totalement différent: apprenez comment les virus échappent aux défenses de notre corps.

Sur la base de notre utilisation des mots, les chercheurs présentent cette semaine dans la revue Science une nouvelle méthode pour identifier et prédire les mutations (variations de la séquence d’acides aminés des protéines) qui permettent aux virus d’échapper à l’immunité humaine et aux vaccins. De cette manière, les techniques expérimentales coûteuses actuellement utilisées dans le même but pourraient être évitées ou réduites.

Soixante-quatre ans après sa mort, Alan Turing a de nouveau raison

Conséquences de la modification d’une lettre

L’un des auteurs, Bryan Bryson, donne au SINC un exemple linguistique: «Considérons la phrase en anglais Le garçon tape le chien (le garçon tape le chien). Avec un seul changement dans une lettre, nous pouvons continuer à préserver la grammaire et la sémantique: Le garçon caresse le chien (le garçon caresse le chien), mais perd aussi la correction grammaticale: Le garçon patx le chien (patx n’existe pas) ».

“Mais si, en changeant également un seul caractère, nous voulons qu’il suive l’ensemble des règles de la langue anglaise en modifiant considérablement le sens, on peut dire: Le garçon mange le chien (le garçon mange le chien) “. Rien à voir avec les phrases précédentes.

Comme pour le langage, les virus peuvent échapper à la réponse immunitaire par des mutations, en préservant la «grammaire ou syntaxe» biologique qui régit leur infectivité virale, mais en modifiant la «sémantique» d’une séquence protéique afin qu’elle ne soit pas reconnue par les anticorps.

De la même manière, les auteurs ont constaté que Les virus peuvent échapper à la réponse immunitaire par des mutations qui préservent la “ grammaire ou syntaxe ” biologique qui régit l’infectivité virale, mais en altérant la «sémantique» ou la signification d’une séquence protéique afin qu’elle ne soit pas reconnue par les anticorps et puisse infecter les cellules.

Cette capacité des virus représente un enjeu majeur dans le développement de vaccins et d’antiviraux, en particulier pour créer une grippe universelle, ainsi que des thérapies efficaces contre le VIH. Dans la pandémie de covid-19, cette “ évasion virale ” est également devenue une préoccupation urgente lors de la recherche de solutions au coronavirus.

«En utilisant des données publiques (séquences virales brutes brutes), nous montrons que lorsque nous optimisons un changement sémantique important dans le modèle tout en maintenant une grammaire élevée, en particulier pour le virus de la grippe, nous pouvons identifier les mutations «enrichi» pour cette évasion virale », dit Bryson.

“Ce que nous montrons dans l’article – poursuit-il – c’est que nous pouvons localiser des régions ou des domaines plus ou moins enclins à s’échapper. Par exemple, nous montrons que la “ tête ” de la protéine hémagglutinine (HA) du virus de la grippe est plus susceptible de le faire que la “ tige ”, et cela est cohérent avec ce que les chercheurs du vaccin antigrippal ont vu après de nombreux essais ».

Le Royaume-Uni détecte une deuxième variante “ très contagieuse ” du COVID-19 d’Afrique du Sud

Prédictions pour le coronavirus

En plus des protéines du virus de la grippe, Les résultats du modèle ont permis de prédire avec précision les mutations et les régions associées à la fuite immunitaire du virus VIH responsable du sida et du coronavirus responsable de la pandémie de covid-19..

Images de protéines de virus de la grippe, du VIH et du SRAS-CoV-2 avec des zones colorées en fonction de leur potentiel à muter et à «échapper» à la réponse immunitaire. / B. Hie et al.-MIT / Science

“Pour la protéine de pointe du SARS-CoV-2, notre modèle prédit que deux domaines de la protéine (la liaison au récepteur et le soi-disant N-terminal) sont plus susceptibles de s’échapper qu’une autre région de la protéine appelée S2”, Bryson explique, «et nous pouvons utiliser ces informations pour concevoir des expériences supplémentaires en laboratoire et d’explorer à quelles régions protéiques les anticorps thérapeutiques ou ceux générés par le vaccin se lient ».

«L’importance de tout cela est que lorsque vous concevez un nouvel antiviral ou développez un vaccin, vous souhaiterez peut-être cibler les zones qui sont moins susceptibles de s’échapper, car ces régions seront plus stables avec le temps», conclut le Chercheur du MIT.

Référence: Brian Hie, Ellen D. Zhong, Bonnie Berger et Bryan Bryson. “Apprendre le langage de l’évolution virale et de l’évasion”. (Point de vue: Y.-A. Kim et TM Przytycka. “Le langage d’un virus”). Science, 2021