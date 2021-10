Le SARS-CoV-2, le virus qui cause le Covid-19, n’a pas été intentionnellement créé dans un laboratoire. Nous n’avons pas beaucoup de preuves d’une manière ou d’une autre si son apparition dans le monde était le résultat d’un accident de laboratoire ou d’un saut naturel d’animal à humain, mais nous savons avec certitude que le virus n’est pas le produit d’une modification délibérée des gènes. dans un laboratoire.

Comment savons-nous cela? La bio-ingénierie laisse des traces – des modèles caractéristiques dans l’ARN, le code génétique d’un virus, qui proviennent de l’épissage de gènes provenant d’ailleurs. Et les enquêtes des chercheurs ont définitivement montré que le nouveau coronavirus derrière Covid-19 ne porte pas les caractéristiques d’une telle manipulation.

Ce fait à propos des virus issus de la bio-ingénierie soulève une question intéressante : et si les traces laissées par l’édition de gènes ressemblaient davantage à des empreintes digitales ? C’est-à-dire, et s’il était possible non seulement de dire si un virus a été conçu, mais précisément où il a été conçu ?

C’est l’idée derrière l’attribution par génie génétique : l’effort de développer des outils qui nous permettent d’examiner une séquence génétiquement modifiée et de déterminer quel laboratoire l’a développée. Un grand concours international parmi les chercheurs plus tôt cette année démontre que la technologie est à notre portée, même s’il faudra beaucoup de raffinement pour passer de résultats de concours impressionnants à des outils que nous pouvons utiliser de manière fiable pour le travail de détective biologique.

Le concours, le Genetic Engineering Attribution Challenge, était parrainé par certains des principaux laboratoires de recherche biologique au monde. L’idée était de mettre des équipes au défi de développer des techniques d’attribution par génie génétique. Les participants les plus performants du concours pourraient prédire, à l’aide d’algorithmes d’apprentissage automatique, quel laboratoire a produit une certaine séquence génétique avec une précision de plus de 80%, selon une nouvelle préimpression résumant les résultats du concours.

Cela peut sembler technique, mais cela pourrait en fait être assez conséquent dans l’effort pour protéger le monde d’un type de menace auquel nous devrions tous être plus sensibles après la pandémie : les armes bio-ingénierie et les fuites de virus bio-ingénierie.

L’un des défis de la prévention de la recherche et du déploiement d’armes biologiques est que les auteurs peuvent rester cachés – il est difficile de trouver la source de un virus tueur et les tenir pour responsables.

Mais s’il est largement connu que les armes biologiques peuvent être retracées immédiatement et de manière vérifiable jusqu’à un mauvais acteur, cela pourrait être un moyen de dissuasion précieux.

C’est aussi extrêmement important pour la biosécurité en général. Si un virus modifié est accidentellement divulgué, des outils comme ceux-ci nous permettraient d’identifier d’où il provient et de savoir quels laboratoires effectuent des travaux de génie génétique avec des procédures de sécurité inadéquates.

L’empreinte d’un virus

Des centaines de choix de conception entrent dans le génie génétique : « quels gènes vous utilisez, quelles enzymes vous utilisez pour les connecter ensemble, quel logiciel vous utilisez pour prendre ces décisions à votre place », a déclaré l’immunologiste computationnel Will Bradshaw, co-auteur de l’article. moi.

« Les enzymes que les gens utilisent pour découper l’ADN coupent selon différents modèles et ont des profils d’erreur différents », explique Bradshaw. « Vous pouvez le faire de la même manière que vous pouvez reconnaître l’écriture manuscrite. »

Parce que différents chercheurs avec une formation différente et un équipement différent ont leurs propres « tells » distinctifs, il est possible d’examiner un organisme génétiquement modifié et de deviner qui l’a créé, du moins si vous utilisez des algorithmes d’apprentissage automatique.

Les algorithmes qui sont entraînés pour faire ce travail sont alimentés en données sur plus de 60 000 séquences génétiques produites par différents laboratoires. L’idée est que, lorsqu’ils sont alimentés par une séquence inconnue, les algorithmes sont capables de prédire lequel des laboratoires qu’ils ont rencontrés (le cas échéant) l’a probablement produit.

Il y a un an, des chercheurs d’altLabs, du Johns Hopkins Center for Health Security et d’autres programmes de recherche biologique de premier plan ont collaboré au défi, organisant un concours pour trouver les meilleures approches à ce problème de médecine légale biologique. Le concours a suscité un vif intérêt de la part d’universitaires, de professionnels de l’industrie et de scientifiques citoyens – l’un des membres de l’équipe gagnante était un enseignant de maternelle. Près de 300 équipes du monde entier ont soumis au moins un système d’apprentissage automatique pour identifier le laboratoire d’origine de différentes séquences.

Dans ce document de préimpression (qui est toujours en cours d’examen par les pairs), les organisateurs du défi résument les résultats : Les concurrents ont collectivement fait un grand pas en avant sur ce problème. « Les équipes gagnantes ont obtenu des résultats nettement meilleurs que toute tentative précédente d’attribution au génie génétique, l’équipe la mieux notée et l’ensemble des gagnants battant tous deux l’état de l’art précédent de plus de 10 points de pourcentage », note le document.

La grande image est que les chercheurs, aidés par des systèmes d’apprentissage automatique, deviennent vraiment bons pour trouver le laboratoire qui a construit un plasmide donné, ou un brin d’ADN spécifique utilisé dans la manipulation de gènes.

Les équipes les plus performantes ont obtenu une précision de 95 % pour nommer le créateur d’un plasmide par une métrique appelée « précision du top 10 », ce qui signifie que si l’algorithme identifie 10 laboratoires candidats, le véritable laboratoire est l’un d’entre eux. Ils avaient 82% de précision dans le top 1, c’est-à-dire 82% du temps, le laboratoire qu’ils ont identifié comme le concepteur probable de ce plasmide bio-ingénierie était, en fait, le laboratoire qui l’a conçu.

La précision du top 1 est voyante, mais pour le travail de détective biologique, la précision du top 10 est presque aussi bonne : si vous pouvez restreindre la recherche des coupables à un petit nombre de laboratoires, vous pouvez alors utiliser d’autres approches pour identifier le laboratoire exact.

Il y a encore beaucoup de travail à faire. Le concours n’a examiné que des plasmides modifiés simples ; idéalement, nous aurions des approches qui fonctionnent pour des virus et des bactéries entièrement conçus. Et le concours n’a pas examiné d’exemples contradictoires, où des chercheurs tentent délibérément de dissimuler les empreintes digitales de leur laboratoire sur leur travail.

Comment les empreintes génétiques peuvent rendre le monde plus sûr

Savoir quel laboratoire a produit une arme biologique peut nous protéger de trois manières, ont soutenu des chercheurs en biosécurité dans Nature Communications l’année dernière.

Premièrement, « la connaissance de qui était responsable peut éclairer les efforts d’intervention en mettant en lumière les motivations et les capacités, et ainsi atténuer les conséquences de l’événement ». Autrement dit, déterminer qui a construit quelque chose nous donnera également des indices sur les objectifs qu’ils auraient pu avoir et le risque auquel nous pourrions être confrontés.

Deuxièmement, évidemment, cela permet au monde de sanctionner et d’arrêter tout laboratoire ou gouvernement qui produit des armes biologiques en violation du droit international.

Et troisièmement, l’article soutient, espérons-le, que si ces capacités sont largement connues, elles rendent l’utilisation des armes biologiques beaucoup moins attrayante en premier lieu.

Mais les techniques ont aussi des utilisations plus banales.

Bradshaw m’a dit qu’il envisageait que les applications de la technologie pourraient être utilisées pour trouver des fuites accidentelles de laboratoire, identifier le plagiat dans les articles universitaires et protéger la propriété intellectuelle biologique – et ces applications valideront et étendront les outils pour les utilisations vraiment critiques.

Il vaut la peine de répéter que le SRAS-CoV-2 n’était pas un virus artificiel. Mais au cours de la dernière année et demie, nous devrions tous nous demander à quel point une pandémie peut être dévastatrice – et à savoir si les précautions prises par les laboratoires de recherche et les gouvernements sont vraiment adéquates pour prévenir la prochaine pandémie.

La réponse, à mon avis, est que nous n’en faisons pas assez, mais une médecine légale plus sophistiquée pourrait certainement aider. L’attribution par génie génétique est encore un domaine nouveau. Avec plus d’efforts, il sera probablement possible un jour de rendre l’attribution possible à une échelle beaucoup plus grande et de le faire pour les virus et les bactéries. Cela pourrait créer un avenir beaucoup plus sûr.

Une version de cette histoire a été initialement publiée dans le bulletin Future Perfect. Inscrivez-vous ici pour vous abonner !