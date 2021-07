14/07/2021 à 08:00 CEST

L’ADN est confirmé comme un système de stockage d’informations numériques car il peut être codé dans les génomes des cellules vivantes de la bactérie E. coli, selon des recherches récentes.

En 2025, le monde aura 175 zettaoctets (ZB) de données stockées, selon Rethink Data, ce qui représente un défi technologique.

Un ZB équivaut à 1 milliard de téraoctets (To), tandis qu’un To équivaut à 1 000 gigaoctets (Go) ou 1 000 000 mégaoctets (Mo). Chaque Mo équivaut à un million d’octets. Chaque octet représente un ensemble de 8 bits, le plus petit élément de mémoire adressable dans un ordinateur.

Autrement dit, pour disposer de 3 ZB de stockage il faudrait connecter 300 millions de disques durs de 10 To chacun. Et cela représente un problème technologique de plus en plus pressant : nous allons bientôt perdre la capacité de stocker autant de données, prévenait la revue Nature en 2016.

Code génétique au lieu de binaire

Code génétique au lieu de binaireL’alternative pourrait être de changer le système de stockage des données : cela a conduit les scientifiques à explorer la possibilité d’utiliser le système naturel de stockage d’informations, l’ADN.

L’ADN peut stocker des milliards de “bits & rdquor; de paires de bases, l’ensemble complet d’instructions pour créer un être humain complet, dans une seule cellule microscopique.

Les scientifiques ont déjà réussi à traduire le code binaire (deux bits) en code génétique à quatre lettres, à travers lequel les cellules reçoivent des instructions pour fabriquer une protéine spécifique.

A, T, C et G sont les « lettres » du code ADN : elles représentent les composés chimiques adénine (A), thymine (T), cytosine (C) et guanine (G), qui constituent les bases nucléotidiques de l’ADN. .

Le code de chaque gène combine les quatre composés chimiques de différentes manières pour former des “mots” de trois lettres, qui spécifient quels acides aminés sont nécessaires à chaque étape de la synthèse des protéines, explique le NIH.

Rubrique connexe : Activer et désactiver l’ADN à l’aide de la lumière

Disque dur en direct

Disque dur en directEn utilisant ce code chimique à quatre lettres, les scientifiques ont découvert qu’ils peuvent stocker des bibliothèques entières d’informations numériques : des livres, des films et des jeux vidéo peuvent être chargés dans de minuscules gouttelettes d’ADN synthétique, puis récupérés.

Les scientifiques sont convaincus qu’un jour, l’ADN pourra offrir une alternative rentable et respectueuse de l’environnement à la technologie de stockage traditionnelle basée sur les puces de silicium.

Cependant, un problème auquel les chercheurs travaillant dans ce domaine ont été confrontés est que l’ADN synthétique a tendance à se détériorer avec le temps.

Cependant, une équipe de scientifiques de l’Université Columbia pense avoir trouvé une solution à ce problème : encoder des informations numériques directement dans les génomes des cellules vivantes de la bactérie E. coli, qui possède plus de 4,6 millions de paires de bases d’ADN. Les chercheurs notent que cette bactérie conserve les données d’une manière étonnamment stable et robuste.

« Qu’une cellule vivante puisse fournir un environnement plus stable pour stocker des données peut sembler contre-intuitif, mais une cellule dispose en fait de mécanismes sophistiqués pour maintenir l’intégrité de son ADN et corriger rapidement toute erreur génétique pouvant survenir à la suite de radiations, de toxines ou d’autres expositions & rdquor;, explique le directeur de cette recherche, Harris H. Wang, dans un communiqué.

Une bactérie avec des informations numériques

Une bactérie avec des informations numériquesCette équipe a réussi à diffuser des données individuelles sur de larges pans du génome d’E. coli, confirmant ainsi que les informations sont transmises en toute sécurité à travers les générations successives de cellules, même si des mutations se produisent pendant la reproduction cellulaire.

“Nous avons mené des expériences pour montrer que les données sont bien conservées sur des centaines de générations”, ajoute Wang. “À toutes fins utiles, cela semble être un moyen fiable de stocker des données de manière permanente.”

Wang et ses collègues, qui ont utilisé la technologie populaire d’édition de gènes CRISPR-Cas pour coder des données dans des souches non pathogènes d’E. coli, ont entrepris d’améliorer la vitesse à laquelle ils peuvent charger et récupérer des données à partir de bactéries, comme le processus est actuellement trop lent pour un usage commercial.

Cependant, Wang est convaincu qu’il sera possible de remplacer les piles de disques durs d’ordinateurs par une population de cellules E. coli pouvant tenir dans un tube à essai.

“L’avantage le plus important du stockage d’informations numériques dans l’ADN est que c’est un support qui ne deviendra jamais obsolète”, explique-t-il. “La double hélice sera toujours la technologie de stockage idéale, et notre capacité à manipuler et à lire l’ADN ne fera que s’améliorer”, conclut-il.

Idée toujours renouvelée

Idée toujours renouveléeL’idée d’utiliser le code génétique pour stocker des informations est née peu de temps après la découverte de la célèbre structure en double hélice de l’ADN en 1953, mais ce n’est que récemment que la technologie a commencé à le rendre possible.

Bien que cette technologie ait clairement un potentiel énorme, il reste encore de nombreuses questions pratiques sur les meilleurs moyens d’encoder, de stocker et d’accéder aux données basées sur l’ADN, prévient le magazine Neolife.

En outre, les coûts d’utilisation de l’ADN pour stocker des informations devront être considérablement réduits avant que cette méthode ne puisse concurrencer le stockage de données plus traditionnel, conclut-il.

A cet égard, il faut garder à l’esprit que la synthèse et le séquençage de l’ADN ont un prix très élevé : écrire un million de gigaoctets coûte plus de 800 milliards d’euros.

Le monde ne s’arrêtera pas

Le monde ne s’arrêtera pasPendant ce temps, la technologie n’arrête pas d’innover : des chercheurs du Massachusetts Institute of Technology (MIT) et de l’Université Harvard ont mis au point une technique pour étiqueter et récupérer des fichiers de données ADN, comme le rapporte un article publié dans Nature Materials. Cette méthode pourrait rendre possible le stockage de données sous forme d’ADN, ont-ils déclaré dans un communiqué.

D’autre part, la technologie conventionnelle progresse également, souligne le magazine PC : la société Seagate, principal fournisseur d’octets au monde, qui a déjà produit environ 3 zettaoctets en 40 ans de présence sur le marché, entend mettre au vente en 2026 disques durs de 50 To.

De plus, la technologie d’enregistrement magnétique assisté par la chaleur (HAMR) passera bientôt à 80 To. Et pour le stockage à long terme, Microsoft travaille sur un nouveau support de stockage, construit avec du verre de quartz, qui permettra de visionner le film Superman pendant des milliers d’années.

Les disques durs actifs viendront, et il sera également possible de stocker toutes les données du monde dans une tasse de café, mais pendant que ces futurs arrivent, nous avons le potentiel de continuer à accumuler de plus en plus d’informations de manière exponentielle.

Les références

Les référencesEnregistrement de l’ADN mobile dans le microbiote intestinal à l’aide d’une plateforme d’acquisition d’espaceurs Escherichia coli CRISPR-Cas. Christian Munck et al. Nature Communications volume 11, Numéro d’article : 95 (2020). DOI : https : //doi.org/10.1038/s41467-019-14012-5

Mémoire ADN à accès aléatoire à l’aide de la recherche booléenne dans un système de stockage de fichiers d’archives. James L. Banal et al. Matériaux naturels (2021). DOI : https : //doi.org/10.1038/s41563-021-01021-3

Image du haut : Furiosa-L de Pixabay