Index des SCIENCES -> INFORMATIQUE 
   
 
Stockage de Données

Le Premier Disque Dur à ADN Fonctionne

L.B. - SCIENCE & VIE N°1221 > Juin > 2019

Le Vivant plus Fort que l'Électronique

J.-P.D. - POUR LA SCIENCE N°473 > Mars > 2017

L'ADN a plus de Longévité que les Disques Durs

COMMENT ÇA MARCHE N°68 > Février > 2016

J'ai Stocké un Livre sur de l'ADN

300 pages codées sur un minuscule brin d'ADN : en réalisant ce prodige, le généticien George Church vient de faire entrer le stockage des données dans une nouvelle dimension. Le début de la fin des DVD ?

Le livre de George Church n'était pas encore paru qu'il avait déjà pulvérisé un record. Dédié aux promesses de la biologie de synthèse et intitulé La Deuxième Genèse, cet essai de 300 pages cosigné par le pionnier de la génétique moléculaire a été dupliqué en 70 milliards d'exemplaires. Soit à peu près trois fois plus de copies qu'en totalisent les 100 ouvrages les plus lus dans toute l'histoire de l'humanité ! Mégalo, George Church ? "Pas du tout, se défend ce sexagénaire à la barbe drue. Avec mon équipe, nous avons réussi à faire tenir tout dans quelques traces de poussière, à peine visibles à l'oil nu". Mais par quel tour de passe-passe ce professeur de Harvard est-il parvenu à réduire en minuscules traînées de poudre 46 millions de gigaoctets ? Comment a-t-il pu compresser cette masse d'informations si vertigineuse qu'elle nécessiterait, pour son stockage, plusieur dizaines de milliers de disques durs ?

L'ADN, MÉMOIRE NATURELLE : Son secret tient en trois lettres : ADN ou acide désoxyribonucléique, la fameuse double hélice qui détient les clés de notre patrimoine génétique. Non contente de fasciner généticiens, physiciens et experts ès nanotechnologies, la voilà qui fait maintenant rêver les informaticiens. Leur ambition : faire de cette molécule le support de stockage du futur, capable de reléguer dans l'arrière-cour des musées disques durs, DVD et autres disques Blu-ray. De l'avis même des biologistes, l'idée n'a rien de farfelu. "Les informaticiens n'ont rien inventé, l'ADN est une fabuleuse mémoire naturelle", rappelle Bernard Dujon, expert en génétique moléculaire à l'Instilut Pasteur.
Il faut dire que ses avantages ne manquant pas. Grâce, notamment, à sa structure en forme d'hélice, très compacte, l'ADN est d'abord le champion incontesté en matière de densité de stockage. Loin, très loin devant les autres technologies (graphique ->) : "En théorie, explique Sriram Kosuri, l'un des chercheurs de l'équipe, 4 grammes d'ADN suffiraient à enregistrer l'intégralité des données stockées dans le monde l'an dernier, soit 1,8 zettaoctet (1.800 milliards de gigaoctets)". L'équivalent de 200 milliards de films d'une durée de deux heures, en haute définition. L'autre atout de l'ADN, c'est son extraordinaire longévité. "Vous pouvez abandonner un échantillon dans le désert ou au fond de votre jardin, il y sera toujours 400.000 ans plus tard", estime George Church. Selon lui, des fragments stockés en laboratoire, dans des conditions particulières de température, peuvent même être conservés au-delà d'un million d'années.
Le principe de ce "stockage sur ADN" ? Il s'agit de transcrire l'alphabet latin en un alphabet "ADN" fait de 4 lettres : A, T, C et G, soit les quatre briques de base de l'ADN (adénine, thymine, cytosine et guanine), appelées nucléotides. Ce codage permet d'obtenir des séquences - semblables aux chaînes de nucléotides dans l'ADN qu'une machine peut convertir en molécules de synthèse. Lesquelles pourront être stockées au choix sous forme liquide (quelques gouttes dans une éprouvette), ou solide (des traces de poussière sur une puce à ADN). Simple a priori... Pourtant, les tentatives menées depuis une vingtaine d'années avaient tout juste permis de copier quelques centaines d'octets, extraits de la Bible, de poèmes, de messages secrets de la Seconde Guerre mondiale ou d'un roman de Dickens. Sur des textes plus longs, l'expérience se heurtait à de fréquentes erreurs de transcription, tantôt lors de l'enregistrement des données, tantôt au moment de les récupérer. "Copier de grandes quantités de données sur de longues chaînes d'ADN reste compliqué reconnaît George Church.

UNE IMPRIMANTE À ADN : Le généticien a alors l'idée de "saucissonner" le texte, afin de produire des chaînes d'ADN plus courtes. Au moyen d'un logiciel de leur conception, George Church et son équipe ont d'abord découpé le livre en milliers de tranches de douze caractères chacune. Puis ils les ont converties en séquences de nucléotides, via leur principe de codage en lettres A, T, C et G (infographie ->). Les quelque 55.000 chaînes de nucléotides ainsi obtenues ont ensuite été fabriquées "en vrac" par un synthétiseur, une sorte de petite usine à ADN qui fonctionne comme une imprimante à jet d'encre. Sauf qu'au lieu de puiser dans des cartouches de couleur, elle puise dans des réservoirs d'adénine, de thymine, de cytosine ou de guanine. Le livre tient alors dans une petite pipette renfermant quelques gouttes d'ADN liquide. L'ouvrage est ainsi archivé in vitro.
Ici, l'idée pourrait surgir d'injecter dans des cellules vivantes cet ADN dont le texte est connu. Idée fascinante et techniquement réalisable... mais décevante : cette manipulation provoquerait immanquablement la destruction des données. "Quand un fragment d'ADN n'est d'aucune utilité à la cellule, elle l'élimine", explique le chercheur. A moins de fournir de nouvelles armes, pour permettre par exemple à la cellule de combattre un virus, le fragment est donc détruit. C'est pourquoi le livre a été enregistré sur une puce à ADN, une lamelle de verre destinée à stocker les molécules ainsi synthétisées, sous forme de microscopiques particules de poussière. "Sous sa forme solide, poursuit le chercheur, l'ADN est au moins 100 fois plus compact que dans son état liquide. Restait à vérifier l'efficacité de la copie. Pour cela, les chercheurs ont réalisé l'opération inverse. Avec un séquenceur (une machine à trier, capable de remettre le texte dans l'ordre), ils ont déchiffré les fragments d'ADN qui avaient été codés et ils ont reconverti, à l'aide de leur logiciel, les suites de A, T, C et G dans le texte d'origine. Résultat : un sans-faute ou presque, avec seulement 10 bits mal copiés sur les quelque 5 millions contenus dans l'original, soit une copie réussie à plus de 99,999 % ! "A partir de cette première copie, explique George Church, nous en avons fait des milliards d'autres, pour démontrer combien il est devenu simple de dupliquer d'immenses quantités de données". Masse de l'ensemble ? Un dixième de milligramme...

L'ARCHIVAGE DU FUTUR ? De quoi, enfin, remédier à l'un des plus grands paradoxes de notre ère numérique ? "Nous générons des masses toujours plus grandes d'informations alors que la durée de vie des supports disponibles n'a jamais été aussi courte", résume Erich Spitz. Dans son dernier rapport consacré à la durée de vie des supports actuels, ce physicien de l'Académie des sciences fustigeait la fragilité des CD, DVD et disques Blu-ray qu'il condamnait à "l'amnésie" au bout d'une quinzaine d'années. "Cette expérience sur l'ADN est d'autant plus excitante, insiste le physicien, qu'elle ouvre la voie à la conservation d'énormes quantités de données sur le très long terme". Du reste, ce nouveau support fait déjà rêver certains professionnels de l'archivage : "L'ADN est peut-être en passe de devenir un outil fabuleux pour stocker sur un minimum d'espace des fichiers volumineux, comme les vidéos, ou des informations qui nécessitent d'être gardées de nombreuses années, par exemple des dossiers de suivi médical", estime Laurent Ducol, président de l'Association des archivistes français.
A cela, toutefois, deux conditions : que les coûts diminuent et que le traitement s'accélère. Car de ce côté-là, il y a encore des progrès à faire. Synthétiseur et séquenceur, les deux machines indispensables à cette expérience coûtent chacune plusieurs centaines de milliers d'euros. "Les coûts du séquençage et de la synthèse ont été divisés par 1000 en quatre ans, il n'y a aucune raison pour que cette dégringolade ne continue pas", rétorque George Church. Tout de même, l'archivage du livre a pris plus d'une semaine... "De nouvelles technologies, plus rapides, vont nous permettre d'accélérer la manouvre", assure-t-il. S'il y parvient, rien n'empêchera plus l'ADN de révolutionner le stockage informatique.

STÉPHANE BARGE - SCIENCE & VIE > Décembre > 2012
 

   
 C.S. - Maréva Inc. © 2000 
 charlyjo@laposte.net