Uno studio rivoluzionario compie un passo avanti significativo nel tentativo di sviluppare un DNAsistema di archiviazione basato su dati digitali.
Digitale dati sta crescendo a un ritmo esponenziale oggi a causa della nostra dipendenza dai gadget e richiede una solida archiviazione a lungo termine. L’archiviazione dei dati sta lentamente diventando una sfida perché l’attuale tecnologia digitale non è in grado di fornire una soluzione. Un esempio è che negli ultimi due anni sono stati creati più dati digitali che in tutta la storia computer, infatti ogni giorno nel mondo vengono creati 2.5 quintilioni di byte {1 quintilione di byte = 2,500,000 terabyte (TB) = 2,500,000,000 gigabyte (GB)} di dati. Ciò include dati su siti di social network, transazioni bancarie online, registri di aziende e organizzazioni, dati provenienti da satelliti, sorveglianza, ricerca, sviluppo ecc. Questi dati sono enormi e non strutturati. Pertanto, oggi è una grande sfida affrontare gli enormi requisiti di storage dei dati e la loro crescita esponenziale, soprattutto per le organizzazioni e le aziende che necessitano di un robusto storage a lungo termine.
Le opzioni attualmente disponibili sono disco rigido, dischi ottici (CD), memory stick, unità flash e l'unità a nastro più avanzata o dischi BluRay ottici che memorizzano all'incirca fino a 10 Terabyte (TB) di dati. Tali dispositivi di memorizzazione, pur essendo comunemente utilizzati, presentano numerosi inconvenienti. In primo luogo, hanno una durata di conservazione medio-bassa e devono essere conservati in condizioni di temperatura e umidità ideali per poter durare molti decenni e quindi richiedono spazi fisici di stoccaggio appositamente progettati. Quasi tutti questi consumano molta energia, sono ingombranti e poco pratici e possono danneggiarsi in una semplice caduta. Alcuni di questi sono molto costosi, sono spesso afflitti da errori di dati e quindi non sono abbastanza robusti. Un'opzione che è stata universalmente accettata dall'organizzazione è chiamata cloud computing, un accordo in cui un'azienda assume fondamentalmente un server "esterno" per gestire tutti i suoi requisiti IT e di archiviazione dei dati, denominato "cloud". Uno dei principali svantaggi del cloud computing sono i problemi di sicurezza e privacy e la vulnerabilità agli attacchi degli hacker. Ci sono anche altri problemi come costi elevati, controllo limitato da parte dell'organizzazione madre e dipendenza dalla piattaforma. Il cloud computing è ancora considerato una buona alternativa per l'archiviazione a lungo termine. Tuttavia, sembra che le informazioni digitali generate in tutto il mondo stiano sicuramente superando la nostra capacità di archiviarle e sono necessarie soluzioni ancora più solide per far fronte a questo diluvio di dati fornendo allo stesso tempo scalabilità per tenere conto anche delle future esigenze di archiviazione.
Il DNA può aiutare nell'archiviazione dei computer?
DNA (Acido desossiribonucleico) viene considerato un interessante mezzo alternativo per l'archiviazione dei dati digitali. DNA è il materiale autoreplicante presente in quasi tutti gli organismi viventi ed è ciò che costituisce la nostra informazione genetica. Un artificiale o sintetico DNA è un materiale durevole che può essere prodotto utilizzando macchine per la sintesi di oligonucleotidi disponibili in commercio. Il vantaggio principale del DNA è la sua longevità come a DNA dura 1000 volte di più del silicio (silicon-chip – il materiale utilizzato per la costruzione computer). Sorprendentemente, solo un singolo millimetro cubo di DNA può contenere un quintilione di byte di dati! DNA è inoltre un materiale ultracompatto che non si degrada mai e può essere conservato in un luogo fresco e asciutto per centinaia di secoli. L'idea di utilizzare il DNA per l'archiviazione esiste da molto tempo, nel lontano 1994. Il motivo principale è il modo simile in cui le informazioni vengono archiviate in un computer e nel nostro DNA – poiché entrambi memorizzano i progetti delle informazioni. Un computer memorizza tutti i dati come 0 e 1 e il DNA memorizza tutti i dati di un organismo vivente utilizzando le quattro basi: timina (T), guanina (G), adenina (A) e citosina (C). Pertanto, il DNA potrebbe essere definito un dispositivo di memorizzazione standard, proprio come un computer, se queste basi possono essere rappresentate come 0 (basi A e C) e 1 (basi T e G). Il DNA è resistente e duraturo, la riflessione più semplice è che il nostro codice genetico – il progetto di tutte le nostre informazioni archiviate nel DNA – viene trasmesso in modo efficiente da una generazione a quella successiva in modo ripetuto. Tutti i giganti del software e dell’hardware sono entusiasti di utilizzare il DNA sintetico per archiviare grandi quantità per raggiungere il loro obiettivo di risolvere l’archiviazione dei dati a lungo termine. L'idea è di convertire prima i codici 0 e 1 del computer nel codice DNA (A, C, T, G), il codice DNA convertito viene quindi utilizzato per produrre filamenti sintetici di DNA che possono poi essere messi in celle frigorifere. Quando necessario, i filamenti di DNA possono essere rimossi dalla cella frigorifera e le loro informazioni decodificate utilizzando una macchina per il sequenziamento del DNA e la sequenza del DNA viene infine tradotta nuovamente nel formato informatico binario di 1 e 0 per essere letta sul computer.
è stato mostrato1 che solo pochi grammi di DNA possono immagazzinare quintilioni di byte di dati e mantenerli intatti fino a 2000 anni. Tuttavia, questa semplice comprensione ha dovuto affrontare alcune sfide. In primo luogo, è piuttosto costoso e anche dolorosamente lento scrivere dati sul DNA, ovvero l'effettiva conversione degli 0 e degli 1 nelle basi del DNA (A, T, C, G). In secondo luogo, una volta che i dati sono stati “scritti” sul DNA, è difficile trovare e recuperare i file e richiede una tecnica chiamata DNA sequenziamento: processo per determinare l'ordine preciso delle basi all'interno di a DNA molecola - dopodiché i dati vengono decodificati in 0 e 1.
Un recente studio2 dagli scienziati di Microsoft Research e dell'Università di Washington hanno ottenuto un "accesso casuale" alla conservazione del DNA. L'aspetto dell'"accesso casuale" è molto importante perché significa che le informazioni possono essere trasferite da o verso un luogo (generalmente una memoria) in cui ogni posizione, indipendentemente da dove nella sequenza, è accessibile direttamente. Utilizzando questa tecnica di accesso casuale, i file possono essere recuperati dall'archiviazione del DNA in modo selettivo rispetto a prima, quando tale recupero richiedeva la necessità di sequenziare e decodificare un intero set di dati del DNA per trovare ed estrarre i pochi file desiderati. L'importanza dell'"accesso casuale" è ulteriormente elevata quando la quantità di dati aumenta e diventa enorme in quanto riduce la quantità di sequenziamento che deve essere eseguita. È la prima volta che l'accesso casuale è stato mostrato su una scala così ampia. I ricercatori hanno anche sviluppato un algoritmo per decodificare e ripristinare i dati in modo più efficiente con una maggiore tolleranza agli errori dei dati, rendendo anche la procedura di sequenziamento più veloce. In questo studio sono stati codificati più di 13 milioni di oligonucleotidi di DNA sintetico, dati di 200 MB costituiti da 35 file (contenenti video, audio, immagini e testo) di dimensioni comprese tra 29 KB e 44 MB. Questi file sono stati recuperati singolarmente senza errori. Inoltre, gli autori hanno ideato nuovi algoritmi che sono più robusti e tolleranti agli errori nella scrittura e nella lettura delle sequenze di DNA. Questo studio pubblicato in Nature Biotechnology in un importante progresso che mostra un sistema praticabile su larga scala per la conservazione e il recupero del DNA.
Il sistema di archiviazione del DNA sembra molto interessante perché ha un'elevata densità di dati, un'elevata stabilità ed è facile da archiviare, ma ovviamente deve affrontare molte sfide prima di poter essere adottato universalmente. Pochi fattori sono la decodifica del DNA (il sequenziamento) e la sua sintesi, che richiede molto tempo e lavoro DNA. La tecnica richiede maggiore precisione e una copertura più ampia. Anche se sono stati fatti progressi in questo settore, il formato esatto in cui i dati verranno archiviati a lungo termine DNA è ancora in evoluzione. Microsoft ha promesso di migliorare la produzione di DNA sintetico e di affrontare le sfide per progettare un sistema pienamente operativo DNA sistema di stoccaggio entro il 2020.
***
{Puoi leggere il documento di ricerca originale facendo clic sul collegamento DOI indicato di seguito nell'elenco delle fonti citate}
Fonte (s)
1. Erlich Y e Zielinski D 2017. DNA Fountain consente un'architettura di archiviazione robusta ed efficiente. Scienza. 355(6328). https://doi.org/10.1126/science.aaj2038
2. Organick L et al. 2018. Accesso casuale all'archiviazione di dati del DNA su larga scala. Biotecnologie naturali. 36. https://doi.org/10.1038/nbt.4079