Il completo umano genoma è stata completata la sequenza dei due cromosomi X e degli autosomi della linea cellulare derivata dal tessuto femminile. Ciò include l'8% del genoma sequenza che mancava nella bozza originale pubblicata nel 2001.
Il completo umano genoma sequence of the entire 3.055 billion base pairs has been revealed by the Telomere-to-Telomere (T2T) Consortium. This represents the largest improvement to the umano riferimento genoma released in 2001 by Celera Genomics and the International Human Genoma Consorzio di sequenziamento. Quello genoma sequence covered most of the euchromatic regions while either leaving out the heterochromatin regions or erroneous representation. These regions comprise 8% of the umano genoma questo è stato finalmente rivelato. La nuova referenza T2T-CHM131 include la sequenza completa per tutti i 22 autosomi più il cromosoma X. Questa nuova sequenza di riferimento ha anche corretto numerosi errori e ha aggiunto circa 200 milioni di bp di nuove sequenze contenenti 2,226 copie di geni, di cui 115 si prevede che codificano proteine.
L'attuale genoma di riferimento GRCh38.p13 è il risultato di due importanti aggiornamenti, uno nel 2013 e l'altro nel 2019 sulla sequenza del genoma di Celera del 2001. Tuttavia, aveva ancora 151 milioni di paia di basi di sequenza sconosciuta distribuite in tutto il pianeta genoma, comprese le regioni pericentromeriche e subtelomeriche, le duplicazioni, gli array di geni e DNA ribosomiale (rDNA), tutti necessari per i processi cellulari fondamentali. Il nuovo riferimento è stato denominato T2T-CHM13 poiché deriva dal sequenziamento del DNA della linea cellulare CHM13 (Complete Hydatiform Mole) ed è eseguito dal consorzio T2T. La linea cellulare deriva da un uovo fecondato anormale o da una crescita eccessiva di tessuto della placenta in cui la donna sembra essere incinta (falsa gravidanza), quindi la sequenza rappresenta solo i due cromosomi X e gli autosomi della femmina. Sono state utilizzate tecnologie di sequenza multiple come PacBio, Oxford Nanopore, sequenziatori Illumina 100X e 70X, per citarne alcuni. I progressi tecnologici nel sequenziamento hanno portato al sequenziamento del restante 8% come menzionato sopra.
L'unica limitazione della sequenza T2T-CHM13 è la mancanza di un cromosoma Y. Questo sequenziamento è attualmente in corso, utilizzando il DNA della linea cellulare HG002, che ha un 46 (23 paia) con un cariotipo XY. La sequenza verrà quindi assemblata utilizzando gli stessi metodi sviluppati per il genoma omozigote CHM13.
La disponibilità di T2T-CHM13 come nuovo riferimento genoma rappresenta un importante passo avanti che aiuterà a comprendere il ruolo delle regioni dell'eterocromatina e aiuterà a comprendere i suoi effetti sui processi cellulari in modo più dettagliato. Fino al completamento del sequenziamento del cromosoma Y, questo servirà come genoma di riferimento per studi futuri sulla comprensione dei processi e delle funzioni cellulari.
***
Riferimenti
- Nurk S, Koren S, Rhie A, Rautiainen M, Bzikadze A V, Mikheenko A et al. The complete sequence of a umano genome bioRxiv 2021.05.26.445798; DOI: https://doi.org/10.1101/2021.05.26.445798
***