Lungo-ha letto sequenze notevolmente facilitano l’assemblaggio di complessi genomi e caratterizzazione di variazione strutturale. Descriviamo un metodo per generare sequenze ultra-lunghi di piattaforme nanopore di sequenziamento. L’approccio adotta un’estrazione di DNA ottimizzata seguita da preparazioni di libreria modificata per generare centinaia di kilobase letture con moderata copertura da cellule umane.
Terza generazione di tecnologie di sequenziamento del DNA di singola molecola offrono significativamente più leggere lunghezza che possa facilitare l’assemblaggio di complessi genomi e analisi delle varianti strutturali complessi. NanoPore piattaforme eseguire sequenziamento di singola molecola misurando direttamente le modifiche correnti mediate dal passaggio di DNA attraverso i pori e possono generare centinaia di letture kilobasi (kb) con il minimo costo di capitale. Questa piattaforma è stata adottata da molti ricercatori per una varietà di applicazioni. Raggiungimento di lunghezze per saperne di sequenziamento è il fattore più critico di sfruttare il valore di piattaforme di sequenziamento nanopore. Per generare letture ultra-lunghe, particolare attenzione è necessaria per evitare rotture del DNA e guadagnare in efficienza per generare modelli produttivi sequenziamento. Qui, forniamo il protocollo dettagliato di sequenziamento del DNA ultra-lungo compresa l’estrazione di DNA ad alto peso molecolare (HMW) dalle cellule fresche o surgelate, costruzione della libreria di tosatura meccanica o transposase frammentazione e la sequenziazione su un dispositivo nanopore. Da 20-25 µ g di DNA HMW, può raggiungere il metodo N50 leggere lunghezza di 50-70 kb con taglio meccanico e N50 di 90-100 kb leggere lunghezza con transposase mediata frammentazione. Il protocollo può essere applicato a DNA Estratto da cellule di mammifero per eseguire il sequenziamento dell’intero genoma per il rilevamento di varianti strutturali e assemblaggio del genoma. Ulteriori miglioramenti sull’estrazione del DNA e reazioni enzimatiche ulteriormente aumentare la lunghezza di lettura ed espandere la sua utilità.
Nell’ultimo decennio, massicciamente parallelo e tecnologie di seconda generazione ad alta velocità altamente accurato sequenziamento hanno guidato un’esplosione di biomedica scoperta e innovazione tecnologica1,2,3. Nonostante i progressi tecnici, i breve-lettura dati generati dalle piattaforme di seconda generazione sono inefficaci nel risolvere complesse regioni genomiche e sono limitati nella rilevazione delle varianti strutturali genomiche (SVs), che svolgono i ruoli importanti nell’uomo evoluzione e malattie4,5. Inoltre, breve-lettura dati sono in grado di risolvere la ripetizione variazione e non sono adatti per esigenti aplotipo scaglionamento delle varianti genetiche6.
Recenti progressi nel sequenziamento di singola molecola offre significativamente più lungo leggere lunghezza, che può facilitare l’individuazione dello spettro completo di SVs7,8,9e offerte accurate e complete di assemblaggio del complesso genomi microbici e mammiferi6,10. La piattaforma nanopore esegue sequenziamento di singola molecola misurando direttamente le modifiche correnti mediate da passaggio di DNA attraverso i pori11,12,13. A differenza di qualsiasi esistente chimica di sequenziamento del DNA, sequenziamento nanopore può generare lunga (decine di migliaia di kilobasi) letture in tempo reale senza fare affidamento sulla cinetica della polimerasi o artificiale amplificazione del campione del DNA. Di conseguenza, nanopore long-lettura sequenziamento (NLR-seq) detiene grande promessa per la generazione di ultra-lunghe lunghezze lettura ben oltre 100 kb, che avrebbe notevolmente progredire analisi genomiche e biomedica14, in particolare nella bassa complessità o ricchi di ripetizione regioni del genoma15.
La caratteristica unica di sequenziamento nanopore è suo potenziale per generare lunga legge senza una limitazione di lunghezza teorica. Pertanto, la lettura lunghezza dipende la lunghezza fisica del DNA che risente direttamente la qualità di modello di integrità e sequenziamento del DNA. Inoltre, a seconda dell’entità della manipolazione e il numero di passaggi, come forze di pipettaggio e condizioni di estrazione, la qualità del DNA è altamente variabile. Di conseguenza, è difficile per uno a cedere lunghe letture applicando solo i protocolli di estrazione del DNA standard e metodi di costruzione di libreria in dotazione dal produttore. A questo scopo abbiamo sviluppato un robusto metodo per generare lungo ultra leggere (centinaia di kilobasi) dati di sequenziamento a partire da palline delle cellule raccolte. Abbiamo adottato diversi miglioramenti nelle procedure di preparazione di DNA estrazione e biblioteca. Abbiamo semplificato il protocollo per escludere le procedure inutili che causano danni e degradazione del DNA. Questo protocollo è composto di alto peso molecolare (HMW) estrazione del DNA, ultra-lunga costruzione della libreria del DNA e l’ordinamento su una piattaforma nanopore. Per un biologo molecolare ben addestrato, che in genere dura 6 ore dalla raccolta al completamento dell’estrazione del DNA HMW, 90 min o 8 h per la costruzione della libreria a seconda del metodo di taglio e fino a un ulteriore 48 h per il sequenziamento del DNA delle cellule. L’uso del protocollo consentirà alla comunità di genomica di migliorare la nostra comprensione della complessità del genoma e una visione nuova variazione del genoma in malattie umane.
In linea di principio, è in grado di generare 100 kb a megabase letture in lunghezza11,12,13nanopore sequenziamento. Quattro principali fattori influirà sulle prestazioni della qualità di esecuzione e i dati di sequenziamento: 1) poro attivo numeri e l’attività dei pori; 2) motore proteina, che controlla la velocità del DNA passando attraverso il nanoporo; 3) modello DNA (lunghezza, purezza, qualità, massa); 4) sequenziamento adattatore legatura efficienza, che determina il DNA utilizzabile dall’esempio di input. I primi due fattori dipendono dalla versione di cella di flusso e il kit di sequenziamento fornito dal produttore. I secondi due fattori sono punti critici in questo protocollo (estrazione del DNA HMW, tosatura e legatura).
Questo protocollo richiede pratica e pazienza. La qualità del DNA HMW è importante per ultra-lungo di librerie di DNA6. Il protocollo inizia con le cellule raccolte con elevata redditività (> 85% di cellule vitali preferita), limitando il DNA degradato dalle cellule morte. Qualsiasi processo difficili che può introdurre danni al DNA (ad es., forte inquietante, agitazione, vortice, più pipettaggio, ripetuto congelamento e scongelamento) dovrebbe essere evitato. Nella progettazione del protocollo, omettiamo di pipettaggio in tutto il processo di estrazione del DNA. Ampio foro suggerimenti devono essere utilizzati quando il pipettaggio è necessario dopo la tosatura meccanica durante la costruzione della libreria e il sequenziamento. Come i nanopori sono sensibili le composizioni chimiche nella camera tampone12, ci dovrebbe essere come pochi residui contaminanti (ad esempio, i detergenti, tensioattivi, fenolo, etanolo, proteine RNA, ecc.) come possibile nel DNA. Considerando la lunghezza e la resa, il metodo di estrazione del fenolo Mostra i risultati migliori e più riproducibili rispetto ai molteplici metodi di estrazione differenti provati finora.
Nonostante la capacità di questo protocollo di produrre sequenze di lungo-ha letto, restano ancora diverse limitazioni. In primo luogo, questo protocollo è stato ottimizzato basato sul dispositivo di sequenziamento nanopore disponibile al momento della pubblicazione; quindi, esso è limitato alla chimica selettiva di sequenziamento nanopore e poteva essere non ottimale quando eseguita in altri tipi di dispositivi di lettura lunga sequenza. In secondo luogo, il risultato è altamente dipendente dalla qualità del DNA estratto dal materiale di partenza (tessuti o cellule). Lunghezza di lettura sarà compromessa se il DNA di partenza è già degradato o danneggiato. In terzo luogo, anche se più passaggi di QC sono incorporati nel protocollo per controllare la qualità del DNA, la resa finale e la lunghezza della legge può essere influenzate da cella di flusso e attività, che potrebbe essere variabile in questa fase iniziale della piattaforma di sequenziamento nanopore del poro sviluppo.
Il protocollo descritto qui utilizza campioni di linea cellulare umana sospensione per estrazione del DNA. Abbiamo ottimizzato i tempi di passaggio nell’ago di tosatura, il rapporto di DNA HMW al transposase ed il tempo di legatura per produrre i risultati descritti. Il protocollo può essere espansa in quattro modi. In primo luogo, gli utenti possono avviare con altre cellule di mammiferi coltivate e con diverse quantità di cellule, tessuti, campioni clinici o altri organismi. Ulteriore ottimizzazione per tempo di incubazione di Lisi, il volume di reazione e centrifugazione sarà necessari. In secondo luogo, è difficile prevedere le dimensioni di destinazione per la sequenza di lettura ultra-lungo. Se le lunghezze di lettura sono più breve del previsto, gli utenti possono regolare i tempi di passaggio nel metodo basato su taglio meccanico o modificare il rapporto del DNA HMW transposase nel metodo basato su frammentazione transposase. Tempo maggiore di associazione e di eluizione durante la procedura di pulizia sono utili perché il DNA HMW è altamente viscoso. In terzo luogo, con dispositivi di sequenziamento nanopore diversi, si può regolare la quantità e il volume del DNA per soddisfare i criteri del sequencer. In quarto luogo, solo quelli DNA legato agli adattatori di sequenziamento sarà sequenziati. Per migliorare ulteriormente l’efficienza di legatura, si può tentare di titolare le concentrazioni di adattatore e ligasi. Tempo di legatura modificate e agenti molecolari affollamento come PEG18 possono essere applicati in futuro. Il protocollo di sequenziamento DNA ultra-lungo combinato con CRISPR19,20 può offrire uno strumento efficace per il sequenziamento di arricchimento di destinazione.
The authors have nothing to disclose.
Gli autori ringraziano Y. Zhu per i suoi commenti sul manoscritto. Ricerca riportata in questa pubblicazione è stata parzialmente sostenuta dal National Cancer Institute del National Institutes of Health, sotto Premio numero P30CA034196. Il contenuto è di esclusiva responsabilità degli autori e non rappresentano necessariamente il punto di vista ufficiale del National Institutes of Health.
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |