Long-Read Sequenzen erleichtern erheblich die Montage komplexer Genome und Charakterisierung von strukturellen Variation. Wir beschreiben eine Methode um ultra-lange Sequenzen durch Sequenzierung Nanopore-basierte Plattformen zu generieren. Das Konzept nimmt eine optimierte DNA-Extraktion, gefolgt von modifizierten Bibliothek Vorbereitungen, Hunderte von Kilobase liest mit moderaten Abdeckung aus menschlichen Zellen zu generieren.
Dritter Generation bieten Einzelmolekül-DNA-Sequenzierung Technologien deutlich mehr lesen Länge, die die Montage von komplexen Genomen und Analyse von komplexen strukturellen Varianten erleichtern können. Nanopore Plattformen führen Einzelmolekül-Sequenzierung durch direkte Messung der aktuellen Veränderungen vermittelt durch DNA-Passage durch die Poren und können Hunderte von Kilobase (kb) liest mit minimalen Investitionskosten zu generieren. Diese Plattform wurde von vielen Forschern für eine Vielzahl von Anwendungen übernommen. Längere Sequenzierung lesen Sie Längen zu erreichen ist der kritischste Faktor, den Wert der Nanopore Sequenzierung Plattformen zu nutzen. Um ultralangen liest zu generieren, ist besondere Aufmerksamkeit erforderlich, um DNA-Brüche zu vermeiden und Effizienz um produktive Sequenzierung Vorlagen zu erzeugen. Hier bieten wir das ausführliche Protokoll der ultra-lange DNA-Sequenzierung einschließlich hohes Molekulargewicht (HMW) DNA-Extraktion aus frischen oder gefrorenen Zellen, Bibliotheksbau durch mechanische Scherung oder Transposase Fragmentierung und Sequenzierung auf einem Nanopore Gerät. Von 20-25 µg HMW DNA die Methode erreichen N50 lesen Länge von 50-70 kb mit mechanischen Scheren und N50 von 90-100 kb Länge mit Transposase lesen vermittelt Fragmentierung. Das Protokoll kann auf aus Säugetierzellen extrahierte DNA Sequenzierung des gesamten Genoms für den Nachweis von strukturellen Varianten und Genom Montage durchführen angewendet werden. Weitere Verbesserungen auf der DNA-Extraktion und enzymatischen Reaktionen weiter lesen Sie Länge zu erhöhen und ihre Nützlichkeit zu erweitern.
Im letzten Jahrzehnt haben massiv parallel und hochgenaue Hochdurchsatz-zweite Generation Sequenziertechnologien eine Explosion von biomedizinischen Entdeckung und technologische Innovation1,2,3. Trotz der technischen Fortschritte die kurze lesenden Daten generiert durch die zweite Generation-Plattformen sind unwirksam bei der Lösung von komplexen genomische Regionen und sind begrenzt bei der Erkennung von genomischen strukturelle Varianten (SVs), die beim Menschen eine wichtige Rolle spielen Evolution und Krankheiten4,5. Darüber hinaus kurze gelesene Daten nicht wiederholen Variation lösen und sind ungeeignet für anspruchsvolle Haplotyp Ausstieg von genetischen Varianten6.
Jüngste Fortschritte in Einzelmolekül-Sequenzierung bietet deutlich mehr lesen Länge, die die Aufdeckung der das gesamte Spektrum der SVs7,8,9und bietet genaue und vollständige Montage des Komplexes zu erleichtern, können mikrobielle und Säugetier-Genome6,10. Die Nanopore-Plattform führt Einzelmolekül-Sequenzierung durch direkte Messung der aktuellen Veränderungen vermittelt durch DNA-Passage durch die Poren11,12,13. Im Gegensatz zu bestehenden DNA-Sequenzierung Chemie, erzeugen Nanopore Sequenzierung langer (zig Tausende von Kilobases) liest in Echtzeit ohne auf Polymerase Kinetik oder künstliche Verstärkung des DNA-Probe. Daher lange lesende Nanopore Sequenzierung (NLR-Seq) hält große Verheißung für die Erzeugung von ultra-lange lesen Sie Längen weit über 100 kb, die stark genomische und biomedizinische Analysen14fördern würde, insbesondere bei geringer Komplexität oder Repeat-reich Regionen der Genome15.
Die Besonderheit der Nanopore Sequenzierung ist, sein Potenzial zu lange ohne eine theoretische Längenbegrenzung liest. Deshalb lesen Sie Länge abhängig von der physikalischen Länge der DNA durch die DNA-Integrität und Sequenzierung Vorlage Qualität direkt betroffen ist. Darüber hinaus ist je nach Ausmaß der Manipulation und die Anzahl der Schritte, wie Pipettieren Kräfte und Extraktionsbedingungen, die Qualität der DNA sehr variabel. Daher ist es schwierig für einen zu langen liest nur mittels Standardprotokollen der DNA-Extraktion und des Herstellers mitgelieferte Bibliothek Bauweisen. Zu diesem Zweck haben wir eine robuste Methode zur Erzeugung ultralangen lesen (Hunderte von Kilobases) Sequenzierungsdaten geernteten Zelle Pellets ab. Wir haben mehrere Verbesserungen bei den DNA-Extraktion und Bibliothek Vorbereitung angenommen. Wir optimiert das Protokoll um unnötige Verfahren auszuschließen, die DNA-Schädigung und Schäden verursachen. Dieses Protokoll besteht aus hochmolekularen (HMW) DNA-Extraktion, ultra-lange DNA Bibliotheksbau und Sequenzierung auf einer Nanopore Plattform. Für ein gut ausgebildeter Molekularbiologe dauert es in der Regel 6 h aus Zelle Ernte bis zur Fertigstellung der HMW DNA-Extraktion, 90 min. oder 8 h für Bibliotheksbau je nach der Schur Methode und bis zu weitere 48 h für die DNA-Sequenzierung. Die Verwendung des Protokolls wird die Genomik Gemeinschaft zu einem besseren Verständnis des Genoms Komplexität und neue Einblicke in Genom Variation im menschlichen Krankheiten stärken.
Im Prinzip ist Nanopore Sequenzierung 100 kb zu Megabase liest in Länge11,12,13zu generieren. Vier wichtige Faktoren wirkt sich die Leistung der Sequenzierung ausführen und Daten: 1) aktive Pore Zahlen und die Aktivität der Poren; (2) motor-Protein, das die Geschwindigkeit der DNA durch die Nanopore steuert; (3) DNA-Vorlage (Länge, Reinheit, Qualität, Masse); (4) Sequenzierung Adapter Ligatur Effizienz, die die nutzbare DNA aus der Eingabe Probe bestimmt. Die ersten beiden Faktoren hängen von der Version von der Messzelle und das Sequencing Kit des Herstellers. Die zweiten zwei Faktoren sind wichtige Schritte in diesem Protokoll (HMW DNA-Extraktion, Scheren und Ligatur).
Dieses Protokoll erfordert Geduld und Übung. Die Qualität der HMW DNA ist wichtig für ultra-lange DNA-Bibliotheken-6. Das Protokoll beginnt mit Zellen mit hoher Rentabilität (> 85 % lebensfähigen Zelle bevorzugt), Begrenzung der degradierten DNS aus abgestorbenen Zellen. Harten Prozess, der Schäden an der DNA (z. B. stark stören, schütteln, Wirbel, mehrere pipettieren, wiederholtes Einfrieren und Auftauen) vorstellen kann, sollte vermieden werden. Bei der Gestaltung des Protokolls lassen wir Pipettieren in den gesamten Prozess der DNA-Extraktion. Große Bohrung Tipps müssen verwendet werden, wenn Pipettieren nach dem mechanischen Scheren während Bibliotheksbau und Sequenzierung erforderlich ist. Da die Nanoporen empfindlich auf Chemikalien in die Kammer Puffer12sind, sollte es möglichst wenige verbleibende Verunreinigungen (z.B. Waschmittel, Tenside, Phenol, Ethanol, Proteine RNAs, etc.) wie möglich in der DNA. Angesichts der Länge und der Ertrag zeigt die Phenol-Extraktions-Verfahren die beste und am meisten reproduzierbare Ergebnisse im Vergleich mit mehreren verschiedenen Extraktionsmethoden bisher getestet.
Trotz der Fähigkeit dieses Protokolls, lange lesende Sequenzen produzieren bleiben noch mehrere Einschränkungen. Zunächst wurde dieses Protokoll optimiert, basierend auf dem Nanopore Sequenzierung Gerät zum Zeitpunkt der Veröffentlichung verfügbar; so, es beschränkt sich auf die selektive Nanopore-basierte Sequenzierung Chemie und suboptimal, wenn in anderen Gerätetypen lange lesende Sequenzierung durchgeführt werden konnte. Zweitens ist das Ergebnis stark abhängig von der Qualität der DNA extrahiert aus dem Ausgangsmaterial (Gewebe oder Zellen). Lesen Sie Länge wird gefährdet, wenn die Start DNA bereits beeinträchtigt oder beschädigt wird. Drittens, obwohl mehrere QC Schritte in das Protokoll um die DNA-Qualität aufgenommen werden, den endgültigen Ertrag und die Länge des lautet können durch die Flusszelle beeinflusst werden und pore-Aktivität, die Variable in diesem frühen Stadium der Nanopore Sequenzierung Plattform sein könnte Entwicklung.
Das Protokoll beschrieben verwendet hier menschliche Aussetzung Linie Zellproben für DNA-Extraktion. Wir haben die Weitergabe in Nadeln, Scheren, das Verhältnis von HMW DNA zu Transposase und die Ligatur-Zeit, um die beschriebenen Ergebnisse produzieren optimiert. Das Protokoll kann auf vier verschiedene Arten erweitert werden. Erstens können Benutzer mit anderen kultivierten Säugerzellen und unterschiedliche Anzahl von Zellen, Geweben, klinischen Proben oder andere Organismen beginnen. Eine weitere Optimierung auf Lyse Inkubationszeit, Reaktionsvolumen und Zentrifugation wird benötigt. Zweitens ist es schwer vorherzusagen, die Zielgröße für ultra-lange lesen Sie Sequenzierung. Wenn die lesen Sie Längen kürzer als erwartet sind, können die Benutzer stellen Sie die Zeiten vorbei in die mechanische Scheren-basierte Methode oder ändern das Verhältnis der HMW DNA in Transposase in die Transposase Fragmentierung-basierte Methode. Bindung und Elution länger während der Bereinigung Schritte sind hilfreich, weil die HMW DNA sehr zähflüssig ist. Drittens kann man mit verschiedenen Nanopore Sequenzierung Geräte, die Höhe und das Volumen der DNA die Kriterien des Sequenzers einstellen. Viertens wird nur die DNA Sequenzierung Adapter ligiert sequenziert werden. Zur Unterbindung Effizienz weiter zu steigern, kann man versuchen, die Adapter und Ligase Konzentrationen zu titrieren. Modifizierte Ligatur Zeit und molekulare crowding Mittel wie PEG18 können in Zukunft angewendet werden. Die ultra-lange DNA-Sequenzierung Protokoll kombiniert mit CRISPR19,20 kann ein effektives Ziel Bereicherung Sequenzierung anbieten.
The authors have nothing to disclose.
Die Autoren danken für ihre Bemerkungen auf die Handschrift Y. Zhu. Forschung, die in dieser Publikation berichtet wurde teilweise durch das National Cancer Institute der National Institutes of Health unter Preis Anzahl P30CA034196 unterstützt. Der Inhalt ist ausschließlich in der Verantwortung der Autoren und nicht unbedingt die offizielle Meinung der National Institutes of Health.
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |