Lange-lezen sequenties vergemakkelijken aanzienlijk de assemblage van complexe genomen en karakterisering van structurele variatie. Beschrijven we een methode voor het genereren van ultra lange reeksen door sequentiebepaling nanopore gebaseerde platformen. De benadering neemt een geoptimaliseerde DNA-extractie, gevolgd door de gewijzigde bibliotheek preparaten voor het genereren van honderden kilobase leest met gematigde dekking van menselijke cellen.
Derde generatie single-molecuul DNA sequencing technologieën aanzienlijk langer bieden Lees lengte die de vergadering van complexe genomen en analyse van complexe structurele varianten kan vergemakkelijken. Nanopore platforms uitvoeren van single-molecuul rangschikken door direct het meten van de huidige veranderingen gemedieerd door DNA passage door de poriën en honderden kilobase (kb) leest met minimale kapitaal kosten kunnen genereren. Dit platform is goedgekeurd door vele onderzoekers voor een verscheidenheid van toepassingen. Het bereiken van langere sequencing Lees lengtes is de meest kritische factor om de invloed van de waarde van de nanopore rangschikking platformen. Voor het genereren van ultra lange leest, is speciale aandacht vereist DNA-breuken te vermijden en zo de efficiëntie voor het genereren van productieve sequencing sjablonen. Wij bieden hier de gedetailleerde protocol van ultra lange DNA-sequencing met inbegrip van ultrahoog moleculair gewicht (HMW) DNA-extractie uit vers of bevroren cellen, bibliotheek bouw door mechanische schuintrekken of transposase fragmentatie, en het rangschikken op een nanopore apparaat. Van 20-25 µg HMW DNA, de methode N50 lezen lengte van 50-70 kb met mechanische Schuintrekken kunt bereiken en N50 van 90-100 kb Lees lengte met transposase gemedieerde fragmentatie. Het protocol kan worden toegepast op DNA van zoogdiercellen geëxtraheerd uit te voeren gehele genoom sequencing voor de detectie van structurele varianten en genoom vergadering. Aanvullende verbeteringen van de DNA-extractie en enzymatische reacties verlengt de Lees verder en het nut ervan uit te breiden.
In het afgelopen decennium, massaal parallelle en zeer nauwkeurige tweede generatie high-throughput sequencing technologieën hebben gereden een explosie van biomedische ontdekking en technologische innovatie1,2,3. Ondanks de technische vooruitgang, de gegevens van de korte-lezen gegenereerd door de tweede generatie platforms zijn niet effectief bij het oplossen van complexe genomic regio’s en zijn beperkt in de opsporing van genomic structurele varianten (SVs), die een belangrijke rol in de mens spelen evolutie en ziekten4,5. Bovendien, korte-lezen gegevens zijn niet in staat om op te lossen herhaling variatie en zijn ongeschikt voor comforthotel haplotype fasering van genetische varianten6.
Recente vooruitgang in single-molecuul sequencing biedt aanzienlijk meer tijd lezen lengte, die de detectie van het volledige spectrum van SVs7,8,9, en biedt nauwkeurige en volledige vergadering van complex vergemakkelijken kan microbiële en zoogdieren genoom6,10. Het nanopore platform voert één-molecuul rangschikken door direct het meten van de huidige veranderingen gemedieerd door DNA passage door de poriën11,12,13. In tegenstelling tot elke bestaande DNA sequencing chemie, nanopore sequencing kunt genereren lange (tientallen tot duizenden kilobases) leest in real-time zonder zich het baseren op de kinetiek van de polymerase of kunstmatige versterking van het DNA-monster. Daarom, nanopore lang lezen sequencing (NLR-seq) houdt grote belofte voor het genereren van ultra lange Lees lengtes dan 100 kb, die zou verder sterk genomic en biomedische analyses14, met name in het lage-complexiteit of herhalen-rich regio’s van het genoom15.
De unieke eigenschap van de nanopore rangschikking is het potentieel voor het genereren van lange leest zonder een theoretische lengte beperking. Dus is de Lees lengte afhankelijk van de fysieke lengte van DNA die wordt rechtstreeks beïnvloed door de DNA-integriteit en de sequencing sjabloon kwaliteit. Bovendien, afhankelijk van de mate van manipulatie en het aantal stappen, zoals pipetting krachten en extractie voorwaarden, de kwaliteit van het DNA is zeer variabel. Daarom is het uitdagende voor een te lange leest door alleen toe te passen de standaard protocollen van de DNA-extractie en fabrikant meegeleverde bibliotheek bouwwijze opleveren. Richting van dit doel hebben we een robuuste methode voor het genereren van ultra lange rangschikken gegevens vanaf geoogste cel pellets (honderden kilobases) lezen. Wij hebben meerdere verbeteringen in de DNA-extractie en bibliotheek voorbereiding procedures aangenomen. Wij stroomlijnen het protocol als u wilt uitsluiten van geen onnodige procedures die de aantasting van het DNA en schade veroorzaken. Dit protocol is samengesteld uit hoge molecuulgewicht (HMW) DNA-extractie, ultra lange DNA bibliotheek constructie en rangschikken op een nanopore platform. Voor een goed opgeleide moleculair bioloog, meestal duurt het 6 h uit cel oogsten tot de voltooiing van HMW DNA-extractie, 90 min of 8 h voor bibliotheek bouw afhankelijk van de shearing methode, en tot een verdere 48u voor DNA sequencing. Het gebruik van het protocol zal de emancipatie van de Gemeenschap van de genomica te verbeteren van ons begrip van de complexiteit van het genoom en nieuw inzicht in de variatie van het genoom in ziekten bij de mens.
In principe is nanopore rangschikken kundig voor genereren van 100 kb aan megabase leest in lengte11,12,13. Vier belangrijke factoren zullen de prestaties van de sequencing uitvoeren en gegevens kwaliteit beïnvloeden: 1) actieve porie nummers en de activiteit van de poriën; 2) motor-eiwit, dat regelt de snelheid van DNA door de nanopore; 3) DNA sjabloon (lengte, zuiverheid, kwaliteit, massa); 4) sequencing adapter afbinding efficiëntie, die bepalend is voor de bruikbare DNA uit de input monster. De eerste twee factoren, is afhankelijk van de versie van de cel van de stroom en de sequencing kit geleverd door de fabrikant. De laatste twee factoren zijn kritische stappen in dit protocol (HMW DNA-extractie, schuintrekken en afbinding).
Dit protocol vereist geduld en oefening. De kwaliteit van HMW DNA is belangrijk voor ultra lange DNA bibliotheken6. Het protocol start met cellen verzameld met hoge levensvatbaarheid (> 85% levensvatbare cellen de voorkeur), beperking van de aangetaste DNA uit dode cellen. Iedere harde methode die schade met het DNA kennismaken kan (bijvoorbeeld sterk verstoren, schudden, vortex, meerdere pipetting, herhaalde bevriezen en ontdooien) moet worden vermeden. In het ontwerp van het protocol weglaten we pipetteren in het gehele proces van de DNA-extractie. Breed boring uiteinden moeten worden gebruikt wanneer pipetteren is nodig na de mechanische scheren tijdens de bouw van de bibliotheek en de sequencing. Als de nanopores gevoelig voor de chemicaliën in de kamer buffer12 zijn, moet er zo weinig resterende verontreinigingen (bijvoorbeeld de detergentia, oppervlakteactieve stoffen, fenol, ethanol, eiwitten RNAs, enz) mogelijk in het DNA. Gezien de lengte en de opbrengst toont de fenol-extractiemethode de resultaten van het beste en meest reproduceerbare vergeleken met meerdere verschillende extractiemethoden getest tot nu toe.
Ondanks het vermogen van dit protocol te produceren van lange-lezen sequenties, blijven verschillende beperkingen. Ten eerste, dit protocol werd geoptimaliseerd op basis van het nanopore sequencing apparaat beschikbaar ten tijde van publicatie; Dus, het is beperkt tot de sequentiebepaling van selectieve nanopore gebaseerde chemie en zou suboptimaal wanneer uitgevoerd in andere soorten lange-lezen sequencing apparaten. Ten tweede, het resultaat is sterk afhankelijk van de kwaliteit van het DNA geëxtraheerd uit het uitgangsmateriaal (weefsels of cellen). Lees lengte zal worden aangetast als de startende DNA is al gedegradeerd of beschadigd. Ten derde, hoewel meerdere QC stappen zijn opgenomen in het protocol bij het controleren van de kwaliteit van DNA, de definitieve opbrengst en de lengte van de leest kunnen worden beïnvloed door de stroom-cel en poriën activiteit, die zou variabele in dit vroege stadium van nanopore sequencing platform ontwikkeling.
Het protocol beschreven gebruikt hier menselijke schorsing celsteekproeven lijn voor DNA-extractie. We hebben de passerende times in naald schuintrekken, de HMW DNA in verhouding tot de transposase en de tijd van de afbinding tot beschreven resultaten geoptimaliseerd. Het protocol kan op vier manieren worden uitgebreid. Eerst, kunnen de gebruikers beginnen met andere gekweekte zoogdiercellen en met verschillende hoeveelheid cellen, weefsels, klinische monsters of andere organismen. Verdere optimalisatie op lysis van de incubatietijd, reactie volume en centrifugeren nodig zullen zijn. Ten tweede, het is moeilijk te voorspellen het doelformaat voor het ultra lange Lees rangschikken. Als de Lees lengtes korter zijn dan verwacht, kunnen de gebruikers aanpassen van de passerende tijden in de mechanische schuintrekken gebaseerde methode of de verhouding van het DNA HMW omzetten in transposase in de transposase fragmentatie gebaseerde methode. Langere binding en elutie tijd tijdens cleanup stappen zijn handig omdat het HMW DNA is zeer viskeuze. Ten derde, met verschillende nanopore sequencing apparaten, kunt een aanpassen de hoeveelheid en het volume van het DNA om te voldoen aan de criteria van de sequencer. Ten vierde, zal alleen deze DNA afgebonden aan sequencing adapters worden sequenced. Om afbinding efficiëntie verder te verbeteren, kan men proberen om te Titreer de adapter en ligase concentraties. Gemodificeerde afbinding tijd en moleculaire omvangrijke agenten zoals PEG18 kunnen in de toekomst worden toegepast. Het ultra lange DNA sequencing protocol gecombineerd met CRISPR19,20 kan bieden een doeltreffend instrument voor het doel verrijking rangschikken.
The authors have nothing to disclose.
Y. Zhu bedanken de auteurs voor haar opmerkingen over het manuscript. Onderzoek gemeld in deze publicatie werd gedeeltelijk ondersteund door de National Cancer Institute van de National Institutes of Health onder Award nummer P30CA034196. De inhoud is uitsluitend de verantwoordelijkheid van de auteurs en vertegenwoordigt niet noodzakelijk de officiële standpunten van de National Institutes of Health.
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |