Long-lire des séquences facilitent considérablement l’assemblage des génomes complexes et caractérisation de variation structurale. Les auteurs décrivent une méthode pour générer des séquences ultra longues de plateformes de séquençage nanopore-basé. L’approche adopte une extraction d’ADN optimisée suivie de préparations de bibliothèque modifiée pour générer des centaines de kilobases se lit avec une couverture modérée à partir des cellules humaines.
Troisième génération de technologies de séquençage de l’ADN molécule unique offrent nettement plus longtemps lire longueur qui peut faciliter le montage des génomes complexes et l’analyse des variantes structurales complexes. Plates-formes Nanopore effectuent seule molécule séquençage en mesurant directement les changements actuels médiées par le passage de l’ADN à travers les pores et peuvent générer des centaines de lectures kilobases (kb) avec le coût en capital minime. Cette plate-forme a été adoptée par de nombreux chercheurs pour une variété d’applications. Réalisation de plus longues longueurs de lecture de séquençage est le facteur le plus critique de tirer parti de la valeur des plateformes de séquençage nanopore. Pour générer des lectures ultra longues, une attention particulière est nécessaire pour éviter les ruptures de l’ADN et de gagner en efficacité pour générer des modèles productifs de séquençage. Ici, nous fournissons le protocole détaillé de séquençage de l’ADN ultra long dont le poids moléculaire élevé (HMW) extraction de l’ADN des cellules fraîches ou congelées, construction de la bibliothèque de cisaillement mécanique ou une fragmentation de la transposase et le séquençage sur un périphérique nanopore. De 20 à 25 µg d’ADN HMW, la méthode peut atteindre N50 lire longueur de 50 à 70 KO avec le cisaillement mécanique et N50 de 90-100 kb lire la longueur avec la transposase médiée par fragmentation. Le protocole peut être appliqué à l’ADN extrait des cellules de mammifères pour effectuer le séquençage du génome entier pour la détection des variantes structurelles et assemblage de génome. Des améliorations supplémentaires sur l’extraction de l’ADN et les réactions enzymatiques vont encore augmenter la durée de lecture et élargir son utilité.
Ces dix dernières années, massivement parallèle et technologies de haute précision deuxième génération haut débit séquençage ont conduit à une explosion de découverte biomédicale et de l’innovation technologique1,2,3. Malgré les progrès techniques, le court-lecture de données générées par les plateformes de deuxième génération est inefficaces à résoudre les régions génomiques complexes et est limités dans la détection des variants structurels génomiques (SVs), qui jouent un rôle important dans l’homme Evolution et maladies4,5. En outre, court-lecture de données est incapables de résoudre la répétition de variation et ne conviennent pas pour les hautes haplotype progressive des variants génétiques6.
Les progrès récents dans le séquençage de la molécule unique offre significativement plus longue lire la longueur, ce qui peut faciliter la détection de l’éventail complet des SVs7,8,9et offres Assemblée précise et complète du complexe génomes microbiens et mammifères6,10. La plate-forme nanopore effectue seule molécule séquençage en mesurant directement les changements actuels médiées par le passage de l’ADN dans les pores de12,11,13. Contrairement à toute chimie de séquençage ADN existante, nanopore séquençage peut générer long (des dizaines de milliers de kilobases) se lit comme suit en temps réel sans avoir à compter sur la cinétique de la polymérisation ou artificielle l’amplification de l’échantillon d’ADN. Par conséquent, nanopore long lire séquençage (NLR-seq) détient très prometteur pour la génération ultra grandes longueurs de lecture bien au-delà de 100 Ko, ce qui ferait progresser considérablement les analyses génomiques et biomédicales14, particulièrement dans la faible complexité ou riches en répétition régions des génomes15.
La caractéristique unique de séquençage nanopore est sa capacité à générer des longues lectures sans limitation de durée théorique. Par conséquent, la longueur de lecture dépend de la longueur physique de l’ADN qui est directement touchée par la qualité de modèle intégrité et séquençage de l’ADN. En outre, selon l’ampleur de la manipulation et le nombre d’étapes impliquées, comme forces de pipetage et les conditions d’extraction, la qualité de l’ADN est très variable. Il est donc difficile pour que l’on puisse céder lectures longues en appliquant simplement les protocoles d’extraction d’ADN standards et des méthodes de construction de la bibliothèque fournie du fabricant. À cette fin, nous avons développé une solide méthode permettant de générer ultra-longue lire (des centaines de kilobases) données de séquençage à partir de granulés de cellules récoltées. Nous avons adopté plusieurs améliorations dans les procédures de préparation ADN extraction et bibliothèque. Nous avons simplifié le protocole afin d’exclure des procédures inutiles qui causent des dommages-intérêts et la dégradation de l’ADN. Ce protocole est composé de poids moléculaire élevé (HMW) extraction d’ADN, ultra longue construction de bibliothèque d’ADN et le séquençage sur une plate-forme nanopore. Pour un biologiste moléculaire bien formé, cela prend généralement de 6 h de cellule récolte jusqu’à l’achèvement de HMW DNA extraction, 90 min ou 8 h pour la construction de la bibliothèque selon la méthode de cisaillement et jusqu’à une autre 48 h pour le séquençage de l’ADN. L’utilisation du protocole permet à la communauté de la génomique afin d’améliorer notre compréhension de la complexité du génome et avoir un nouvel aperçu variation génomique dans les maladies humaines.
En principe, nanopore séquençage est capable de produire 100 Ko de megabase lectures en longueur11,12,13. Quatre principaux facteurs affectera les performances de la qualité de course et les données de séquençage : 1) nombre de pores actifs et l’activité des pores ; 2) protéine moteur, qui contrôle la vitesse de l’ADN en passant par le nanopore ; 3) modèle ADN (longueur, pureté, qualité, masse) ; 4) séquençage adaptateur ligature efficacité, ce qui détermine l’ADN utilisable de l’échantillon d’entrée. Les deux premiers facteurs dépendent de la version de la cellule d’écoulement et le kit de séquençage fournies par le fabricant. Les deux facteurs sont des étapes cruciales dans le présent protocole (extraction d’ADN de HMW, cisaillement et ligature).
Ce protocole requiert patience et pratique. La qualité de l’ADN de HMW est importante pour les bibliothèques6de l’ADN ultra longue. Le protocole commence par cellules recueillies avec viabilité élevée (> 85 % des cellules viables préféré), limitant l’ADN dégradé des cellules mortes. Tout processus rigoureux qui peuvent introduire des dommages à l’ADN (par exemple, fort dérangeant, secouant, vortex, multiples pipetage, répétées gel et dégel) doit être évitée. Dans la conception du protocole, nous omettons pipetage dans l’ensemble du processus d’extraction de l’ADN. Conseils d’alésage large doivent être utilisées lorsque le pipetage est nécessaire après le cisaillement mécanique pendant la construction de la bibliothèque et le séquençage. Comme les nanopores sont sensibles aux chimies dans le tampon de chambre12, il doit être aussi peu contaminants résiduels (par exemple, les détergents, agents tensio-actifs, phénol, éthanol, protéines, ARN, etc.) que possible dans l’ADN. Compte tenu de la longueur et le rendement, la méthode d’extraction de phénol montre des résultats meilleurs et plus reproductibles comparés avec plusieurs différentes méthodes d’extraction testées jusqu’à présent.
Malgré la capacité du présent protocole pour produire des séquences de lecture longue, plusieurs limitations subsistent. Tout d’abord, ce protocole a été optimisé basé sur l’appareil de séquençage nanopore disponible au moment de la publication ; ainsi, il est limité à la chimie sélective axée sur les nanopore séquençage et pourrait être sous-optimal lorsque effectuées dans d’autres types d’appareils de séquençage long à lire. En second lieu, le résultat est fortement tributaire de la qualité de l’ADN extrait de la matière (tissus ou cellules). Longueur de lecture sera compromise si l’ADN de départ est déjà dégradé ou endommagé. Troisièmement, bien que plusieurs étapes QC sont incorporés dans le protocole pour vérifier la qualité de l’ADN, le rendement final et la longueur de la lecture peuvent être affectées par la cellule de flux et activité, ce qui pourrait être variable à ce stade précoce de la plate-forme de séquençage nanopore des pores développement.
Le protocole décrit ici utilise des échantillons de ligne de cellules humaines de suspension pour l’extraction de l’ADN. Nous avons optimisé les temps de passage en aiguille de cisaillement, le ratio d’ADN HMW transposase et le moment de ligature pour produire les résultats décrits. Le protocole peut être augmenté de quatre façons. Tout d’abord, les utilisateurs peuvent démarrer avec d’autres cellules mammifères cultivées et avec des montants différents de cellules, tissus, échantillons cliniques ou d’autres organismes. Optimisation sur les temps d’incubation de lyse, volume réactionnel et centrifugation est nécessaires. Deuxièmement, il est difficile de prédire la taille cible pour le séquençage ultra longue lecture. Si la longueur de lecture est plus courte que prévu, les utilisateurs peuvent ajuster les temps de passage dans la méthode cisaillement mécanique ou changer le ratio de l’ADN de HMW à transposase dans la méthode axée sur la fragmentation de transposase. Liaison et élution longtemps durant les étapes de nettoyage sont utiles parce que l’ADN HMW est très visqueux. Troisièmement, avec nanopore différents appareils de séquençage, on peut ajuster la quantité et le volume de l’ADN pour remplir les critères du séquenceur. Quatrièmement, seulement ces ADN ligaturé aux adaptateurs de séquençage va être séquencé. Afin d’améliorer l’efficacité de la ligature, on peut essayer de titrer les concentrations de l’adaptateur et la ligase. Ligature des mis à jour le temps et les agents encombrement moléculaires comme PEG18 peuvent être appliquées à l’avenir. Le protocole de séquençage de l’ADN ultra long combiné avec CRISPR19,20 peut offrir un outil efficace pour l’ordonnancement de l’enrichissement de cible.
The authors have nothing to disclose.
Les auteurs remercient Y. Zhu pour ses commentaires sur le manuscrit. Recherche rapporté dans cette publication a été partiellement financée par le National Cancer Institute de la National Institutes of Health, sous attribution numéro P30CA034196. Le contenu est la seule responsabilité des auteurs et ne représente pas nécessairement l’opinion officielle de la National Institutes of Health.
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |