Secuencias de largo leer facilitan enormemente el montaje de genomas complejos y la caracterización de la variación estructural. Se describe un método para generar secuencias muy largas por plataformas de secuenciación basada en nanopore. El enfoque adopta una extracción de ADN optimizada seguida por las preparaciones de la biblioteca modificada para generar cientos de kilobases Lee con una cobertura moderada de células humanas.
Tercera generación de tecnologías de secuenciación de ADN de una sola molécula ofrecen significativamente más Lee longitud que puede facilitar el ensamblaje de complejos genomas y análisis de variantes estructurales complejas. Plataformas Nanopore realizan secuenciación de una sola molécula por medición directa de los cambios actuales mediados por el paso de ADN a través de los poros y pueden generar cientos de kilobases (kb) dice con mínimo costo de capital. Esta plataforma ha sido adoptada por muchos investigadores para una variedad de aplicaciones. Lograr más largos de lectura de la secuencia es el factor más crítico para aprovechar el valor de las plataformas de secuenciación nanopore. Para generar lecturas ultra-larga, consideración especial es necesaria para evitar roturas de DNA y ganar eficiencia para generar plantillas de secuencia productiva. Presentamos el protocolo detallado de ultra larga secuencia de la DNA incluyendo la extracción de ADN de alto peso molecular (APM) de las células frescas o congeladas, construcción de biblioteca por corte mecánico o fragmentación de la transposasa y la secuencia en un dispositivo nanopore. De 20-25 μg de ADN de HMW, el método puede alcanzar N50 leer longitud de 50-70 kb con el corte mecánico y N50 de 90-100 kb leer longitud con transposasa mediada fragmentación. El protocolo se puede aplicar al ADN extraído de células de mamíferos para realizar la secuenciación del genoma entero para la detección de variantes estructurales y ensamblaje del genoma. Mejoras adicionales sobre la extracción de ADN y las reacciones enzimáticas más aumentará la longitud leer y ampliar su utilidad.
En la última década, masivamente paralelo y tecnologías de secuenciación de alto rendimiento segunda generación altamente exacto han llevado a una explosión de descubrimientos biomédicos e innovación tecnológica1,2,3. A pesar de los avances técnicos, el corto-leer datos generados por las plataformas de segunda generación son eficaces en la resolución de regiones genómicas complejas y están limitados en la detección de variantes estructurales genómicas (SVs), que desempeñan papeles importantes en humanos evolución y enfermedades4,5. Además, corto-leer datos no puede resolver variación repetición y son inadecuados para los más exigentes haplotipo eliminación de variantes genéticas6.
Últimos avances en secuenciación de una sola molécula ofrece mucho más leer longitud, que puede facilitar la detección de la gama completa de SVs7,8,9y ofrece montaje precisa y completa del complejo genomas microbianos y mamíferos6,10. La plataforma nanopore realiza la secuenciación de una sola molécula por medición directa de los cambios actuales mediados por el paso de ADN a través de los poros11,12,13. A diferencia de cualquier química existente de secuenciación de ADN, secuenciación nanopore puede generar largos (decenas o miles de kilobases) lecturas en tiempo real sin depender de la cinética de la polimerasa o artificial la amplificación de la muestra de ADN. Por lo tanto, nanopore larga lectura secuencia (NLR-seq) tiene gran promesa para la generación de ultra largos leerlas más allá de 100 kb, lo que adelantaría mucho análisis genómico y biomédica14, particularmente en la repetición-ricas o baja complejidad regiones del genoma15.
La característica única de la secuencia nanopore es su potencial para generar largas lee sin una limitación de la longitud teórica. Por lo tanto, la longitud leer depende de la longitud física de la DNA que es afectada directamente por la calidad de plantilla de integridad y secuenciación de ADN. Por otra parte, dependiendo del grado de manipulación y el número de pasos implicados, como el pipeteo de las fuerzas y condiciones de extracción, la calidad de la DNA es muy variable. Por lo tanto, es un reto para uno para lecturas largas aplicando sólo los protocolos de extracción de ADN estándar y métodos de construcción de biblioteca suministrado del fabricante. Con este fin, hemos desarrollado un sólido método para generar muy largo leer (cientos de kilobases) datos de la secuencia a partir de gránulos de células cosechadas. Adoptaron múltiples mejoras en los procedimientos de preparación de extracción y biblioteca de ADN. Optimizamos el protocolo para excluir procedimientos innecesarios que causan daños y degradación del ADN. Este protocolo está compuesto de alto peso molecular (HMW) extracción de ADN, ultra larga construcción de biblioteca de ADN y la secuencia en una plataforma nanopore. Para un biólogo molecular bien entrenado, normalmente tarda 6 h desde la cosecha hasta la finalización de la extracción de ADN de HMW, 90 minutos o 8 h para la construcción de la biblioteca según el método de corte y hasta un más 48 h para la secuencia de la DNA de la célula. El uso del Protocolo será empoderar a la comunidad genómica para mejorar nuestra comprensión de la complejidad del genoma y conocer nueva variación del genoma en enfermedades humanas.
En principio, la secuencia nanopore es capaz de generar 100 kb a megabase lee en longitud11,12,13. Cuatro principales factores afectarán el desempeño de la calidad de ejecución y los datos de la secuencia: 1) activo poro números y la actividad de los poros; 2) proteína motor, que controla la velocidad de ADN pasando por nanopore; 3) plantilla ADN (longitud, pureza, calidad, total); 4) secuencia adaptador ligadura eficiencia, que determina el ADN utilizable de la muestra de entrada. Los dos primeros factores dependen de la versión de la célula de flujo y el kit de secuenciación proporcionado por el fabricante. El segundo dos factores son pasos críticos en este protocolo (extracción de ADN de HMW, corte y ligadura).
Este protocolo requiere paciencia y práctica. La calidad del ADN de HMW es importante ultra-larga de bibliotecas de ADN6. El protocolo comienza con las células con alta viabilidad (> 85% de células viables preferido), limitando el ADN degradado de las células muertas. Debe evitarse cualquier proceso áspero que puede presentar daños a la DNA (por ejemplo, fuerte inquietante, sacudiendo, vortex, múltiples pipeteo, repetida congelación y descongelación). En el diseño del Protocolo, omitimos el pipeteo en todo el proceso de extracción de ADN. Consejos de gran diámetro deben usarse cuando el pipeteo es necesario después de la esquila mecánica durante la construcción de la biblioteca y la secuencia. Como el interconectivos son sensibles a los químicos en la cámara buffer12, debe haber contaminantes residuales como pocos (p. ej., detergentes, tensioactivos, fenol, etanol, proteínas ARN, etc.) como sea posible en la DNA. Teniendo en cuenta la longitud y el rendimiento, el método de extracción de fenol muestra los resultados mejores y más reproducibles en comparación con varios diferentes métodos de extracción probados hasta ahora.
A pesar de la capacidad de este protocolo para producir secuencias de lectura larga, varias limitaciones siguen. En primer lugar, este protocolo fue optimizada basada en el dispositivo de secuencia nanopore disponible en el momento de su publicación; por lo tanto, se limita a la química de secuenciación selectiva basada en nanopore y podría ser subóptima cuando se realiza en otros tipos de dispositivos de lectura larga secuencia. En segundo lugar, el resultado es altamente dependiente de la calidad del ADN extraído de material de partida (tejidos o las células). Longitud de lectura podría deteriorarse si el ADN partido ya está degradado o dañado. En tercer lugar, aunque varios pasos de control de calidad están incorporados en el protocolo para comprobar la calidad del ADN, el rendimiento final y la longitud de las lecturas pueden verse afectadas por la celda de flujo y poro actividad, que puede ser variable en esta primera etapa de la plataforma de secuenciación nanopore desarrollo.
El protocolo descrito aquí utiliza muestras de línea celular humana suspensión para extracción de ADN. Hemos optimizado los tiempos de paso de aguja de corte, la relación del ADN de HMW transposasa y el momento de la ligadura para producir los resultados descritos. El protocolo puede ser ampliado en cuatro maneras. En primer lugar, los usuarios pueden iniciar con otras células mamíferos cultivadas y con diferente cantidad de células, tejidos, muestras clínicas u otros organismos. Se necesitará mayor optimización en el tiempo de lisis de incubación, volumen de reacción y centrifugación. En segundo lugar, es difícil predecir el tamaño de destino para la secuencia de lectura ultra largo. Si la lectura son más cortas de lo esperado, los usuarios pueden ajustar los tiempos de paso en el método basado en el corte mecánico o cambiar la relación entre el ADN de HMW a transposasa en el método basado en la fragmentación de la transposasa. Tiempo de encuadernación y elución durante los pasos de limpieza son útiles porque el ADN de HMW es altamente viscoso. En tercer lugar, con dispositivos de secuencia diferentes nanopore, uno puede ajustar la cantidad y el volumen de la DNA para cumplir los criterios del secuenciador. Cuarto, solamente ésos DNA ligada a adaptadores de secuencia va ser secuenciado. Para mejorar aún más la eficacia de la ligadura, uno puede intentar valorar las concentraciones de adaptador y ligasa. Tiempo de ligadura modificada y agentes crowding moleculares como PEG18 pueden aplicarse en el futuro. El protocolo de secuenciación de ADN ultra largo combinado con CRISPR19,20 puede ofrecer una herramienta eficaz para la secuencia de enriquecimiento objetivo.
The authors have nothing to disclose.
Los autores agradecen a Zhu Y. por sus comentarios sobre el manuscrito. Investigación en esta publicación fue apoyada parcialmente por el Instituto Nacional del cáncer de los institutos nacionales de salud bajo la concesión número P30CA034196. El contenido es responsabilidad exclusiva de los autores y no representan necesariamente las opiniones oficiales de los institutos nacionales de salud.
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |