Aquí presentamos un enfoque de secuenciación profunda que proporciona una determinación imparcial de naciente 3′-termini, así como perfiles mutacionales de moléculas de ADN monocatenario. La principal aplicación es la caracterización de los nacientes DNAs complementarios retrovirales (cADN), los intermedios generados durante el proceso de transcripción inversa retroviral.
Monitoreo de productos intermedios ácidos nucleicos durante la replicación de virus proporciona penetraciones en los efectos y mecanismos de acción de compuestos antivirales y proteínas de la célula huésped en la síntesis de ADN viral. Aquí nos dirigimos a la falta de un análisis basado en la célula, alta cobertura y alta resolución que es capaz de definir productos intermedios de la transcripción inversa retroviral en el contexto fisiológico de infección por el virus. El método descrito captura 3′-termini de nacientes moléculas complementarias de ADN (cDNA) dentro de las células de infectados por VIH-1 en la resolución de un solo nucleótido. El protocolo consiste en extracción de ADN, enriquecimiento específica de ADN viral vía captura de híbrido, ligadura de adaptador, fraccionamiento tamaño gel purificación, amplificación de PCR, secuenciación profunda y análisis de datos de la célula entera. Un paso clave es la ligadura de las moléculas del adaptador para abrir termini de 3′-ADN eficiente e imparcial. Aplicación del método descrito determina la abundancia de transcripción inversa de cada longitud particular en una muestra determinada. También proporciona información sobre la variación de la secuencia (interno) en la transcripción inversa y de tal modo ninguna mutaciones posibles. En general, el ensayo es adecuado para cualquier pregunta relativa al ADN 3′-extensión, siempre y cuando se conoce la secuencia de la plantilla.
Con el fin de diseccionar y comprender la replicación viral completamente, cada vez más refinadas técnicas que capturan la replicación intermedios son necesarios. En particular, la definición precisa de las especies de ácido nucleico viral en el contexto de las células infectadas puede proporcionar nuevas perspectivas, ya que muchos mecanismos de replicación viral a la fecha han sido examinados en reacciones aisladas en vitro . Un ejemplo es el proceso de transcripción inversa en retrovirus como el virus de inmunodeficiencia humana 1 (VIH-1). Las diferentes etapas de la transcripción reversa del VIH-1, durante el cual la enzima viral de la transcriptasa reversa (RT) copia el genoma de ARN monocatenario a ADN de doble hebra, han sido estudiados principalmente en ensayos de extensión de la cartilla con las proteínas purificadas y nucleicos ácidos1,2,3,4,5. Mientras que se establecieron los principios fundamentales, tales análisis no incorporan todos los componentes virales y celulares y pueden no reflejar los stoichiometries biológicamente relevantes de factores implicados. Por lo tanto, hemos diseñado una técnica poderosa para determinar el espectro de productos intermedios de la reversa de la transcripción precisa del cDNA 3′-termini (es decir, determinar su longitud exacta) y secuencias de nucleótidos en el contexto de las infecciones de la vida las células6. Recolección de datos de tiempo experimentos de curso pueden ser utilizados para comparar el perfil de las transcripciones en diversas condiciones, tales como la presencia de moléculas antivirales o proteínas, que pueden influir en la eficiencia y la procesividad de la síntesis de ADN y acumulación. Esto permite una comprensión más detallada del patógeno natural del ciclo de vida, que a menudo es la base para el diseño de fármacos específicos y la intervención terapéutica exitosa.
Transcripción reversa del VIH-1 compone de una serie de sucesivos eventos iniciados por el recocido de un primer tRNA a la plantilla de RNA genómica, que luego se extendió por RT para producir una transcripción de ADNc monocatenario corto llamada una cadena menos fuerte-parada (-sss) (véase Figura 1). Posteriormente, el cDNA – sss se transfiere desde el terminal 5′ de largo repetición (LTR) hasta el litro 3′ del ARN genómico, donde recuece y sirve como la cartilla para RT continuo mediada por alargamiento del menos filamento de la DNA (véase comentarios en transcripción reversa1 , 2 , 3 , 4). esta primera transferencia de cadena es una de las medidas de limitación de velocidad de reversa de la transcripción; por lo tanto, el cDNA – sss se sabe que se acumulan. El diseño básico del flujo de trabajo y biblioteca para capturar los productos de reversa de la transcripción en células infectadas se describe en la Figura 2a. Los iniciadores específicos y análisis de parámetros que se utilizan en el protocolo y listados en la tabla 1 de destino todos temprano revés transcripción cDNA intermedios dentro de la gama de longitud de 23 a ~ 650 nt, que incluye el ADN de 180-182 nt – sss. Sin embargo, las adaptaciones menores adecuadas a la estrategia permitirá aplicación no solo productos finales de reversa de la transcripción, pero también otros virus y sistemas, donde el objetivo es detectar que contiene extremos de ADN 3′-OH. Limitaciones importantes a considerar incluyen la gama de la longitud del producto final de PCR en la biblioteca; en particular, plantillas en las que la distancia entre el adaptador en el open 3′-terminal y el primer río arriba excede ~ 1000 nt serán probablemente ser menos eficientemente secuenciadas, introducir potencialmente engañosa prejuicios técnicos durante la preparación () Biblioteca Vea la discusión para más detalles y sugerencias de adaptación).
Previamente divulgadas técnicas para la determinación sistemática de 3′-termini de ácido nucleico se han centrado en RNA, no ADN, moléculas. Un ejemplo es 3′ RACE (amplificación rápida del cDNA termina)7, que depende de la poliadenilación del mRNA. Además, se desarrollaron estrategias de ligadura base adaptador empleando ligasas de RNA, que han incluido RLM-raza (raza de RNA ligasa-mediada)8 o encaje (amplificación basada en la ligadura de los extremos del cDNA de)9. Es importante destacar que amplificaciones de ligadura son sensibles a cualquier sesgo introducido por la reacción de ligadura sí mismo. Por ejemplo, la ligadura puede ser más o menos eficiente dependiendo de un determinado nucleótido en la posición 3′, la secuencia, longitud total de la molécula o estructura local. Tales preferencias ligasa conducen a captura incompleta de moléculas y falsedad en la lectura, que nosotros y otros hemos observado9,10. Para minimizar el sesgo de ligadura durante los pasos además de adaptador en el protocolo descrito en este documento, probado una serie de estrategias de la ligadura y el uso de T4 ADN ligasa con un adaptador de DNA monocatenario de horquilla (como se describe por Kwok et al. 11) ser el único procedimiento con cerca ligadura cuantitativa que no produjo diferencias significativas en la eficacia de la ligadura cuando se evaluó con un conjunto de control oligonucleótidos6específicamente seleccionado. La elección de esta estrategia de ligadura es, por lo tanto, una característica clave en el éxito de este protocolo.
Hasta la fecha, seguimiento de la progresión de la RT del VIH-1 en células infectadas principalmente se ha logrado mediante la medición de productos de la transcripción inversa de diferentes longitud con PCR cuantitativa (qPCR) haciendo uso de la cartilla-probe que únicamente miden la mayor o menor (principios y tarde, respectivamente) cDNA productos12,13,14. Mientras que este enfoque de qPCR es apropiado para determinar eficiencias intrínsecas del proceso de transcripción inversa en sistemas celulares, la salida es de resolución relativamente baja, sin información de la secuencia se deriva. Nuestro nuevo enfoque, basado en adaptador optimizado ligadura, generación de biblioteca mediada por PCR y secuenciación profunda direcciones la brecha tecnología y ofrece una oportunidad para monitorear la reversa de la transcripción durante la infección por VIH-1 cuantitativamente y en un solo nucleótido resolución.
Hemos ilustrado la utilidad de este método en un estudio que distingue entre dos modelos propuestos para la capacidad del VIH-1 factor de la restricción APOBEC3G (Apolipoproteína B mRNA edición enzima catalítico polipéptido-como 3G) para interferir con la producción de transcripción reversa viral6.
La disponibilidad de secuenciación profunda rápida, confiable y rentable ha revolucionado muchos aspectos en el campo de Ciencias de la vida, permitiendo a gran profundidad en los análisis de secuenciación. Un desafío restante radica en el diseño innovador y la creación del representante de bibliotecas de la secuencia. Aquí se describe un protocolo para capturar las moléculas de ADNc viral naciente, específicamente los intermedios del proceso de transcripción inversa de VIH-1.
El paso más crítico de esta estrategia es la ligadura de un adaptador para el open 3′-termini de manera cuantitativa y objetiva. Eficiencias de trompas entre dos termini de ssDNA, tanto inter- y intramolecular, investigaron y optimizado para diversas aplicaciones11,26,27,28,29. La opción de utilizar un adaptador de horquilla con T4 ADN ligasa en las condiciones descritas en el paso 3.3 es el resultado de la optimización empírica en la que se evaluaron diferentes ligasas, adaptadores y reactivos para la ligación de oligonucleótidos sintéticos que representan Secuencias de HIV-1 (tabla 2) (datos no mostrados). En estas reacciones de la prueba en vitro , confirmamos que el ligase de la DNA de T4 mediada por la ligadura del adaptador de la horquilla, según lo descrito por Kwok et al. 11, tiene un sesgo muy bajo y logra cerca ligadura completa de moléculas aceptoras cuando el adaptador se usa en exceso. La eficacia de la ligadura era inafectada por la adición de la secuencia de nucleótidos para representar el adaptador compatible para el sistema de primer multiplex (ver figura 4). En comparación, encontramos que un termoestable 5′ ADN/ARN ligasa («Ligasa A», véase Tabla de materiales para exactos ligasas comparado aquí), que es una ingeniería ligasa de RNA que se desarrolló en parte para mejorar la eficacia de la ligadura con ssDNA como aceptor 27, fue más efectivo que ligan dos moléculas de ssDNA de ligasa de RNA “(B de la ligasa del) pero tenía un sesgo importante, con fuertes diferencias en la eficacia de la ligadura entre oligonucleótidos con diferencias de longitud de base individual [tabla 2 ; HTP con media G (a) y (b)]. Además, encontramos sólo un sesgo mínimo en reacciones con “Ligasa C” combinado con un adaptador que lleva al azar 5′-termini (una estrategia utilizada para compensar el sesgo de nucleótidos conocido “C ligasa”; véase por ejemplo Ding et al. 30). sin embargo, la “C de ligasa”-mediadas trompas intermoleculares estaban incompletos, haciendo el sistema de T4 ADN ligasa la opción superior.
Varias medidas de control de calidad sobre el curso de protocolo y la inclusión de controles positivos y negativos permiten para la detección de problemas potenciales antes de continuación de ensayo y proporcionan orientación para la solución de problemas de esfuerzos. Las cuantificaciones de qPCR en pasos 2.2.2 2.3.12 aseguran de que la cantidad de material de entrada es suficiente. Números de copia cDNA típica en el rango de elución (del paso 2.1) 200 μL de alrededor de 10.000 a 300.000 por μl. El paso de captura de híbrido puede resultar en una pérdida general de VIH-1 cantidad de cDNA, pero dará lugar a un fuerte enriquecimiento de cDNA específico del VIH-1 sobre el ADN celular, que puede determinarse mediante el uso de primers adecuados para cuantificar ADN genómico antes y después de enriquecimiento por qPCR o midiendo la concentración de DNA total. CDNA de VIH-1 recuperado después de que el híbrido captura pasos debe ser al menos el 10% de la entrada. Baja a partir de material de lo contrario puede explicar un control positivo de éxito del oligonucleótido (ver paso 3.3.2) pero limitado sólo lee en las muestras. Bajo Lee números general también podrían explicarse por la sobreestimación de la concentración de la biblioteca debido a la presencia de especies de ADN irrelevantes sin adaptadores MiSeq. Esto daría lugar a densidad baja del cluster y puede mejorarse mediante la determinación de la concentración de secuencias de HIV-1 en la biblioteca por qPCR además de la cantidad de ADN total por análisis fluorométrico. Debido a la naturaleza altamente sensible del método, se debe tener especial cuidado para evitar la contaminación incluso de bajo nivel, tanto de otras muestras (en particular, de las existencias de oligonucleótidos de alta concentración control) así como de equipos de laboratorio. Trabajando en la estación de trabajo PCR de esterilización UV es beneficioso en este sentido. La electroforesis automatizada de la biblioteca final (paso 6.1.2) es otra medida de control de calidad. El rango de tamaño de ácidos nucleicos observado por lo general es entre 150 a 500 nt. imprimaciones que pueden detectarse en el control opcional después de la polimerización en cadena y antes de purificación (ver nota en el paso 5.2) ahora esté ausente. En un resultado representativo, la curva de intensidad de la muestra tiene un pico alrededor de 160 a 170 nt y un segundo más agudo pico alrededor de 320 a 350 nt. Esto probablemente refleja la abundancia superior ve a menudo en la transcripción inversa de relativamente corto (longitud de inserción de 1 a 20 nt) y larga duración fuerte parada (longitud de inserción de 180 a 182 nt) (figura 3b).
Mientras que el protocolo presentado y las cartillas son específicas para construcciones de transcripción reversa de HIV-1 tempranas, el método es generalmente aplicable a cualquier estudio con el objetivo de determinar abierto 3′ termini de ADN. Las principales modificaciones en otros contextos será el método de captura híbrida y la estrategia de diseño de la cartilla. Por ejemplo, si el objetivo es adaptarse a las transcripciones finales de VIH-1, un mayor número de diferentes oligonucleótidos biotinilados captura recocido a lo largo del cDNA sería recomendable y probablemente disminuirá la pérdida en el paso de captura de híbridos. Como se mencionó en la introducción, es importante considerar las limitaciones en el diseño de la gama que 3′-termini está a detectar para evitar diversas fuentes de sesgo. En primer lugar, puede haber un sesgo en las reacciones de polimerización en cadena si las plantillas con el adaptador son de longitud muy variable. En segundo lugar, la plataforma la secuencia utilizada aquí (por ejemplo, MiSeq) tiene un rango de longitud de inserción preferido para el agrupamiento óptimo y significativamente productos más cortos y más largo no pueden ser ordenados con la misma eficiencia. En parte, esto puede abordarse computacionalmente, como se hizo mediante el cálculo de un factor de corrección por sesgo de longitud (ver figura 4, gráfico inferior). Sin embargo, si la región de donde se desea la 3′-termini mapeo es larga (> 1000 nt), es más aconsejable dividir las reacciones con las transcripciones ligadas y usar múltiples cebadores aguas arriba para evaluar 3′-termini en secciones.
El programa de análisis fue escrito en la empresa con el propósito específico de analizar ambos el último nucleótido de la secuencia del VIH-1 adyacente a la secuencia del adaptador fijo, así como la variación de la base de todas las bases para identificar cualquier mutaciones. Los pasos individuales comprenden las siguientes: en primer lugar, las secuencias de adaptador se recortan utilizando el toolkit de fastx-0.0.13; Luego, se eliminan cualquier secuencia que está duplicado (es decir, idénticas secuencias incluyendo el código de barras). Todas las lecturas únicas restantes entonces se alinean con la secuencia del VIH-1 con Bowtie (http://bowtie-bio.sourceforge.net/index.shtml) el desajuste máximo en tres bases. La secuencia de la plantilla está conformada por la primera 635 nt del cDNA de VIH-1 (cepa NL4.3), que incluye la secuencia – sss y el primer producto de transferencia de filamento hasta la pista de polypurine (U5-R-U3-PPT; ver figura 1). Por lo tanto, el software suministrado y plantillas aptas sólo directamente si el método se utiliza para la misma aplicación (detección de tempranas transcripciones inversas de la de VIH-1NL4.3). Ajustes tendrá que hacer para otras secuencias diana. Las posiciones de la 3′-termini para cada lectura se determinaron por la posición en la alineación. Se registran llamadas base para cada posición y se calculan tasas de mutación de la cobertura total de cada base, que varía, como Lee es de diferentes longitudes e insertos largos podrían no estar cubiertos completamente por la secuencia de la base de 125 en Read2.
Para concluir, creemos que el método descrito para ser una herramienta valiosa para muchos tipos de estudios. Aplicaciones obvias incluyen las investigaciones de los mecanismos de inhibición de reversa de la transcripción a través de medicamentos antirretrovirales o factores de restricción celular. Sin embargo, sólo relativamente pequeños ajustes deben ser necesarios adaptar el sistema a 3′-termini mapeo dentro de otros intermediarios virales monocatenario DNA, que están presentes, por ejemplo, en la replicación del parvovirus. Además, el principio del método, particularmente su paso ligadura optimizado, puede proporcionar una parte fundamental del diseño de preparación de biblioteca para la caracterización de las extensiones de ADN 3′, incluyendo elongaciones catalizadas por ADN de doble cadena celular polimerasas.
The authors have nothing to disclose.
Los autores reconocen el apoyo de los miembros de la laboratorio Malim, Luis Apolonia, Jernej Ule y Rebecca Oakey. Los autores agradecen a Matt Arno en genómica del centro de Londres de la Universidad del rey y Debbie Hughes en la Universidad College Londres (UCL), Instituto de Neurología siguiente secuencia planta de generación, para obtener ayuda con la secuencia MiSeq se ejecuta. El trabajo fue apoyado por el Consejo de investigación médica de Reino Unido (G1000196 y M001199/MR/1 a M.M.), la Wellcome Trust (106223/14/Z/Z a M.M.), séptimo programa de la Comisión Europea marco (FP7/2007-2013) en convenio de subvención no. PIIF-GA-2012-329679 (a D.P.) y el Departamento de salud vía un institutos nacionales en Premio salud investigación integral centro de investigación biomédica de Guy y St. Thomas’ NHS Foundation Trust en asociación con College Londres de rey y del rey College Hospital NHS Foundation Trust.
293T cells | ATCC | CRL-3216 | |
Dulbecco's Modified Eagle's Medium | Gibco | 31966-021 | |
Penicillin/Streptomycin | Gibco | 15150-122 | |
Fetal Bovine Serum | Gibco | 10270-106 | |
HeraCell Vios 250i CO2 Incubator | Thermo Scientific | 51030966 | |
Laminar flow hood – CAS BioMAT2 | Wolflabs | CAS001-C2R-1800 | |
10mm TC-treated culture dish | Corning | 430167 | |
TrypLE™ Express (1x), Stable Trypsin Replacement Enzyme | Gibco | 12605-010 | |
OptiMEM® (Minimal Essential Medium) | Gibco | 31985-047 | |
HIV-1 NL4-3 Infectious Molecular Clone (pNL4-3) | NIH Aids reagent program | 114 | |
Polyethylenimine (PEI) – MW:25000 | PolySciences Inc | 23966-2 | dissolved at 1mg/ml and adjusted to pH7 |
RQ1- Rnase free Dnase | Promega | M6101 | |
Filter 0.22 μm | Triple Red Limited | FPE404025 | |
15 mL polypropylene tubes | Corning | CLS430791 | |
Sucrose | Calbiochem | 573113 | |
Phosphate Buffered Saline (1x) | Gibco | 14190-094 | |
Ultracentrifuge tubes | Beckman Coulter | 344060 | |
Ultracentrifuge | Sorval | WX Ultra Series | Th-641 Rotor |
Alliance HIV-1 p24 antigen ELISA kit | Perkin Elmer | NEK050001KT | |
CEM-SS cells | NIH Aids reagent program | 776 | |
Roswell Park Memorial Institute Medium | Gibco | 31870-025 | |
CoStar® TC treated multiple well plates | Corning | CLS3513-50EA | |
Benchtop centrifuge: Heraus™ Multifuge™ X3 FR | Thermo Scientific | 75004536 | |
TX-1000 Swinging Bucket Rotor | Thermo Scientific | 75003017 | |
Microcentrifuge: 5424R | Eppendorf | 5404000060 | |
Total DNA extraction kit (DNeasy Blood and Tissue kit) | Qiagen | 69504 | |
Nuclease free H2O | Ambion | AM9937 | |
Cutsmart buffer | New England Biolabs (part of DpnI enzyme) | R0176S | |
DpnI restriction enzyme | New England Biolabs | R0176S | |
Oligonucleotides for qPCR | MWG Eurofins | N/A | HPSF purification |
TaqMan PCR Universal Mastermix | Thermo | 4304437 | |
LoBind Eppendorf® tubes | Eppendorf | 30108078 | |
Axygen™ aerosol filter pipette tips, 1000 μL | Fisher Scientific | TF-000-R-S | |
Axygen™ aerosol filter pipette tips, 200 μL | Fisher Scientific | TF-200-R-S | |
Axygen™ aerosol filter pipette tips, 20 μL | Fisher Scientific | TF-20-R-S | |
Axygen™ aerosol filter pipette tips, 10 μL | Fisher Scientific | TF-10-R-S | |
PCR clean hood | LabCaire | Model PCR-62 | |
DynaMag™2-magnet | Thermo | 12321D | |
Streptavidin MagneSphere® paramagnetic particles | Promega | Z5481 | |
Casein | Thermo Scientific | 37582 | |
End over end rotator, Revolver™ 360° | Labnet | H5600 | |
Tris-Base | Fisher Scientific | BP152-5 | |
Hydrochloric Acid | Sigma | H1758-100ML | |
EDTA disodium salt dihydrate | Electran (VWR) | 443885J | |
Sodium Chloride | Sigma | S3014 | |
Dri-Block® Analog Block Heater | Techne | UY-36620-13 | |
PCR tubes and domed caps | Thermo Scientific | AB0266 | |
PCR machine | Eppendorf | Mastercycler® series | |
T4 DNA ligase | New England Biolabs | M0202M | |
40% Polyethylene glycol solution (PEG) in H2O, MW: 8000 | Sigma | P1458-25ML | |
Betaine solution, 5M | Sigma | B0300-1VL | |
Gel loading buffer II (formamide buffer) | Thermo Scientific | AM8546G | |
Precast 6% TBE urea gels | Invitrogen | EC6865BOX | |
Mini cell electrophoresis system | Invitrogen, Novex | XCell SureLock™ | |
Tris/Borate/EDTA solution (10x) | Fisher Scientific | 10031223 | |
Needle 21 G x1 1/2 | VWR | 613-2022 | |
SYBR Gold nucleic acid stain (10000x) | Life Technologies | S11494 | |
Dark Reader DR46B transilluminator | Fisher Scientific | NC9800797 | |
Ammonium acetate | Merck | 101116 | |
SDS solution 20% (w/v) | Biorad | 161-0418 | |
Centrifuge tube filter | Appleton Woods | BC591 | |
Filter Glass Fibre Gf/D 10mm | Whatman (VWR) | 512-0427 | |
polyadenylic acid (polyA) RNA | Sigma | 10108626001 | |
Glycogen, molecular biology grade | Thermo Scientific | R0561 | |
Isopropanol (2-propanol) | Fisher Scientific | 15809665 | |
Ethanol, molecular biology grade | Fisher Scientific | 10041814 | |
Accuprime™ Supermix I (DNA polymerase premix) | Life Technologies | 12342-010 | |
NEBNext® Multiplex Oligo for Illumina (Index Primer Set 1 and 2) | New England Biolabs | E7335S; E7500S | |
Tapestation D1000 Screentape High sensitivity | Agilent Technologies | 5067- 5584 | |
Tapestation D1000 Reagents | Agilent Technologies | 5067- 5585 | |
2200 Tapestation – automated gel electrophoresis system | Agilent Technologies | G2965AA | |
Agencourt® AMPure® beads XP | Beckman Coulter | A63880 | |
Qubit™ dsDNA HS Assay Kit | Invitrogen | Q32851 | |
Qubit™ 2.0 Fluorometer | Invitrogen | Q32866 | |
Topo™ TA cloning Kit | Invitrogen | 450071 | |
Sequencing platform: MiSeq System | Illumina | ||
Experiment Manager (Sample sheet software) | Illumina | Note: Use TruSeq LT as a template | |
Miseq™ Reagent kit V3 (150 cycle) | Illumina | MS-102-3001 | |
Sequencing hub: Basespace | Illumina | https://basespace.illumina.com | |
Ligase A: Thermostable 5’ App DNA/RNA ligase | NEB | M0319S | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Ligase B: T4 RNA ligase 1 | NEB | M0204 | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Ligase C: CircLigase | Epicentre | CL4111K | Not used in this protocol, but tested in optimization process with results described in the discussion. |