Este protocolo describe un método para asignación pre-mRNA 3′ final sitios de procesamiento.
Estudios en la última década han revelado una variedad compleja y dinámica de reacciones de poliadenilación y escote de pre-mRNA. mRNAs con largas regiones 3′ no traducidas (UTRs) se generan en las células diferenciadas que proliferar las células expresan preferentemente transcripciones con corta 3′ UTRs. Describimos el protocolo A-seq, ahora en su segunda versión, que fue desarrollado para asignar sitios de poliadenilación genoma y estudiar la regulación del proceso de pre-mRNA 3′ final. También aprovecha este protocolo actual de Poliadenilato (colas de poly(A)) que se agregan durante la biogénesis de los mRNAs mamíferos más para enriquecer de mRNAs completamente procesados. Un adaptador de ADN con deoxyuracil en su cuarta posición permite que el proceso exacto de mRNA 3′ final fragmentos de la secuencia. No incluye el cultivo de células y las trompas durante la noche, el protocolo requiere unos 8 h tiempo práctica. Junto con él, se proporciona un paquete de software fácil de usar para el análisis de los datos derivados de la secuencia. A-Sec2 y el software de análisis asociadas proporcionan una solución eficiente y confiable para la asignación del pre-mRNA 3′ termina en una amplia gama de condiciones del 106 o menos células.
La captura y la secuencia de mRNA 3′ extremos permite el estudio del procesamiento de mRNA y la cuantificación de la expresión génica. Debido a sus colas poly(A), mRNAs eucarióticos puede ser eficazmente purificado de lysates de la célula total con cuentas inmovilizadas oligo-deoxythymidine (moléculas de oligo(dT)), que también puede cebar la síntesis de cDNA. Sin embargo, este enfoque tiene dos inconvenientes. Tramos de la A que es internos de las transcripciones pueden también primer síntesis de cDNA, dando por resultado falsas poly(A) sitios. Tramos de poly(A) segundo, homogéneo plantean desafíos específicos para la secuencia, además de no ser informativo para la identificación de la transcripción. Se han propuesto diversos enfoques para sortear estas limitaciones, tales como transcripción reversa a través de poly(A) colas seguidas de digestión Rnasa H ( 1de 3P-seq), el uso de una cartilla de secuenciación personalizada terminando en 20 Ts ( 2de 2P-seq), preselección de Fragmentos de ARN con poly(A) colas de más de 50 nucleótidos con una cartilla de45 CU5T seguido por digestión Rnasa H (3′ Lee 3) y el uso de una cartilla de oligo-dT que contiene el adaptador de 3′ en una horquilla (seq de A 4).
El recientemente desarrollado A Sec2 método 5 pretende eludir la secuencia a través de poly(A) y al mismo tiempo reducir al mínimo la proporción de dímeros que se generan por la uno mismo-ligadura de adaptadores, que ocurren particularmente cuando la concentración molar de adaptadores compensa la concentración de insertar. Este problema puede eliminarse cuando se unen ambos adaptadores al mismo tipo de Polinucleótido extremos como en A-Sec2, donde los adaptadores de 3′ se unen al extremo 5′ de fragmentos de ARN y los adaptadores de 5′ a 5′ extremos de los cDNAs después de reversa de la transcripción. El método es más conveniente que nuestro anteriormente propuesto A-seq – en que la secuencia estaba en el 5′-a-3′ dirección por lo que requiere precisamente controlada RNA fragmentación-, manteniendo una alta exactitud de la identificación del sitio de poly(A). Alrededor del 80% de las lecturas secuenciadas en muestras típicas mapa únicamente al genoma y llevar a la identificación de más de 20.000 grupos de sitio poly(A), más del 70% de que se superponen con anotación 3′ UTRs.
En Resumen, el protocolo A Sec2 comienza con fragmentación de mRNA y la ligadura de reversa-complemento 3′ adaptadores a los extremos 5′ de fragmentos de ARN. Poly (A)-que contienen ARN es entonces inversa transcrito con una cartilla de oligo(dT) largo de 25 nucleótidos (nt) que contiene un nucleótido de anclaje en el extremo 3′, dU en la posicion 4 y biotina en el extremo 5′, permitiendo que enlace del cDNA a granos magnéticos estreptavidina. La mayor parte de la cartilla, incluyendo biotina, se extrae el cDNA por clivaje en dU por la mezcla de enzima de usuario, que contiene uracilo ADN glicosilasa (UDG) y el ADN glicosilasa-liasa Endonuclease VIII. Esta reacción deja intactos extremos de la ligadura de un adaptador de 5′ y la izquierda Ts tres después del escote quedan marcar la ubicación de la cola de poly(A). Porque los adaptadores de 5′ y 3′ se unen por la ligadura a los receptores de 5′ extremos, no dímeros de adaptador se generan. Cuatro nucleótidos al azar-mers introducidos en principio Lee permite resolución de cluster en los instrumentos de la secuencia de vanguardia y también puede servir como identificador molecular único (UMI) para la detección y eliminación de artefactos de amplificación de PCR. El tamaño de la UMI puede aumentar más lejos como hace en otros estudios 6. El protocolo genera lecturas que son inversa complementaria al mRNA 3′ extremos, todo comienza con un tetrámero aleatorio seguido por 3 Ts. procesamiento de lecturas que tiene el 3 Ts diagnóstico en su 5′ final comienza con la corrección de artefactos de amplificación de PCR por explotando las UMIs, eliminación de secuencias 3′ de adaptador y revertir la complementación. Dice que pudo haber originado de oligo(dT) cebado en sitios ricos en A internos también se identifican computacionalmente y desechados. Los sitios falsos suelen carecen de uno de los 18 bien caracterizado y poly(A) conservado señales que deben ser ubicado ~ 21 nucleótidos corriente arriba del escote aparente sitio 7.
El protocolo requiere unos 8 h tiempo práctica, sin contar el cultivo celular y las trompas durante la noche. El asociado lee análisis software permite una identificación de sitio de alta precisión poly(A). Desde el sitio de poly(A) clusters crearon basados en 4 muestras más destacadas en esta superposición de 84% del manuscrito (dos réplicas biológicas de siRNA control y células tratadas con si-HNRNPC) con un gen anotado y de éstos, superposición de 75% con un 3′ UTR y 86% ya sea con un 3′ UTR o un exón terminal. El coeficiente de correlación de Pearson de expresión de los extremos 3′ de las muestras replicadas es 0,92, y por lo general se obtienen valores de sobre 0.9 con el método. Así, A-Sec2 es un método práctico que da resultados muy reproducibles.
La multitud de base y factores auxiliares que intervienen en el proceso de pre-mRNA 3′ final se refleja en un paisaje de poliadenilación proporcionalmente complejo. Además, también es sensible a los cambios en otros procesos como la transcripción y splicing de poliadenilación. 3′ extremo escote sitios pre-mRNAs se identifican típicamente basado en las colas de poly(A) características que se agregan a los productos de escote 5′. Mayoría de los métodos utiliza iniciadores oligo(dT) de longitudes variables que permiten la conversión específica de poli (A)-que contienen mRNAs a cADN en una reacción de transcripción reversa. Un problema común de este enfoque es cebado interno a las secuencias de A ricos en sitios de clivaje artifactual. Se han propuesto dos métodos que intentan eludir este artefacto en la etapa de preparación de la muestra. En el método de 3P-seq 1, adaptadores se unen específicamente a los extremos de las colas de poly(A) de con ayuda de un oligo de férula seguida parcial digestión Rnasa T1 y transcripción reversa con TTP en la reacción como los Deoxinucleótidos solamente. El heterodúplex resultantes de poly(A)-poly(dT) luego es digeridos con Rnasa H y los restantes fragmentos de RNA aislados, ligados a los adaptadores y secuenciados. Un método más simple y elegante, 2P-seq, que utiliza una cartilla de secuenciación personalizada omitiendo el tramo restante de oligo(dT) en la reacción de secuenciación se informó por los mismo autores 2. En un método relacionado, 3′ Lee 3, una cartilla inusualmente larga de 5 nosotros y 45 Ts, que también contiene una biotina es recocidos ARN fragmentado, seguido de lavados rigurosos para seleccionar moléculas de ARN con poly(A) colas de más de 50 nucleótidos. Aunque 3′ Lee reduce drásticamente la frecuencia de cebado interno, no completamente elimina lo 3. Protocolos para la secuencia directa del RNA también se han propuesto, pero las lecturas resultantes son cortas y tienen una alta tasa de error y este enfoque no ha sido más desarrollado 18,19,20. La Seq de PolyA y de los protocolos de Quant Seq comercializados combinan oligo(dT) base de cebado con un paso de cebado al azar para el cDNA segunda hebra síntesis 20. El uso de la reacción de transcripción reversa interruptor de plantilla con la transcriptasa reversa de los Virus de la leucemia murina de Moloney (MMLV) conduce a la generación de cDNAs con conectores en un solo paso y así no dímeros adaptador pueden aparecer en los métodos SAPAS y PAS-Seq 21 , 22.
El método A-Sec2 presentamos destaca en su utilización de un nucleótido escindibles (dU) dentro de una cartilla de oligo(dT) biotinilado. Esta modificación combina la utilidad de enriquecer oligo(dT) cruzado por hibridación, contra objetivos con el retiro de la mayoría de la secuencia25 de oligo (dT) de los fragmentos aislados antes de que las bibliotecas están preparadas y la preservación de tres t, que indican la presencia previa de la cola de poly(A). En contraste, los métodos que utilizan la Rnasa H para quitar poly(A) de las moléculas de ARN al azar dejan varios como. Ya que en A-Sec2, la secuencia se realiza desde el extremo 3′ de la anti-sentido, sitios de clivaje se predicen que se encuentra después el motivo NNNNTTT al principio de la secuencia cruda Lee. Los tetrámeros aleatorios no sólo sirven para permitir llamar sino también en la eliminación de artefactos de amplificación de PCR de base. UMIs más largas también pueden ser acomodados. La posibilidad de oscurecimiento interno permanece en A-Sec2 y trata de cómputo, en primer lugar descartando 3′ termina con una secuencia descendente genómicamente codificados, A ricos y luego descartando 3′ final clusters, lo que podrían explicarse por oscurecimiento interno en el Señal de poly(A) ricos A sí mismo. Un análisis reciente de sitios de poly(A) inferida únicamente por un gran número de protocolos indica que los sitios que son únicos a Sec2 A tengan el nucleótido esperado distribución y ubicación dentro de genes, similares a otros 3′ extremo protocolos de secuenciación.
Un paso crítico en A-Sec2 es la selección de cofia RNA y el retiro de RNAs ribosomal y varios ARNs pequeños. Esto se hace más fácilmente por un kit de mRNA aislamiento con Perlas magnéticas de oligo (dT)25 . En principio, ARN total aislado con fenol que contienen soluciones también da alta calidad RNA que puede ser más sometido a la selección por el kit de aislamiento de mRNA o agarosa oligo (dT). Un paso que puede variar en A-Sec2 es el tratamiento con hidrólisis alcalina que pueden acortar o extender para obtener fragmentos de ARN de diferentes tamaños. Crítico es también que la adición de dATP 3′ a 3′ extremos de los fragmentos de RNA por la polimerasa de la poly(A) es eficaz. En el protocolo descrito aquí, este tratamiento se aplica a todos los fragmentos del RNA, para evitar concatemerization durante la reacción de ligadura. Por último, observamos que aunque ligasa RNA 1 se utiliza normalmente como una ligasa de RNA, también ligates eficientemente solo trenzado DNA, como lo hemos hecho aquí para ligar un adaptador en el extremo 5′ de las moléculas de cDNA.
Así, A-Sec2 es un eficiente y fácil de implementar el protocolo para la identificación de sitios de procesamiento extremo 3′ pre-mRNA. Desarrollos futuros podrían incluir reducir aún más la complejidad del protocolo y la cantidad de material necesario. El conjunto asociado de más herramientas de análisis de datos computacionales permiten el tratamiento homogéneo del extremo 3′ secuencia de lecturas obtenidas con una amplia gama de protocolos.
The authors have nothing to disclose.
Los autores agradecen la Sra. Béatrice Dimitriades para ayuda con el cultivo celular. Este trabajo fue financiado por la Fundación Nacional Suiza de ciencia becas #31003A_170216 y 51NF40_141735 (NCCR ARN & enfermedad).
Materials | |||
Agarose, ultra pure | Invitrogen | 16500-500 | |
2100 Bioanalyzer | Agilent | G2940CA | |
Cordycepin triphosphate (3’ dATP) | SIGMA | C9137 | |
DNA low bind vials, 1.5 ml | Eppendorf | 22431021 | |
Dulbecco’s Phosphate Buffered Saline | SIGMA | D8637 | |
Dynabeads mRNA-DIRECT Kit | Ambion | AM61012 | |
GR-Green dye | Excellgen | EG-1071 | use 1:10,000 dillution |
HiSeq 2500 or NextSeq 500 next generation sequencers | Illumina | inquire with supplier | |
KAPA HiFi Hotstart DNA polymerase mix | KAPA/Roche | KK2602 | |
Nuclease free water | Ambion | AM9937 | |
Poly(A) polymerase, yeast | Thermo Fisher Scientific | 74225Z25KU | |
Poly(A) polymerase, E.coli | New England Biolabs | M0276L | |
Polynucleotide kinase | Thermo Fisher Scientific | EK0032 | |
QIAEX II Gel Extraction Kit | Qiagen | 20021 | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
RNA ligase 1, high concentration | New England Biolabs | M0437M | includes PEG-8000 |
RNeasy MinElute RNA Cleanup kit | Qiagen | 74204 | |
RNase H | New England Biolabs | M0279 | |
RNasin Plus, ribonuclease inhibitor | Promega | N2618 | |
Superscript IV reverse transcriptase | Thermo Fisher Scientiific | 18090050 | |
Turbo DNase | Ambion | AM2238 | |
USER enzyme mix | New England Biolabs | M5505 | |
Dyna-Mag-2 magnetic rack | Thermo Fisher Scientific | 12321D | |
Thermomixer C | Eppendorf | 5382000015 | Heated mixer with heated lid |
MicroSpin columns | GE-Healthcare | 27-5325-01 | |
Name | Company | Catalog Number | Comments |
Buffers | |||
Alkaline hydrolysis buffer, 1.5 x | Mix 1 part 0.1 M Na2CO3 and 9 parts 0.1 M NaHCO3. Add EDTA to 1 mM. Adjust pH to 9.2. Store aliquots at -20 °C. | ||
5x poly(A) polymerase buffer | Thermo Fisher Scientiific | 100 mM Tris-HCl, pH 7.0, 3 mM MnCl2, 0.1 mM EDTA, 1 mM DTT, 0.5 mg/ml acetylated BSA, 50% glycerol | |
Biotin binding buffer | 20 mM TrisCl pH 7.5, 2 M NaCl, 0.1% NP40 | ||
TEN buffer | 10 mM TrisCl, pH 7.5, 1 mM EDTA, 0.02% NP40 | ||
Name | Company | Catalog Number | Sequence |
Oligonucleotides according to Illumina TruSeq Small RNA Sample Prep Kits, for GA-IIx and Hiseq2000/2500 sequencers | Microsynth | ||
revRA3 (RNA) | Microsynth | 5’ amino CCUUGGCACCCGAGAAUUCCA 3’ | |
revDA5 | Microsynth | 5’ amino GTTCAGAGTTCTACAGTCCGAC GATCNNNN-3’ | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' (V = G, A or C) | |
PCR primer forward, RP1 | Microsynth | 5' AATGATACGGCGACCACCGAGA TCTACACGTTCAGAGTTCTACAGTC CGA 3' | |
PCR primer reverse, RPI1, barcode in bold | Microsynth | 5' CAAGCAGAAGACGGCATACGAGA TCGTGATGTGACTGGAGTTCCTTG GCACCCGAGAATTCCA 3' | |
Name | Company | Catalog Number | Comments |
Oligonucleotides according to Illumina TruSeq HT-Small RNA Sample Prep Kits, for HiSeq2000/2500 and NextSeq500 sequencers | |||
HT-rev3A (DNA/RNA) | Microsynth | 5'-amino-GTGACTGGAGTTCAGACGTGTGCT CTTCCrGrAUrC-3' | |
HT-rev5A | Microsynth | 5' amino-ACACTCTTTCCCTACACGACGCTCT TCCGATCTNNNN 3' | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' | |
PCR primers forward (D501-506) | Microsynth or Illumina | 5'-AATGATACGGCGACCACCGAGAT CTACAC[i5]ACACTCTTTCCCTACAC GACGCTCTTCCGATCT -3' | |
PCR primers reverse (D701-D712) | Microsynth or Illumina | 5'-CAAGCAGAAGACGGCATACGAG A[i7]GTGACTGGAGTTCAGACGTG TGCTCTTCCGATC-3' | |
Documentation for Illumina multiplexing: | Illumina | https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf |