Cap Analysis of Gene Expression (CAGE) es un método para la cartografía cuantitativa de los extremos de mRNA 5 para capturar sitios de inicio de transcripción de ARN polimerasa II con una resolución de un solo nucleótido. Este trabajo describe un protocolo de baja entrada (SLIC-CAGE) para la generación de bibliotecas de alta calidad utilizando nanogramos-cantidades de ARN total.
El análisis de la tapa de la expresión génica (CAGE) es un método utilizado para la detección de resolución de un solo nucleótido de los sitios de inicio de transcripción de ARN polimerasa II (TSS). La detección precisa de TSS mejora la identificación y el descubrimiento de los promotores principales. Además, los potenciadores activos se pueden detectar a través de firmas de iniciación de transcripción bidireccional. Aquí se describe un protocolo para realizar la portadora de entrada súper baja-CAGE (SLIC-CAGE). Esta adaptación SLIC del protocolo CAGE minimiza las pérdidas de ARN aumentando artificialmente la cantidad de ARN mediante el uso de una mezcla de portadoras de ARN transcrita in vitro que se añade a la muestra de interés, permitiendo así la preparación de la biblioteca a partir de nanogramos-cantidades de total ARN (es decir, miles de células). El portador imita la distribución esperada de la longitud del fragmento de la biblioteca de ADN, eliminando así los sesgos que podrían ser causados por la abundancia de un portador homogéneo. En las últimas etapas del protocolo, el portador se elimina a través de la degradación con endonucleases homing y la biblioteca de destino se amplifica. La biblioteca de muestras objetivo está protegida contra la degradación, ya que los sitios de reconocimiento de endonucleasa homing son largos (entre 18 y 27 bp), lo que hace que la probabilidad de su existencia en los genomas eucariotas sea muy baja. El resultado final es una biblioteca de ADN lista para la secuenciación de próxima generación. Todos los pasos en el protocolo, hasta la secuenciación, se pueden completar dentro de 6 días. La preparación del portaaviones requiere un día de trabajo completo; sin embargo, se puede preparar en grandes cantidades y mantenerse congelado a -80 oC. Una vez secuenciadas, las lecturas se pueden procesar para obtener TSS de resolución de nucleótidos de un solo nucleótido para todo el genoma. Una vez agregados a los promotores, los datos también se pueden utilizar para la generación de perfiles de expresiones centrada en 5′.
El análisis de la tapa de la expresión génica (CAGE) es un método utilizado para el mapeo de resolución de un solo nucleótido en todo el genoma de los sitios de inicio de transcripción de ARN polimerasa II (TSSs)1. Su naturaleza cuantitativa también permite la generación de perfiles de expresión centrada de 5′-end. Las regiones que rodean los TSS (alrededor de 40 bp aguas arriba y aguas abajo) son promotores principales y representan la ubicación física donde el ARN polimerasa II y los factores de transcripción general se unen (revisado previamente2,3). La información sobre las ubicaciones exactas de los TSS se puede utilizar para el descubrimiento del promotor principal y para supervisar la dinámica del promotor. Además, a medida que los potenciadores activos exhiben firmas de transcripción bidireccional,los datos CAGE también se pueden utilizar para el descubrimiento de potenciadores y la supervisión de la dinámica del potenciador 4. La metodología CAGE ha aumentado recientemente en popularidad debido a su amplia aplicacióny uso en proyectos de investigación de alto perfil como ENCODE 5, modENCODE6y proyectos FANTOM7. Además, la información del SST también está demostrando ser importante para distinguir el tejido sanoy enfermo, ya que los TSS específicos de la enfermedad pueden utilizarse con fines de diagnóstico 8.
A pesar de que hay varios métodos para la asignación de TSS disponibles (CAGE, RAMPAGE, STRT, nanoCAGE, nanoCAGE-XL, oligo-capping), nosotros y otros hemos demostrado recientemente que CAGE es el método más imparcial para capturar verdaderos TSS con el menor número de falsos positivos9 , 10. El protocolo CAGE reciente, nAnT-iCAGE11, es el protocolo más imparcial para la generación de perfiles TSS, ya que evita cortar los fragmentos a etiquetas cortas utilizando enzimas de restricción y no utiliza amplificación de PCR. Una limitación del protocolo nAnT-iCAGE es el requisito de una gran cantidad de material de partida (por ejemplo, 5 g de ARN total para cada muestra). Para responder a preguntas específicas y biológicamente relevantes, a menudo es imposible obtener cantidades tan altas de material de partida (por ejemplo, para células clasificadas con FACS o etapas embrionarias tempranas). Por último, si nAnT-iCAGE tiene éxito, solo 1-2 ng de material de la biblioteca de ADN está disponible en cada muestra, lo que limita la profundidad de secuenciación alcanzable.
Para permitir el perfilado TSS utilizando sólo nanogramos de ARN total, recientemente hemos desarrollado Super-low Input Carrier-CAGE10 (SLIC-CAGE, Figura 1). SLIC-CAGE requiere sólo 10 ng de ARN total para obtener bibliotecas de alta complejidad. Nuestro protocolo se basa en el portador de ARN sintético cuidadosamente diseñado añadido al ARN de interés para lograr un total de 5 g de material de ARN. El portador sintético imita la biblioteca de ADN objetivo en la distribución de la longitud para evitar posibles sesgos que podrían ser causados por moléculas homogéneas en exceso. La secuencia del portador se basa en la secuencia del gen Escherichia coli leucyl-tRNA sintetasa (Tabla 1) por dos razones. En primer lugar, cualquier resto del portador en la biblioteca final, incluso si se secuencia, no se asignará a un genoma eucariota. En segundo lugar, como E. coli es una especie mesofílica, sus genes de limpieza están optimizados para el rango de temperatura adecuado para SLIC-CAGE. La secuencia portadora también está integrada con sitios de reconocimiento de endonucleasa de homing para permitir la degradación específica del ADN derivado de las moléculas de ARN portadora. La biblioteca de destino derivada de la muestra permanece intacta, ya que los sitios de reconocimiento de endonucleasa de homing son largos (I-CeuI a 27 bp; I-SceI a 18 bp) y estadísticamente poco probable que se encuentre en los genomas eucariotas. Después de la degradación específica del portador y la eliminación de fragmentos por exclusión de tamaño, la biblioteca de destino se amplifica y está lista para la secuenciación de próxima generación. Dependiendo de la cantidad de ARN inicial (1-100 ng), se espera que se requieran entre 13-18 ciclos de amplificación de PCR. La cantidad final de ADN por cada muestra oscila entre 5-50 ng, produciendo suficiente material para una secuenciación muy profunda. Cuando se utiliza sólo 1-2 ng de ARN total, se pueden detectar Verdaderos SST; sin embargo, se espera que las bibliotecas sean de menor complejidad. Por último, como SLIC-CAGE se basa en el protocolo nAnT-iCAGE11, permite la multiplexación de hasta ocho muestras antes de la secuenciación.
Para preparaciones exitosas de la biblioteca SLIC-CAGE, es fundamental utilizar puntas y tubos de baja unión para evitar la pérdida de muestras debido a la adsorción de muestras. En todos los pasos que implican la recuperación del sobrenadante, se recomienda recuperar todo el volumen de muestra. Como el protocolo tiene varios pasos, la pérdida continua de muestras dará lugar a bibliotecas sin éxito.
Si CAGE (nAnT-iCAGE) no se ha realizado de forma rutinaria, lo mejor es probar SLIC-CAGE con diferentes cantidades de entrada (10 ng, 20 ng, 50 ng, 100 ng, 200 ng) de la misma muestra total de ARN y compararlo con las bibliotecas nAnT-iCAGE que se preparan utilizando 5 g de ARN total. Si la biblioteca nAnT-iCAGE no tiene éxito (menos de 0,5-1 ng de la biblioteca de ADN obtenida por muestra), es poco probable que SLIC-CAGE funcione y que la pérdida de muestra sin batería deba minimizarse.
Un paso crítico para garantizar bibliotecas de alta calidad carentes de ARN degradado o ARNm sin acoto es el taponamiento de tapa descrito en la sección 7. Es muy importante que las perlas de estreptavidina se resuspendan a fondo en los tampones de lavado y que los tampones de lavado se retiren antes de continuar con el siguiente paso de lavado o la elución del ADNC.
Si los resultados del qPCR después de la primera ronda de degradación de portadora no muestran ninguna diferencia entre el uso de las imprimaciones adaptor_f1 y carrier_f1, se sigue recomendando continuar con el protocolo. Si después de la segunda ronda de degradación de portadora, la diferencia en los valores ct es inferior a cinco, se recomienda una tercera ronda de degradación de portadora. Nunca hemos encontrado una tercera ronda de degradación necesaria, y si se produce, se recomienda reemplazar las poblaciones de endonucleasa homing.
Se pueden añadir rondas adicionales de amplificación de PCR al protocolo si la cantidad final de la biblioteca obtenida no es suficiente para la secuenciación. La amplificación de PCR se puede ajustar con un número mínimo de ciclos de amplificación necesarios para producir suficiente material para la secuenciación, teniendo en cuenta la pérdida de muestra que no se puede evitar en la selección de tamaño. La purificación o selección de tamaño utilizando perlas magnéticas SPRI debe realizarse hasta que se eliminen todos los fragmentos pequeños (<200 bp) (si es necesario, utilice 0.6:1 perlas a la relación de muestra), y la biblioteca debe cuantificarse con Picogreen.
Las bibliotecas se pueden secuenciar en modo de extremo único o de extremo emparejado. Mediante la secuenciación de extremo emparejado, se puede obtener información sobre isoformas de transcripción. Además, como la transcripción inversa se realiza utilizando una imprimación aleatoria (TCT-N6, N6 siendo un hexamer aleatorio), la información del 3′-end secuenciado se puede utilizar como identificadores moleculares únicos (UMI) para contraer duplicados de PCR. Como se utiliza un número moderado de ciclos de amplificación de PCR (hasta 18), el uso de UMI se ha encontrado previamente innecesario.
Como el núcleo del protocolo se basa en nAnT-iCAGE11, SLIC-CAGE utiliza ocho códigos de barras. Por lo tanto, actualmente no se admite la multiplexación de más de ocho muestras. Además, tanto SLIC-CAGE como nAnT-iCAGE no son adecuados para capturar ARN inferiores a 200 bp, ya que los protocolos están diseñados para eliminar los enlaceres y artefactos PCR mediante la exclusión de tamaño con perlas AMPure XP.
SLIC-CAGE es el único método de resolución de un solo nucleótido de entrada baja imparcial para mapear los sitios de inicio de inicio de transcripción utilizando nanogramos de material de ARN total. Los métodos alternativos se basan en la actividad de conmutación de plantillas de la transcriptasa inversa al ARN tapado de código de barras en lugar de a la captura de tapa (por ejemplo, NanoCAGE15 y NanoPARE16). Debido a la conmutación de plantillas, estos métodos presentan sesgos específicos de la secuencia en la detección de TSS, lo que conduce a un mayor número de TSS falsos positivos y disminución del número de TSSs9,10.
The authors have nothing to disclose.
Este trabajo fue apoyado por la subvención Wellcome Trust (106954) otorgada a B. L. y Medical Research Council (MRC) Core Funding (MC-A652-5QA10). N. C. fue apoyado por EMBO Long-Term Fellowship (EMBO ALTF 1279-2016); E. P. contó con el apoyo del Consejo de Investigación Médica del Reino Unido; B. L. contó con el apoyo del Medical Research Council UK (MC UP 1102/1).
2-propanol, Bioultra, for molecular biology, ≥99.5% | Sigma-Aldrich | 59304-100ML-F | Used in RNAclean XP purification. |
3' linkers | Sequences are described in Murata et al 2014 and Supplementary Table 1 of this manuscript. Annealing of strands to produce 3'linkers is described in the supplementary of this protocol. | ||
5' linkers | Sequences are described in Murata et al 2014 and Supplementary Table 1 of this manuscript. Annealing of strands to produce 5'linkers is described in the supplementary of this protocol. | ||
Agencourt AMPure XP, 60 mL | Beckman Coulter | A63881 | Purification of DNA |
Agencourt RNAClean XP Kit | Beckman Coulter | A63987 | Purification of RNA and RNA:cDNA hybrids in CAGE steps. |
Axygen 0.2 mL Polypropylene PCR Tube Strips and Domed Cap Strips | Axygen (available through Corning) | PCR-0208-CP-C | Or any 8-tube PCR strips (used only for water and mixes). |
Axygen 1 x 8 strip domed PCR caps | Axygen (available through Corning) | PCR-02CP-C | Caps for PCR plates. |
Axygen 1.5 mL Maxymum Recovery Snaplock Microcentrifuge Tube | Axygen (available through Corning) | MCT-150-L-C | Low-binding 1.5 ml tubes, used for enzyme mixes or sample concentration. |
Axygen 96 well no skirt PCR microplate | Axygen (available through Corning) | PCR-96-C | Low-binding PCR plates – have to be used for all steps in the protocol. Note that plates should be cut to contain 2 x 8 wells for easier visibility of the samples |
Bioanalyzer (or Tapestation): RNA nano and HS DNA kits | Agilent | To determine quality of RNA, efficient size selection and final quality of the library (Tapestation can also be used) | |
Biotin (Long Arm) Hydrazide | Vector laboratories | SP-1100 | Biotinylation/tagging |
Cutsmart buffer | NEB | Restriction enzyme buffer | |
Deep Vent (exo-) DNA Polymerase | NEB | M0259S | Second strand synthesis |
DNA Ligation Kit, Mighty Mix | Takara | 6023 | Used for 5' and 3'-linker ligation |
dNTP mix (10 mM each) | ThermoFisher Scientific | 18427013 | dNTP mix for production of carrier templates (or any dNTPs suitable for PCR) |
Dynabeads M-270 Streptavidin | Invitrogen | 65305 | Cap-trapping. Do not use other beads as these are optimised with the buffers used. |
DynaMag-2 Magnet | ThermoFisher Scientific | 12321D | Magnetic stand for 1.5 ml tubes – used to prepare Streptavidin beads. |
DynaMag-96 Side Skirted Magnet | ThermoFisher Scientific | 12027 | Magnetic stand for PCR plates (96 well-plates) – used with cut plates to contain 2 x 8 wells. |
Ethanol, BioUltra, for molecular biology, ≥99.8% | Sigma-Aldrich | 51976-500ML-F | Used in AMPure washes. Any molecular biology suitable ethanol can be used. |
Exonuclease I (E. coli) | NEB | M0293S | Leftover primer degradation |
Gel Loading Dye, Purple (6x), no SDS | NEB | B7025S | agarose gel loading dye |
HiScribe T7 High Yield RNA Synthesis Kit | New England Biolabs | E2040S | Kit for carrier in vitro transcription |
Horizontal electrophoresis apparatus | purification of carrier DNA templates from agarose gels | ||
I-Ceu | NEB | R0699S | Homing endonuclease used for carrier degradation. |
I-SceI | NEB | R0694S | Homing endonuclease used for carrier degradation. |
KAPA HiFi HS ReadyMix (2x) | Kapa Biosystems (Supplied by Roche) | KK2601 | PCR mix for target library amplification |
KAPA SYBR FAST qPCR kit (Universal) 2x | Kapa Biosystems (Supplied by Roche) | KK4600 | qPCR mix to assess degradation efficiency and requiered number of PCR amplification cycles |
Micropipettes and multichannel micropipettes (0.1-10 µl, 1-20 µl, 20-200 µ) | Gilson | Use of Gilson with the low-binding Sorenson tips is recommended. Other micropippetes might not be compatible.. Different brand low-binding tips may not be of equal quality and may increase sample loss. | |
Microplate reader | For Picogreen concentration measurement of the final library. Microplates are used to allow small volume measurement and reduce sample waste. | ||
nuclease free water | ThermoFisher Scientific | AM9937 | Or any nuclease (DNase and RNase) free water |
PCR thermal cycler | incubation steps and PCR amplficication | ||
Phusion High-Fidelity DNA Polymerase | ThermoFisher Scientific | F530S | DNA polymerase for amplification of carrier templates (or any high fidelity polymerase) |
QIAquick Gel Extraction Kit (50) | Qiagen | 28704 | Purification of carrier PCR templates from agarose gels. |
qPCR machine | determining PCR amplification cyle number and degree of carrier degradation | ||
Quant-iT PicoGreen dsDNA Reagent | ThermoFisher Scientific | P11495 | Used to measure final library concentration – recommended as, in our hands, it is more accurate and reproducible than Qubit. |
Quick-Load Purple 100 bp DNA Ladder | NEB | N0551S | DNA ladder |
Quick-Load Purple 1 kb Plus DNA Ladder | NEB | N0550S | DNA ladder |
Ribonuclease H | Takara | 2150A | Digestion of RNA after cap-trapping. |
RNase ONE Ribonuclease | Promega | M4261 | Degradation of single stranded RNA not protected by cDNA. |
RNase-Free DNase Set | Qiagen | 79254 | Removal of carrier DNA templates after in vitro transcription. |
RNeasy Mini Kit | Qiagen | 74104 | For cleanup of carrier RNA from in vitro transcription or capping |
Sodium acetate, 1 M, aq.soln, pH 4.5 RNAse free | VWR | AAJ63669-AK | Or any nuclease (DNase and RNase) free solution |
Sodium acetate, 1 M, aq.soln, pH 6.0 RNAse free | Or any nuclease (DNase and RNase) free solution | ||
Sodium periodate | Sigma-Aldrich | 311448-100G | Oxidation of vicinal diols |
Sorenson low binding aerosol barrier tips, MicroReach Guard, volume range 10 μL, Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719390-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 1000 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719463-1000EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 20 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719412-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 200 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719447-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
SpeedVac Vacuum Concentrator | concentrating samples in various steps to lower volume | ||
SuperScript III Reverse Transcriptase | ThermoFisher Scientific | 18080044 | Used for reverse transcription (1st CAGE step) |
Trehalose/sorbitol solution | Preparation is described in Murata et al 2014. | ||
Tris-HCl, 1M aq.soln, pH 8.5 | 1 M solution, DNase and RNase free | ||
tRNA (20 mg/mL) | tRNA solution. Preparation is described in Murata et al 2014. | ||
UltraPure Low Melting Point Agarose | ThermoFisher Scientific | 16520050 | Or any suitable pure low-melt agarose. |
USB Shrimp Alkaline Phosphatase (SAP) | Applied Biosystems (Provided by ThermoFisher Scientific) | 78390500UN | |
USER Enzyme | NEB | M5505S | Degradation of 3'linker's upper strand, Uracil Specific Excision Reagent/Enzyme |
Vaccinia Capping System | NEB | M2080S | Enzymatic kit for in vitro capping of carrier molecules |
Wash buffer A | Cap trapping washes. Preparation is described in Murata et al 2014. | ||
Wash buffer B | Cap trapping washes. Preparation is described in Murata et al 2014. | ||
Wash buffer C | Cap trapping washes. Preparation is described in Murata et al 2014. |