Cap Analysis of Gene Expression (CAGE) est une méthode de cartographie quantitative à l’échelle du génome de l’ARNm 5’ends pour capturer les sites de transcription de la polymérase II de l’ARN à une résolution à un seul nucléotide. Ce travail décrit un protocole à faible apport (SLIC-CAGE) pour la génération de bibliothèques de haute qualité utilisant des quantités de nanogrammes d’ARN total.
L’analyse du capuchon de l’expression génique (CAGE) est une méthode utilisée pour la détection de résolution à un nucléotide des sites de transcription de la polymérase II de l’ARN (TSS). La détection précise des SST améliore l’identification et la découverte des principaux promoteurs. En outre, les exhausteurs actifs peuvent être détectés par des signatures d’initiation de transcription bidirectionnelle. Décrit ici est un protocole pour effectuer super-faible porteur d’entrée-CAGE (SLIC-CAGE). Cette adaptation SLIC du protocole CAGE minimise les pertes d’ARN en augmentant artificiellement la quantité d’ARN grâce à l’utilisation d’un mélange de porteurs d’ARN transcrit in vitro qui est ajouté à l’échantillon d’intérêt, permettant ainsi la préparation de la bibliothèque à partir de nanogrammes-montants de total L’ARN (c.-à-d. des milliers de cellules). Le transporteur imite la distribution prévue de la longueur des fragments de la bibliothèque d’ADN, éliminant ainsi les biais qui pourraient être causés par l’abondance d’un transporteur homogène. Dans les dernières étapes du protocole, le transporteur est retiré par dégradation avec des endonucas homing et la bibliothèque cible est amplifiée. La bibliothèque d’échantillons cibles est protégée contre la dégradation, car les sites de reconnaissance de l’endouclène sont longs (entre 18 et 27 pb), ce qui rend la probabilité de leur existence dans les génomes eucaryotes très faible. Le résultat final est une bibliothèque d’ADN prête pour le séquençage de la prochaine génération. Toutes les étapes du protocole, jusqu’au séquençage, peuvent être complétées dans les 6 jours. La préparation du transporteur nécessite une journée de travail complète; cependant, il peut être préparé en grandes quantités et conservé congelé à -80 oC. Une fois séquencées, les lectures peuvent être traitées pour obtenir des TSS à résolution mononucléotide à l’échelle du génome. Les SST peuvent être utilisés pour la découverte de promoteurs ou d’améliorateurs de base, ce qui donne un aperçu de la régulation des gènes. Une fois agrégées aux promoteurs, les données peuvent également être utilisées pour le profilage d’expression centré sur 5’centrage.
L’analyse du capuchon de l’expression génique (CAGE) est une méthode utilisée pour la cartographie à un seul nucléotide à l’échelle du génome des sites de transcription de la polymérase II de l’ARN (TSS)1. Sa nature quantitative permet également le profilage d’expression centré de 5′-fin. Les régions entourant les SST (environ 40 pb en amont et en aval) sont des promoteurs principaux et représentent l’emplacement physique où l’ARN polymérase II et les facteurs de transcription générale se lient (révisé s’il y a2,3). L’information sur l’emplacement exact des SST peut être utilisée pour la découverte des promoteurs de base et pour surveiller la dynamique des promoteurs. En outre, en tant que rehausseurs actifs présentent des signatures de transcription bidirectionnelle, les données CAGE peuvent également être utilisées pour la découverte et la surveillance de la dynamique des exhausteurs4. La méthodologie CAGE a récemment gagné en popularité en raison de son application et de son utilisation dans des projets de recherche de grande envergure tels que ENCODE5, modENCODE6, et les projets FANTOM7. En outre, l’information tSS s’avère également importante pour distinguer les tissus sains et malades, car les SST spécifiques à la maladie peuvent être utilisés à des fins diagnostiques8.
Même si plusieurs méthodes de cartographie TSS sont disponibles (CAGE, RAMPAGE, STRT, nanoCAGE, nanoCAGE-XL, oligo-capping), nous et d’autres avons récemment montré que CAGE est la méthode la plus impartiale pour capturer les vrais TSS avec le moins de faux positifs9 , 10. Le protocole CAGE récent, nAnT-iCAGE11, est le protocole le plus impartial pour le profilage TSS, car il évite de couper les fragments à des étiquettes courtes en utilisant des enzymes de restriction et n’utilise pas l’amplification PCR. Une limitation du protocole nAnT-iCAGE est l’exigence d’une grande quantité de matériel de démarrage (p. ex., 5 g d’ARN total pour chaque échantillon). Pour répondre à des questions spécifiques et pertinentes sur le plan biologique, il est souvent impossible d’obtenir des quantités aussi élevées de matériel de démarrage (p. ex., pour les cellules triées au FACS ou les stades embryonnaires précoces). Enfin, si nAnT-iCAGE réussit, seulement 1-2 ng de matériel de bibliothèque d’ADN est disponible de chaque échantillon, limitant ainsi la profondeur de séquençage réalisable.
Pour permettre le profilage TSS en utilisant seulement des nanogrammes d’ARN total, nous avons récemment développé Super-low Input Carrier-CAGE10 (SLIC-CAGE, Figure 1). SLIC-CAGE n’a besoin que de 10 ng d’ARN total pour obtenir des bibliothèques à haute complexité. Notre protocole s’appuie sur le porteur d’ARN synthétique soigneusement conçu ajouté à l’ARN d’intérêt pour atteindre un total de 5 g de matériel d’ARN. Le porteur synthétique imite la bibliothèque d’ADN cible dans la distribution de longueur pour éviter les biais potentiels qui pourraient être causés par des molécules homogènes en excès. La séquence du porteur est basée sur la séquence du gène de synthetase de leucyl-tRNA d’Escherichia coli (tableau 1) pour deux raisons. Tout d’abord, tout reste du porteur dans la bibliothèque finale, même s’il est séquencé, ne sera pas cartographié à un génome eucaryotique. Deuxièmement, comme E. coli est une espèce mésophile, ses gènes d’entretien ménager sont optimisés pour la plage de température appropriée pour SLIC-CAGE. La séquence de porteur est également incorporée avec des sites de reconnaissance d’endonuclease de homing pour permettre la dégradation spécifique de l’ADN dérivé des molécules d’ARN de porteur. La bibliothèque cible dérivée de l’échantillon demeure intacte, car les sites de reconnaissance de l’endonucléase sont longs (I-CeuI 27 pb; I-SceI 18 pb) et statistiquement peu susceptible d’être trouvé dans les génomes eucaryotes. Après la dégradation spécifique du transporteur et l’enlèvement des fragments par exclusion de taille, la bibliothèque cible est amplifiée pcR et prête pour le séquençage de la prochaine génération. Selon la quantité d’ARN de départ (1-100 ng), entre 13-18 cycles d’amplification DE PCR devraient être exigés. La quantité finale d’ADN par échantillon varie entre 5-50 ng, ce qui donne assez de matière pour un séquençage très profond. Lors de l’utilisation de seulement 1-2 ng de l’ARN total, les vrais TSS peuvent être détectés; cependant, on s’attend à ce que les bibliothèques soient moins complexes. Enfin, comme SLIC-CAGE est basé sur le protocole nAnT-iCAGE11, il permet le multiplexage de jusqu’à huit échantillons avant le séquençage.
Pour réussir les préparations de la bibliothèque SLIC-CAGE, il est essentiel d’utiliser des pointes et des tubes à faible liaison pour prévenir la perte d’échantillons due à l’adsorption de l’échantillon. Dans toutes les étapes impliquant la récupération du supernatant, il est recommandé de récupérer l’ensemble du volume de l’échantillon. Comme le protocole comporte plusieurs étapes, la perte continue d’échantillons entraînera des échecs dans les bibliothèques.
Si CAGE (nAnT-iCAGE) n’a pas été effectué régulièrement, il est préférable de tester SLIC-CAGE avec différentes quantités d’intrants (10 ng, 20 ng, 50 ng, 100 ng, 200 ng) du même échantillon total d’ARN et de comparer avec les bibliothèques nAnT-iCAGE qui sont préparées à l’aide de 5 g d’ARN total. Si la bibliothèque nAnT-iCAGE échoue (moins de 0,5-1 ng de la bibliothèque d’ADN obtenue par échantillon), SLIC-CAGE est peu susceptible de fonctionner, et la perte d’échantillon doit être réduite au minimum.
Une étape cruciale pour s’assurer que les bibliothèques de haute qualité dépourvues d’ARN ou d’ARNr dégradé non plafonné sont le piégeage du bouchon décrit à la section 7. Il est très important que les perles de streptavidin soient complètement remises en suspension dans les tampons de lavage et que les tampons de lavage soient enlevés avant de continuer à l’étape suivante de lavage ou à l’élution de l’ADC.
Si les résultats du qPCR après le premier tour de dégradation du transporteur ne montrent aucune différence entre l’utilisation d’adaptor-f1 et d’amorces de transporteur-f1, la poursuite du protocole est toujours recommandée. Si après la deuxième série de dégradation du transporteur, la différence dans les valeurs Ct est inférieure à cinq, un troisième cycle de dégradation du transporteur est recommandé. Nous n’avons jamais trouvé un troisième cycle de dégradation nécessaire, et si elle se produit, il est recommandé de remplacer les stocks d’endonuclease homing.
Des séries supplémentaires d’amplification du PCR peuvent être ajoutées au protocole si le montant final de la bibliothèque obtenue n’est pas suffisant pour le séquençage. L’amplification de PCR peut alors être fixée avec le nombre minimal de cycles d’amplification nécessaires pour produire assez de matériel pour le séquençage, en tenant compte de la perte d’échantillon qui ne peut pas être évitée dans la sélection de taille. La purification ou la sélection de taille à l’aide de perles magnétiques SPRI doit alors être effectuée jusqu’à ce que tous les petits fragments (lt;200 bp) soient enlevés (si nécessaire, utiliser 0,6:1 perles au rapport d’échantillon), et la bibliothèque doit être quantifiée à l’aide de Picogreen.
Les bibliothèques peuvent être séquencées en mode unique ou à extrémité paire. À l’aide d’un séquençage à extrémité scariée, on peut obtenir des renseignements sur les isoformes de transcription. En outre, comme la transcription inversée est effectuée à l’aide d’une amorce aléatoire (TCT-N6, N6 étant un hexamer aléatoire), les informations de l’extrémité séquentée 3′-extrémité peuvent être utilisées comme identifiants moléculaires uniques (UMI) pour effondrer les doublons PCR. Comme un nombre modéré de cycles d’amplification de PCR est utilisé (jusqu’à 18), l’utilisation des IMI s’est avérée auparavant inutile.
Comme le cœur du protocole repose sur nAnT-iCAGE11, SLIC-CAGE utilise huit codes-barres. Par conséquent, le multiplexage de plus de huit échantillons n’est actuellement pas pris en charge. En outre, les deux SLIC-CAGE et nAnT-iCAGE ne sont pas adaptés pour capturer LES ARN plus court que 200 bp, que les protocoles sont conçus pour supprimer les linkers et les artefacts PCR par la taille-exclusion avec amPure XP perles.
SLIC-CAGE est la seule méthode impartiale de résolution à un seul nucléotide à faible entrée pour cartographier les sites de démarrage de transcription à l’aide de nanogrammes de matériel d’ARN total. Les méthodes alternatives reposent sur l’activité de commutation de modèle de la transcriptase inverse pour coder à barres l’ARN plafonné au lieu de cap-piégeage (par exemple, NanoCAGE15 et NanoPARE16). En raison de la commutation de modèle, ces méthodes présentent des biais séquence-spécifiques dans la détection de TSSs, menant à un nombre accru de TSS faux positifs et à une diminution du nombre de vrais TSS9,10.
The authors have nothing to disclose.
Ces travaux ont été appuyés par la subvention du Wellcome Trust (106954) accordée à B. L. et au financement de base du Conseil de recherches médicales (CRM) (MC-A652-5QA10). N. C. a reçu le soutien de la bourse à long terme EMBO (EMBO ALTF 1279-2016); E. P. a reçu le soutien du Medical Research Council UK; B. L. a reçu le soutien du Medical Research Council UK (MC UP 1102/1).
2-propanol, Bioultra, for molecular biology, ≥99.5% | Sigma-Aldrich | 59304-100ML-F | Used in RNAclean XP purification. |
3' linkers | Sequences are described in Murata et al 2014 and Supplementary Table 1 of this manuscript. Annealing of strands to produce 3'linkers is described in the supplementary of this protocol. | ||
5' linkers | Sequences are described in Murata et al 2014 and Supplementary Table 1 of this manuscript. Annealing of strands to produce 5'linkers is described in the supplementary of this protocol. | ||
Agencourt AMPure XP, 60 mL | Beckman Coulter | A63881 | Purification of DNA |
Agencourt RNAClean XP Kit | Beckman Coulter | A63987 | Purification of RNA and RNA:cDNA hybrids in CAGE steps. |
Axygen 0.2 mL Polypropylene PCR Tube Strips and Domed Cap Strips | Axygen (available through Corning) | PCR-0208-CP-C | Or any 8-tube PCR strips (used only for water and mixes). |
Axygen 1 x 8 strip domed PCR caps | Axygen (available through Corning) | PCR-02CP-C | Caps for PCR plates. |
Axygen 1.5 mL Maxymum Recovery Snaplock Microcentrifuge Tube | Axygen (available through Corning) | MCT-150-L-C | Low-binding 1.5 ml tubes, used for enzyme mixes or sample concentration. |
Axygen 96 well no skirt PCR microplate | Axygen (available through Corning) | PCR-96-C | Low-binding PCR plates – have to be used for all steps in the protocol. Note that plates should be cut to contain 2 x 8 wells for easier visibility of the samples |
Bioanalyzer (or Tapestation): RNA nano and HS DNA kits | Agilent | To determine quality of RNA, efficient size selection and final quality of the library (Tapestation can also be used) | |
Biotin (Long Arm) Hydrazide | Vector laboratories | SP-1100 | Biotinylation/tagging |
Cutsmart buffer | NEB | Restriction enzyme buffer | |
Deep Vent (exo-) DNA Polymerase | NEB | M0259S | Second strand synthesis |
DNA Ligation Kit, Mighty Mix | Takara | 6023 | Used for 5' and 3'-linker ligation |
dNTP mix (10 mM each) | ThermoFisher Scientific | 18427013 | dNTP mix for production of carrier templates (or any dNTPs suitable for PCR) |
Dynabeads M-270 Streptavidin | Invitrogen | 65305 | Cap-trapping. Do not use other beads as these are optimised with the buffers used. |
DynaMag-2 Magnet | ThermoFisher Scientific | 12321D | Magnetic stand for 1.5 ml tubes – used to prepare Streptavidin beads. |
DynaMag-96 Side Skirted Magnet | ThermoFisher Scientific | 12027 | Magnetic stand for PCR plates (96 well-plates) – used with cut plates to contain 2 x 8 wells. |
Ethanol, BioUltra, for molecular biology, ≥99.8% | Sigma-Aldrich | 51976-500ML-F | Used in AMPure washes. Any molecular biology suitable ethanol can be used. |
Exonuclease I (E. coli) | NEB | M0293S | Leftover primer degradation |
Gel Loading Dye, Purple (6x), no SDS | NEB | B7025S | agarose gel loading dye |
HiScribe T7 High Yield RNA Synthesis Kit | New England Biolabs | E2040S | Kit for carrier in vitro transcription |
Horizontal electrophoresis apparatus | purification of carrier DNA templates from agarose gels | ||
I-Ceu | NEB | R0699S | Homing endonuclease used for carrier degradation. |
I-SceI | NEB | R0694S | Homing endonuclease used for carrier degradation. |
KAPA HiFi HS ReadyMix (2x) | Kapa Biosystems (Supplied by Roche) | KK2601 | PCR mix for target library amplification |
KAPA SYBR FAST qPCR kit (Universal) 2x | Kapa Biosystems (Supplied by Roche) | KK4600 | qPCR mix to assess degradation efficiency and requiered number of PCR amplification cycles |
Micropipettes and multichannel micropipettes (0.1-10 µl, 1-20 µl, 20-200 µ) | Gilson | Use of Gilson with the low-binding Sorenson tips is recommended. Other micropippetes might not be compatible.. Different brand low-binding tips may not be of equal quality and may increase sample loss. | |
Microplate reader | For Picogreen concentration measurement of the final library. Microplates are used to allow small volume measurement and reduce sample waste. | ||
nuclease free water | ThermoFisher Scientific | AM9937 | Or any nuclease (DNase and RNase) free water |
PCR thermal cycler | incubation steps and PCR amplficication | ||
Phusion High-Fidelity DNA Polymerase | ThermoFisher Scientific | F530S | DNA polymerase for amplification of carrier templates (or any high fidelity polymerase) |
QIAquick Gel Extraction Kit (50) | Qiagen | 28704 | Purification of carrier PCR templates from agarose gels. |
qPCR machine | determining PCR amplification cyle number and degree of carrier degradation | ||
Quant-iT PicoGreen dsDNA Reagent | ThermoFisher Scientific | P11495 | Used to measure final library concentration – recommended as, in our hands, it is more accurate and reproducible than Qubit. |
Quick-Load Purple 100 bp DNA Ladder | NEB | N0551S | DNA ladder |
Quick-Load Purple 1 kb Plus DNA Ladder | NEB | N0550S | DNA ladder |
Ribonuclease H | Takara | 2150A | Digestion of RNA after cap-trapping. |
RNase ONE Ribonuclease | Promega | M4261 | Degradation of single stranded RNA not protected by cDNA. |
RNase-Free DNase Set | Qiagen | 79254 | Removal of carrier DNA templates after in vitro transcription. |
RNeasy Mini Kit | Qiagen | 74104 | For cleanup of carrier RNA from in vitro transcription or capping |
Sodium acetate, 1 M, aq.soln, pH 4.5 RNAse free | VWR | AAJ63669-AK | Or any nuclease (DNase and RNase) free solution |
Sodium acetate, 1 M, aq.soln, pH 6.0 RNAse free | Or any nuclease (DNase and RNase) free solution | ||
Sodium periodate | Sigma-Aldrich | 311448-100G | Oxidation of vicinal diols |
Sorenson low binding aerosol barrier tips, MicroReach Guard, volume range 10 μL, Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719390-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 1000 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719463-1000EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 20 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719412-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
Sorenson low binding aerosol barrier tips, MultiGuard, volume range 200 μL , Graduated | Sorenson (available through SIGMA-ALDRICH) | Z719447-960EA | Low-binding tips – recommended use throughout the protocol to minimise sample loss. |
SpeedVac Vacuum Concentrator | concentrating samples in various steps to lower volume | ||
SuperScript III Reverse Transcriptase | ThermoFisher Scientific | 18080044 | Used for reverse transcription (1st CAGE step) |
Trehalose/sorbitol solution | Preparation is described in Murata et al 2014. | ||
Tris-HCl, 1M aq.soln, pH 8.5 | 1 M solution, DNase and RNase free | ||
tRNA (20 mg/mL) | tRNA solution. Preparation is described in Murata et al 2014. | ||
UltraPure Low Melting Point Agarose | ThermoFisher Scientific | 16520050 | Or any suitable pure low-melt agarose. |
USB Shrimp Alkaline Phosphatase (SAP) | Applied Biosystems (Provided by ThermoFisher Scientific) | 78390500UN | |
USER Enzyme | NEB | M5505S | Degradation of 3'linker's upper strand, Uracil Specific Excision Reagent/Enzyme |
Vaccinia Capping System | NEB | M2080S | Enzymatic kit for in vitro capping of carrier molecules |
Wash buffer A | Cap trapping washes. Preparation is described in Murata et al 2014. | ||
Wash buffer B | Cap trapping washes. Preparation is described in Murata et al 2014. | ||
Wash buffer C | Cap trapping washes. Preparation is described in Murata et al 2014. |