Ce protocole décrit une méthode de cartographie pré-ARNm ‘ extrémité 3 sites de traitement.
Études dans la dernière décennie ont révélé une variété complexe et dynamique de clivage de l’ARN pré-messager et réactions de polyadénylation. ARNm avec longues régions 3′ non traduite (RTNS) est générés dans les cellules différenciées tandis que les cellules en prolifération expriment préférentiellement transcrits avec court 3′ UTR. Les auteurs décrivent le protocole A-seq, maintenant à sa deuxième version, qui a été développé pour cartographier les sites de polyadénylation génome et étudier la régulation de l’ARN pré-messager 3′ fin au traitement. Ce protocole actuel tire également parti de la polyadénylate (poly(A)) de queues qui sont ajoutés au cours de la biogenèse des mammifères plus mRNA d’enrichir à l’ARNm fully-Process. Un adaptateur d’ADN avec deoxyuracil à sa quatrième position permet le traitement précis des ARNm 3′ fragments terminaux pour le séquençage. Non compris la culture de cellules et les ligature des trompes au jour le jour, le protocole exige environ 8 h de temps pratique. Avec elle, un logiciel facile à utiliser pour l’analyse des données dérivées de séquençage est fourni. A-seq2 et le logiciel d’analyse associés fournissent une solution efficace et fiable pour le mappage d’un pré-ARNm 3′ se termine par un large éventail de conditions, de 106 ou moins de cellules.
La capture et le séquençage d’ADN messagère 3′ extrémités permet l’étude du traitement de l’ARNm et la quantification de l’expression génique. En raison de leur queue poly (a), ARNm eucaryotes peut être efficacement épuré de lysats cellulaires totales avec perle-immobilisé oligo-deoxythymidine (molécules de oligo(dT)), qui peut également amorcer la synthèse d’ADNc. Toutefois, cette approche présente deux inconvénients. Tout d’abord, s’étend de A qui sont internes aux transcriptions peut également amorcer la synthèse de cDNA, résultant dans des sites parasites poly (a). Deuxièmement, homogène, poly (a) s’étire pose des défis spécifiques pour le séquençage, mis à part ne pas être instructif pour l’identification de la transcription. Différentes approches ont été proposées pour contourner ces limitations, telles que la transcription renversée par le biais de poly (a) queues suivies par digestion RNase H (3P-seq 1), utilisation d’un apprêt de séquençage personnalisé se terminant par 20 Ts (2p-seq 2), présélection des Fragments d’ARN avec queue poly (a) de plus de 50 nucléotides avec un apprêt de45 CU5T suivie de RNase H digestion (lectures de 3′ 3) et l’utilisation d’un apprêt d’oligo-dT qui contient l’adaptateur 3′ dans une épingle à cheveux (A-seq 4).
L’A-seq2 récemment mis au point la méthode 5 a pour but de contourner la séquence poly (a) et en même temps pour réduire au minimum la proportion de dimères qui sont générés par l’individu-ligature des adaptateurs, survenant en particulier lorsque la concentration molaire d’adaptateurs l’emporte sur la concentration de l’insert. Ce problème peut être éliminé lorsque les deux adaptateurs sont ligaturés au même type de polynucléotide se termine comme dans A-seq2, où les adaptateurs 3′ sont ligaturés à l’extrémité 5′ de fragments d’ARN et les adaptateurs de 5′ à 5′ extrémités des ADNc après transcription inverse. La méthode est plus pratique que notre A proposé antérieurement-seq – dont le séquençage a été dans la 5′-3′ direction exigeant donc précisément contrôlée RNA fragmentation-, tout en conservant une grande précision de poly (a) identification des sites. Environ 80 % de du est séquencé en échantillons typiques carte unique au génome et conduire à l’identification de plus 20 000 grappes site de poly (a), plus de 70 % de qui recoupait annoté 3′ UTR.
En bref, le protocole A-seq2 commence par la fragmentation de l’ARNm et ligature des adaptateurs inverse-complément 3′ à l’extrémité 5′ des fragments d’ARN. Poly (A)-ARN contenant rétroconcevez puis transcrit avec un apprêt d’oligo (décollement) long de 25 nucléotides (nt) qui contient un nucléotide de l’ancre à l’extrémité 3′, un à la position 4 et un biotine à l’extrémité 5′, permettant la liaison de l’ARNC aux billes magnétiques streptavidine. La plupart de l’amorce, y compris la biotine, est retiré de l’ADNc par clivage à par la composition de l’enzyme utilisateur contenant l’uracile DNA glycosylase (UDG) et le DNA glycosylase-lyase endonucléase VIII. Cette réaction laisse intacte se termine pour la ligature d’un adaptateur 5′ et la gauche Ts trois après clivage reste pour marquer l’emplacement de la queue poly (a). Car les adaptateurs 5′ et 3′ sont fixées par ligature aux extrémités 5′ destinataire, aucune dimères d’adaptateur ne sont générés. Quatre nucléotides aléatoire-mers a présenté au début de lectures permet la résolution de cluster sur les instruments de séquençage de l’état-of-the-art et peuvent aussi servir d’identificateur moléculaire unique (UMI) pour la détection et la suppression des artefacts d’amplification PCR. La taille de l’UMI peut être encore augmentée comme fait dans d’autres études 6. Le protocole génère les lectures qui sont inverser complémentaire de l’ARNm 3′ extrémités, tout départ avec un tétramère randomisé suivi 3 Ts. traitement des lectures qui ont les 3 Ts diagnostiques à leur extrémité commence de 5′ avec la correction des artefacts d’amplification PCR par exploiter les UMIs, suppression de séquences de 3′ adaptateur et inverser la complémentation. Lectures qui peuvent provenir de d’amorçage oligo (décollement) à des sites riches en A internes sont également identifiés par le calcul et mis au rebut. Les fausses sites manquent généralement de l’un des 18 bien caractérisés et signaux conservés poly (a) qui devraient être situé ~ 21 nucléotides en amont du clivage apparent site 7.
Le protocole exige environ 8 h de temps pratique, sans compter la culture cellulaire et les ligature des trompes pendant la nuit. Les associés lire analyse logiciel permet une identification de site de haute précision poly (a). Sur le site de poly (a) grappes créé sur 4 échantillons davantage mis en évidence dans ce manuscrit (deux réplicats biologiques des siARN contrôle et des cellules traitées au TR-HNRNPC) 84 % de chevauchement avec un gène annoté et, sur ce, 75 % de chevauchement avec un 3′ UTR et 86 % soit avec un 3′ UTR ou un terminal exon. Le coefficient de corrélation de Pearson d’expression des extrémités 3′ dans les échantillons est de 0,92 et valeurs de plus de 0,9 sont généralement obtenus par la méthode. A-seq2 est donc une méthode pratique qui donne des résultats très reproductibles.
La multitude de base et des facteurs auxiliaires qui sont impliqués dans le traitement de l’ARN pré-messager 3′ extrémité se reflète dans un paysage de polyadénylation proportionnellement complexes. En outre, polyadénylation est également sensible aux changements dans d’autres processus tels que la transcription et épissage. sites de clivage d’extrémité 3′ en pré-ARNm sont généralement identifiés basé sur la queue poly (a) typiques qui est ajoutée aux produits de clivage 5′. La plupart des méthodes utilisent des amorces oligo (décollement) de longueurs variables qui permettent la conversion spécifique de poly (A)-contenant des ARNm d’ADNc dans une réaction de transcription inverse. Un problème commun de cette approche est l’amorçage interne aux séquences riches en A aboutissant à des sites de clivage artifactual. Deux méthodes qui visent à contourner cet artefact au stade de la préparation de l’échantillon ont été proposées. Dans la méthode 3P-seq 1, adaptateurs sont spécifiquement ligaturés jusqu’aux extrémités de la queue poly (a) avec l’aide d’un attelle oligo suivi d’une digestion partielle RNase T1 et transcriptase inverse avec TTP dans la réaction comme les désoxyribonucléosides seul. L’hétéroduplex poly(A)-poly(dT) qui en résultent est ensuite digérés avec RNase H et les autres fragments d’ARN sont isolés, ligaturés aux adaptateurs et séquencés. Une méthode plus simple et élégante, 2p-seq, qui utilise un apprêt de séquençage personnalisé sauter le tronçon restant d’oligo (décollement) dans la réaction de séquençage a été rapporté par les mêmes auteurs 2. Dans une méthode associée, 3′ lit 3, un apprêt inhabituellement long de 5 45 et nous Ts, contenant également un biotine sont recuits à l’ARN fragmenté, suivie par des lavages strictes pour sélectionner des molécules d’ARN avec queue poly (a) de plus de 50 nucléotides. Bien que 3′ lectures réduit considérablement la fréquence de l’amorçage interne, il n’élimine pas complètement il 3. Protocoles pour le séquençage direct de RNA ont également été proposées, mais les lectures qui en résultent sont courtes et ont un taux élevé d’erreur et cette approche n’a pas été davantage développés 18,19,20. La PolyA-Seq et les protocoles Quant Seq commercialisés combinent oligo (décollement) fondé d’amorçage avec une étape d’amorçage aléatoire pour le deuxième brin synthèse de cDNA 20. L’utilisation de la réaction de transcription inverse de commutateur de modèle avec la transcriptase inverse du Virus de la leucémie Murine Moloney (MMLV) conduit à la génération d’ADNc avec linkers en une seule étape et ainsi aucune dimères d’adaptateur ne peuvent apparaître dans le PAS-Seq et méthodes SAPAS 21 , 22.
La méthode A-seq2 présentée ici se distingue par son utilisation d’un nucléotide CLIVABLES (dU) au sein d’une couche d’apprêt biotinylé oligo (décollement). Cette modification combine l’utilité d’enrichir les oligo (décollement) hybridé, polyadénylé cibles avec le retrait de la majeure partie de la séquence de25 oligo (dT) des fragments isolés avant que les bibliothèques sont préparés et la préservation des trois Ts, qui indiquer la présence antérieure de la queue poly (a). En revanche, les méthodes qui utilisent la RNase H pour retirer poly (a) les molécules d’ARN au hasard laissent plusieurs comme. Étant donné que dans A-seq2, séquençage est fait à partir de l’extrémité 3′ des brins anti-sens, sites de clivage sont prévus pour être situé après le motif NNNNTTT au début de la séquence brute se lit. Les tétramères aléatoires servent non seulement à permettre à base appelant mais aussi dans l’élimination d’artefacts d’amplification PCR. UMIs plus longues peuvent être hébergés. La possibilité d’amorçage interne reste en A-seq2 et est adressée par le calcul, tout d’abord, en jetant 3′ se termine par une séquence en aval génomiquement codé, riches en A et ensuite en jetant des grappes d’extrémité 3′ qui pourraient s’expliquer par l’amorçage interne à la Signal de poly (a) riches en A lui-même. Une récente analyse des sites de poly (a) déduit de manière unique par un grand nombre de protocoles indique que les sites qui sont propres à A-seq2 ont la distribution attendue nucléotides et l’emplacement dans les gènes, semblables aux autres 3′ fin des protocoles de séquençage.
Une étape cruciale dans l’A-seq2 est la sélection de polyadénylé RNA et la suppression des ARN ribosomiques et divers petits ARN. C’est plus facilement réalisable par un kit d’isolation des ARNm avec oligo (dT)25 billes magnétiques. En principe, les ARN total isolé avec du phénol contenant des solutions aussi donne ARN qui peut être encore soumis à la sélection par le kit d’ARNm-isolation ou d’agarose oligo (dT) de haute qualité. Une étape qui peut être variée en A-seq2 est le traitement par hydrolyse alcaline qui peut être raccourcie ou prolongée pour obtenir des fragments d’ARN de différentes tailles. Critique est aussi que l’ajout de dATP 3′ à 3′ extrémités des fragments d’ARN par la poly (a) polymérase est efficace. Dans le protocole décrit ici, ce traitement est appliqué à tous les fragments d’ARN, d’éviter les concatemerization au cours de la réaction de ligature. Enfin, nous notons que, bien que ligase RNA 1 est normalement utilisé comme une ligase RNA, il ligates aussi efficacement seul ADN bicaténaire, comme nous l’avons fait ici pour ligaturer un adaptateur à l’extrémité 5′ des molécules de cDNA.
A-seq2 est donc un efficace et facile à mettre en œuvre le protocole d’identification des sites de traitement l’extrémité 3′ pré-ARNm. Les développements futurs pourraient inclure réduisant davantage la complexité du protocole et de la quantité de matériel requis. Jeu d’outils d’analyse des données informatiques davantage associé permettent le traitement homogène de l’extrémité 3′ séquençage lectures obtenues avec un large éventail de protocoles.
The authors have nothing to disclose.
Les auteurs remercient Mme Béatrice Dimitriades pour aide à la culture cellulaire. Ce travail a été soutenu par la Swiss National Science Foundation subventions #31003A_170216 et 51NF40_141735 (NCCR RNA & maladie).
Materials | |||
Agarose, ultra pure | Invitrogen | 16500-500 | |
2100 Bioanalyzer | Agilent | G2940CA | |
Cordycepin triphosphate (3’ dATP) | SIGMA | C9137 | |
DNA low bind vials, 1.5 ml | Eppendorf | 22431021 | |
Dulbecco’s Phosphate Buffered Saline | SIGMA | D8637 | |
Dynabeads mRNA-DIRECT Kit | Ambion | AM61012 | |
GR-Green dye | Excellgen | EG-1071 | use 1:10,000 dillution |
HiSeq 2500 or NextSeq 500 next generation sequencers | Illumina | inquire with supplier | |
KAPA HiFi Hotstart DNA polymerase mix | KAPA/Roche | KK2602 | |
Nuclease free water | Ambion | AM9937 | |
Poly(A) polymerase, yeast | Thermo Fisher Scientific | 74225Z25KU | |
Poly(A) polymerase, E.coli | New England Biolabs | M0276L | |
Polynucleotide kinase | Thermo Fisher Scientific | EK0032 | |
QIAEX II Gel Extraction Kit | Qiagen | 20021 | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
RNA ligase 1, high concentration | New England Biolabs | M0437M | includes PEG-8000 |
RNeasy MinElute RNA Cleanup kit | Qiagen | 74204 | |
RNase H | New England Biolabs | M0279 | |
RNasin Plus, ribonuclease inhibitor | Promega | N2618 | |
Superscript IV reverse transcriptase | Thermo Fisher Scientiific | 18090050 | |
Turbo DNase | Ambion | AM2238 | |
USER enzyme mix | New England Biolabs | M5505 | |
Dyna-Mag-2 magnetic rack | Thermo Fisher Scientific | 12321D | |
Thermomixer C | Eppendorf | 5382000015 | Heated mixer with heated lid |
MicroSpin columns | GE-Healthcare | 27-5325-01 | |
Name | Company | Catalog Number | Comments |
Buffers | |||
Alkaline hydrolysis buffer, 1.5 x | Mix 1 part 0.1 M Na2CO3 and 9 parts 0.1 M NaHCO3. Add EDTA to 1 mM. Adjust pH to 9.2. Store aliquots at -20 °C. | ||
5x poly(A) polymerase buffer | Thermo Fisher Scientiific | 100 mM Tris-HCl, pH 7.0, 3 mM MnCl2, 0.1 mM EDTA, 1 mM DTT, 0.5 mg/ml acetylated BSA, 50% glycerol | |
Biotin binding buffer | 20 mM TrisCl pH 7.5, 2 M NaCl, 0.1% NP40 | ||
TEN buffer | 10 mM TrisCl, pH 7.5, 1 mM EDTA, 0.02% NP40 | ||
Name | Company | Catalog Number | Sequence |
Oligonucleotides according to Illumina TruSeq Small RNA Sample Prep Kits, for GA-IIx and Hiseq2000/2500 sequencers | Microsynth | ||
revRA3 (RNA) | Microsynth | 5’ amino CCUUGGCACCCGAGAAUUCCA 3’ | |
revDA5 | Microsynth | 5’ amino GTTCAGAGTTCTACAGTCCGAC GATCNNNN-3’ | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' (V = G, A or C) | |
PCR primer forward, RP1 | Microsynth | 5' AATGATACGGCGACCACCGAGA TCTACACGTTCAGAGTTCTACAGTC CGA 3' | |
PCR primer reverse, RPI1, barcode in bold | Microsynth | 5' CAAGCAGAAGACGGCATACGAGA TCGTGATGTGACTGGAGTTCCTTG GCACCCGAGAATTCCA 3' | |
Name | Company | Catalog Number | Comments |
Oligonucleotides according to Illumina TruSeq HT-Small RNA Sample Prep Kits, for HiSeq2000/2500 and NextSeq500 sequencers | |||
HT-rev3A (DNA/RNA) | Microsynth | 5'-amino-GTGACTGGAGTTCAGACGTGTGCT CTTCCrGrAUrC-3' | |
HT-rev5A | Microsynth | 5' amino-ACACTCTTTCCCTACACGACGCTCT TCCGATCTNNNN 3' | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' | |
PCR primers forward (D501-506) | Microsynth or Illumina | 5'-AATGATACGGCGACCACCGAGAT CTACAC[i5]ACACTCTTTCCCTACAC GACGCTCTTCCGATCT -3' | |
PCR primers reverse (D701-D712) | Microsynth or Illumina | 5'-CAAGCAGAAGACGGCATACGAG A[i7]GTGACTGGAGTTCAGACGTG TGCTCTTCCGATC-3' | |
Documentation for Illumina multiplexing: | Illumina | https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf |