Este protocolo descreve um método para mapeamento pre-mRNA’ a extremidade 3 sites de processamento.
Estudos na última década têm revelado uma variedade complexa e dinâmica de clivagem pre-mRNA e reações de poliadenilação. mRNAs com tempo de 3′ não regiões (UTRs) são gerados em células diferenciadas, Considerando que pilhas proliferating preferencialmente expressam transcrições com curta 3′ UTRs. Descrevemos o protocolo A-seq, agora em sua segunda versão, que foi desenvolvido para mapear os sítios de poliadenilação todo o genoma e estudar o Regulamento de pre-mRNA 3′ processamento final. Também este protocolo atual aproveita o polyadenylate (poly(A)) caudas que são adicionadas durante a biogênese dos mRNAs mamíferos mais enriquecer para mRNAs totalmente transformados. Um adaptador de DNA com deoxyuracil em sua quarta posição permite o processamento preciso de mRNA 3′ final fragmentos para sequenciamento. Não incluindo a cultura de células e a ligadura durante a noite, o protocolo exige cerca de 8 h tempo hands-on. Junto com ele, é fornecido um pacote de software easy-to-use para a análise dos dados de sequenciamento derivada. A-seq2 e o software de análise associado fornecem uma solução eficiente e confiável para o mapeamento de pre-mRNA 3′ termina em uma ampla gama de condições, a partir de 106 ou menos células.
A captura e sequenciamento de mRNA 3′ extremidades permite o estudo do processamento do mRNA e a quantificação da expressão gênica. Devido a suas caudas poli, mRNAs eucarióticos podem ser eficientemente purificados de lisado celular total com grânulo-imobilizado oligo-cromatografia (moléculas oligo(dT)), que também pode aprontar a síntese do cDNA. No entanto, esta abordagem tem dois inconvenientes. Primeiro, trechos de A’s que são interno para transcrições também podem prime síntese do cDNA, resultando em sites de poli espúrias. Poli (a) homogênea, segundo trechos representam desafios específicos para sequenciamento, além de não ser informativo para identificação de transcrição. Várias abordagens têm sido propostas para contornar essas limitações, tais como a transcrição reversa através de poli caudas seguidas por digestão RNase H (3P-seq. 1), uso de um primer de sequenciamento personalizado terminando em 20 Ts (2P-seq. 2), pré-selecção de Fragmentos de RNA com caudas poli (a) de mais de 50 nucleótidos com um primer de45 CU5T seguido por digestão RNase H (3′ leituras 3) e o uso de um primer de oligo-dT que contém o adaptador 3′ em um grampo de cabelo (A-seq. 4).
O recentemente desenvolvido A-seq2 método 5 destina-se a ignorar o sequenciamento através de poli (a) e ao mesmo tempo minimizar a proporção de dímeros são gerados pelo auto ligadura dos adaptadores, ocorrendo especialmente quando a concentração molar de adaptadores supera a concentração de inserção. Este problema pode ser eliminado quando ambos os adaptadores são ligados para o mesmo tipo de polinucleotídicas termina como em A-seq2, onde os 3′ adaptadores são ligados à extremidade 5′ do RNA fragmentos e os adaptadores de 5′ para 5′ extremidades dos cDNAs após a transcrição reversa. O método é mais conveniente do que a nossa anteriormente proposto A-seq – no qual sequenciamento foi no 5′-para-3′ direção que exige precisamente controlado RNA fragmentação-, mantendo uma alta precisão de identificação de site do poli (a). Cerca de 80% das leituras sequenciais em amostras típicas mapear com exclusividade para o genoma e levar a identificação de mais de 20.000 clusters poli local, mais de 70% das quais se sobrepõem com anotada 3′ UTRs.
Em breve, o protocolo A-seq2 começa com fragmentação de mRNA e ligadura dos adaptadores reverso-complemento 3′ para as extremidades 5′ de fragmentos de RNA. Poli (A)-contendo RNAs são então reversos transcritas com um primer de longa (descolamento) oligo 25 nucleotídeos (nt) que contém um nucleotídeo âncora na extremidade 3′, um dU na posição 4 e uma biotina na extremidade 5′, que permite a ligação do cDNA de grânulos magnético estreptavidina. A maioria da primeira demão, incluindo a biotina, é removido o cDNA por clivagem em dU por mistura de enzima do usuário, contendo Uracil DNA glycosylase (UDG) e o DNA glycosylase-liase Endonuclease VIII. Esta reação deixa extremidades intactas para a ligadura de um adaptador de 5′ e 3 Ts esquerda após clivagem permanecem marcar o local da cauda poli (a). Porque tanto 5′ e 3′ adaptadores são anexados pela ligadura para destinatário 5′ extremidades, dímeros nenhum adaptador são gerados. Quatro nucleótidos aleatório-mers introduzidos no início de leituras permite a resolução de cluster em instrumentos de sequenciamento de estado-da-arte e também pode servir como identificador exclusivo molecular (UMI) para a detecção e remoção de artefatos de amplificação do PCR. O tamanho do UMI pode ser aumentado como feito em outros estudos 6. O protocolo gera leituras que são inverter complementar ao mRNA 3′ extremidades, tudo iniciando com um tetrâmero randomizado, seguido por 3 Ts. processamento de leituras que têm os 3 Ts diagnósticos no final inicia sua 5′ com a correção de artefatos de amplificação do PCR por explorando os UMIs, remoção de sequências de 3′ adaptador e reverter a complementação. Leituras que podem ter se originado de escorva de oligo (descolamento) em sites internos A rica também são identificadas computacionalmente e descartadas. Os sites espúrios geralmente faltam um dos 18 bem caracterizadas e conservada poli sinais que devem ser localizado ~ 21 nucleotídeos upstream da clivagem aparente local 7.
O protocolo exige cerca de 8 h tempo hands-on, sem contar com a cultura de células e a ligadura durante a noite. O associado Leia análise software permite uma identificação de site poli altamente precisos. Do site da poli aglomerados criados com baseados em 4 amostras mais destacadas nesta sobreposição de 84% do manuscrito (duas repetições biológicos de controle siRNA e si-HNRNPC-tratada células) com um gene anotado e destes, 75% de sobreposição com um 3′ UTR e 86% com qualquer um 3′ UTR ou um terminal exon. O coeficiente de correlação de Pearson de expressão de 3′ extremidades nas amostras de replicar é 0,92, e valores de acima de 0,9 normalmente são obtidos com o método. Assim, A-seq2 é um método conveniente que dá resultados muito reprodutíveis.
A multidão de núcleo e fatores auxiliares que estão envolvidos no processamento de pre-mRNA 3′ final é refletida em uma paisagem de poliadenilação correspondentemente complexo. Além disso, poliadenilação também é sensível a mudanças em outros processos como transcrição e emenda. 3′ sites de clivagem final em pre-mRNAs são normalmente identificados com base nas caudas poli característicos que são adicionadas aos produtos de clivagem 5′. A maioria dos métodos usar primers oligo (descolamento) de comprimentos variáveis que permitem a conversão específica de poli (A)-contendo mRNAs de cDNAs em uma reação de transcrição reversa. Um problema comum desta abordagem é interna escorva para sequências A rica resultando em sítios de clivagem diferente. Dois métodos que visam contornar este artefato na fase de preparação da amostra têm sido propostos. No método 3P-seq 1, adaptadores são especificamente ligados às extremidades de caudas poli (a) com a ajuda de uma tala oligo seguido por digestão parcial de RNase T1 e transcrição reversa com TTP na reação como a única deoxynucleotide. As resultante poly(A)-poly(dT) heteroduplexes são então digeridos com RNase H e os restantes fragmentos de RNA são isolados, ligados a adaptadores e sequenciados. Um método mais simples e elegante, 2P-seq, que usa uma cartilha de sequenciamento personalizado saltando o trecho restante de oligo (descolamento) na reação de sequenciamento foi relatado pelo mesmo autores 2. Em um método relacionado, 3′ lê 3, um primer extraordinariamente longo de 5 nós e 45 Ts, também contendo uma biotina são recozidos para RNA fragmentado, seguido de lavagens rigorosas para selecionar para moléculas de RNA com caudas poli (a) de mais de 50 nucleótidos. Embora 3′ leituras reduz drasticamente a frequência de escorva interna, ela não completamente elimina- 3. Protocolos para a sequenciação do ARN direto também têm sido propostos, mas o lê resultante é curto e têm uma alta taxa de erro e essa abordagem não tem sido ainda mais desenvolvidos 18,19,20. A PolyA-Seq e os protocolos de Quant Seq comercializados combinam escorva (descolamento) oligo baseado com um passo de escorva aleatórios para a segunda vertente do cDNA síntese 20. O uso da reação de transcrição reversa do interruptor de modelo com a transcriptase reversa Moloney Murine leucemia vírus (MMLV) leva à geração de cDNAs com linkers em uma única etapa e desse modo não dímeros de adaptador podem aparecer no PAS-Seq e métodos SAPAS 21 , 22.
O método A-seq2 apresentado aqui se destaca em sua utilização de um nucleotídeo cleavable (dU) dentro de uma cartilha de oligo (descolamento) biotinilado. Esta modificação combina o utilitário de enriquecimento de oligo (descolamento) hibridizada, polyadenylated alvos com a remoção da maioria dos25 sequência oligo (dT) dos fragmentos isolados antes de bibliotecas são preparadas e a preservação de três Ts, que indica a presença anterior da cauda poli (a). Em contraste, métodos que utilizam o RNase H para retirar poli (a) as moléculas de RNA aleatoriamente deixam vários como. Desde em A-seq2, sequenciamento é feito da extremidade 3′ dos fios antisenso, sítios de clivagem são preditos para ser localizado após o motivo NNNNTTT no início da sequência primas leituras. Os estudo randomizados tetrâmeros servem não só para permitir base chamando mas também na eliminação de artefatos de amplificação do PCR. Mais UMIs também podem ser acomodados. A possibilidade de escorva interna permanece em A-seq2 e é dirigida computacionalmente, primeiro descartando 3′ termina com uma sequência de jusante codificado em genomically, A rica e, em seguida, descartando 3′ clusters de final que poderiam ser explicadas pela ferragem interna na Sinal de poli A-ricos em si. Uma análise recente de sites de poli inferida com exclusividade por um grande número de protocolos indica que os sites que são exclusivos para A-seq2 têm o nucleotídeo esperada distribuição e localização dentro de genes, semelhantes a outros 3′ acabar com protocolos de sequenciamento.
Um passo fundamental na-seq2 é a seleção de polyadenylated RNA e remoção de RNAs ribossomal e vários pequenos RNAs. Isso é feito facilmente por um kit de mRNA-isolamento com grânulos magnético de oligo (dT)25 . Em princípio, o RNA total isolado com fenol contendo soluções também dá alta qualidade do RNA que pode ser ainda mais sujeitos a seleção pelo kit de isolamento do mRNA ou agarose oligo (dT). Uma etapa que pode ser variada em A-seq2 é o tratamento com hidrólise alcalina, que pode ser reduzido ou estendido para obter fragmentos de RNA de tamanhos diferentes. Crítica também é que a adição de dATP 3′ para 3′ extremidades dos fragmentos de RNA pelo polymerase de poli é eficiente. O protocolo descrito aqui, este tratamento é aplicado para todos os fragmentos de RNA, para evitar concatemerization durante a reação de ligadura. Finalmente, notamos que, embora ligase RNA 1 é normalmente usado como um ligase do RNA, também ligates eficientemente único ADN encalhado, como fizemos aqui para ligar um adaptador à extremidade 5′ das moléculas de cDNA.
Assim, A-seq2 é um eficiente e fácil de implementar o protocolo para a identificação de pre-mRNA’ a extremidade 3 sites de processamento. Os desenvolvimentos futuros podem incluir reduzindo ainda mais a complexidade do protocolo e a quantidade de material necessário. O conjunto associado de ferramentas de análise de dados computacionais mais habilitar o processamento homogêneo de 3′ fim leituras obtidas com uma grande variedade de protocolos de sequenciamento.
The authors have nothing to disclose.
Os autores agradecer dona Béatrice Dimitriades ajuda com a cultura de células. Este trabalho foi financiado pela Fundação de ciência nacional Suíça concede #31003A_170216 e 51NF40_141735 (RNA NCCR & doença).
Materials | |||
Agarose, ultra pure | Invitrogen | 16500-500 | |
2100 Bioanalyzer | Agilent | G2940CA | |
Cordycepin triphosphate (3’ dATP) | SIGMA | C9137 | |
DNA low bind vials, 1.5 ml | Eppendorf | 22431021 | |
Dulbecco’s Phosphate Buffered Saline | SIGMA | D8637 | |
Dynabeads mRNA-DIRECT Kit | Ambion | AM61012 | |
GR-Green dye | Excellgen | EG-1071 | use 1:10,000 dillution |
HiSeq 2500 or NextSeq 500 next generation sequencers | Illumina | inquire with supplier | |
KAPA HiFi Hotstart DNA polymerase mix | KAPA/Roche | KK2602 | |
Nuclease free water | Ambion | AM9937 | |
Poly(A) polymerase, yeast | Thermo Fisher Scientific | 74225Z25KU | |
Poly(A) polymerase, E.coli | New England Biolabs | M0276L | |
Polynucleotide kinase | Thermo Fisher Scientific | EK0032 | |
QIAEX II Gel Extraction Kit | Qiagen | 20021 | |
QIAquick PCR Purification Kit | Qiagen | 28104 | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | |
RNA ligase 1, high concentration | New England Biolabs | M0437M | includes PEG-8000 |
RNeasy MinElute RNA Cleanup kit | Qiagen | 74204 | |
RNase H | New England Biolabs | M0279 | |
RNasin Plus, ribonuclease inhibitor | Promega | N2618 | |
Superscript IV reverse transcriptase | Thermo Fisher Scientiific | 18090050 | |
Turbo DNase | Ambion | AM2238 | |
USER enzyme mix | New England Biolabs | M5505 | |
Dyna-Mag-2 magnetic rack | Thermo Fisher Scientific | 12321D | |
Thermomixer C | Eppendorf | 5382000015 | Heated mixer with heated lid |
MicroSpin columns | GE-Healthcare | 27-5325-01 | |
Name | Company | Catalog Number | Comments |
Buffers | |||
Alkaline hydrolysis buffer, 1.5 x | Mix 1 part 0.1 M Na2CO3 and 9 parts 0.1 M NaHCO3. Add EDTA to 1 mM. Adjust pH to 9.2. Store aliquots at -20 °C. | ||
5x poly(A) polymerase buffer | Thermo Fisher Scientiific | 100 mM Tris-HCl, pH 7.0, 3 mM MnCl2, 0.1 mM EDTA, 1 mM DTT, 0.5 mg/ml acetylated BSA, 50% glycerol | |
Biotin binding buffer | 20 mM TrisCl pH 7.5, 2 M NaCl, 0.1% NP40 | ||
TEN buffer | 10 mM TrisCl, pH 7.5, 1 mM EDTA, 0.02% NP40 | ||
Name | Company | Catalog Number | Sequence |
Oligonucleotides according to Illumina TruSeq Small RNA Sample Prep Kits, for GA-IIx and Hiseq2000/2500 sequencers | Microsynth | ||
revRA3 (RNA) | Microsynth | 5’ amino CCUUGGCACCCGAGAAUUCCA 3’ | |
revDA5 | Microsynth | 5’ amino GTTCAGAGTTCTACAGTCCGAC GATCNNNN-3’ | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' (V = G, A or C) | |
PCR primer forward, RP1 | Microsynth | 5' AATGATACGGCGACCACCGAGA TCTACACGTTCAGAGTTCTACAGTC CGA 3' | |
PCR primer reverse, RPI1, barcode in bold | Microsynth | 5' CAAGCAGAAGACGGCATACGAGA TCGTGATGTGACTGGAGTTCCTTG GCACCCGAGAATTCCA 3' | |
Name | Company | Catalog Number | Comments |
Oligonucleotides according to Illumina TruSeq HT-Small RNA Sample Prep Kits, for HiSeq2000/2500 and NextSeq500 sequencers | |||
HT-rev3A (DNA/RNA) | Microsynth | 5'-amino-GTGACTGGAGTTCAGACGTGTGCT CTTCCrGrAUrC-3' | |
HT-rev5A | Microsynth | 5' amino-ACACTCTTTCCCTACACGACGCTCT TCCGATCTNNNN 3' | |
Bio-dU-dT25, RT primer | Microsynth | 5' Biotin-TTTTTTTTTTTTTTTTTTTTTTTTTT-dU-TTTVN 3' | |
PCR primers forward (D501-506) | Microsynth or Illumina | 5'-AATGATACGGCGACCACCGAGAT CTACAC[i5]ACACTCTTTCCCTACAC GACGCTCTTCCGATCT -3' | |
PCR primers reverse (D701-D712) | Microsynth or Illumina | 5'-CAAGCAGAAGACGGCATACGAG A[i7]GTGACTGGAGTTCAGACGTG TGCTCTTCCGATC-3' | |
Documentation for Illumina multiplexing: | Illumina | https://support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences_1000000002694-01.pdf |