Il protocollo fornisce istruzioni per modificare l’RNA con dimetilsolfato per esperimenti di profilazione mutazionale. Include il sondaggio in vitro e in vivo con due metodi alternativi di preparazione della libreria.
Il ruolo della struttura dell’RNA praticamente in qualsiasi processo biologico è diventato sempre più evidente, specialmente nell’ultimo decennio. Tuttavia, gli approcci classici per risolvere la struttura dell’RNA, come la cristallografia dell’RNA o la crio-EM, non sono riusciti a tenere il passo con il campo in rapida evoluzione e la necessità di soluzioni ad alto rendimento. Profilo mutazionale con sequenziamento mediante dimetilsolfato (DMS) MaPseq è un approccio basato sul sequenziamento per dedurre la struttura dell’RNA dalla reattività di una base con DMS. Il DMS metila l’azoto N1 nelle adenosine e l’N3 nelle citosine sulla loro faccia di Watson-Crick quando la base non è spaiata. La trascrizione inversa dell’RNA modificato con la trascrittasi inversa dell’introne termostabile di gruppo II (TGIRT-III) porta all’incorporazione delle basi metilate come mutazioni nel cDNA. Quando si sequenzia il cDNA risultante e lo si rimappone a una trascrizione di riferimento, i tassi di mutazione relativi per ciascuna base sono indicativi dello “stato” della base come accoppiata o non accoppiata. Anche se le reattività del DMS hanno un elevato rapporto segnale-rumore sia in vitro che nelle cellule, questo metodo è sensibile alla distorsione nelle procedure di manipolazione. Per ridurre questo pregiudizio, questo articolo fornisce un protocollo per il trattamento dell’RNA con DMS nelle cellule e con RNA trascritto in vitro .
Dalla scoperta che l’RNA ha proprietà sia strutturali1,2 che catalitiche3, l’importanza dell’RNA e la sua funzione regolatrice in una pletora di processi biologici sono stati gradualmente scoperti. In effetti, l’effetto della struttura dell’RNA sulla regolazione genica ha guadagnato crescente attenzione4. Come le proteine, l’RNA ha strutture primarie, secondarie e terziarie, riferendosi rispettivamente alla sequenza di nucleotidi, alla mappatura 2D delle interazioni di accoppiamento di basi e al ripiegamento 3D di queste strutture accoppiate di basi. Mentre determinare la struttura terziaria è la chiave per comprendere i meccanismi esatti alla base dei processi dipendenti dall’RNA, la struttura secondaria è anche altamente informativa sulla funzione dell’RNA ed è la base per un ulteriore ripiegamento 3D5.
Tuttavia, determinare la struttura dell’RNA è stato intrinsecamente impegnativo con gli approcci convenzionali. Mentre per le proteine, la cristallografia, la risonanza magnetica nucleare (NMR) e la microscopia elettronica criogenica (crio-EM) hanno permesso di determinare la diversità dei motivi strutturali, consentendo la previsione della struttura dalla sola sequenza6, questi approcci non sono ampiamente applicabili agli RNA. In effetti, gli RNA sono molecole flessibili con elementi costitutivi (nucleotidi) che hanno molta più libertà conformazionale e rotazionale rispetto alle loro controparti aminoacidiche. Inoltre, le interazioni attraverso l’accoppiamento di basi sono più dinamiche e versatili di quelle dei residui di amminoacidi. Di conseguenza, gli approcci classici hanno avuto successo solo per RNA relativamente piccoli con strutture ben definite e altamente compatte7.
Un altro approccio per determinare la struttura dell’RNA è attraverso il sondaggio chimico combinato con il sequenziamento di nuova generazione (NGS). Questa strategia genera informazioni sullo stato di legame di ciascuna base in una sequenza di RNA (cioè la sua struttura secondaria). In breve, le basi in una molecola di RNA che non sono impegnate nell’accoppiamento di basi sono modificate in modo differenziale da piccoli composti chimici. La trascrizione inversa di questi RNA con trascrittasi inverse specializzate (RT) incorpora le modifiche in acido desossiribonucleico complementare (cDNA) come mutazioni. Queste molecole di cDNA vengono poi amplificate dalla reazione a catena della polimerasi (PCR) e sequenziate. Per ottenere informazioni sul loro “stato” come legato o non legato, le frequenze di mutazione in ciascuna base in un RNA di interesse sono calcolate e inserite nel software di previsione della struttura come vincoli8. Sulla base delle regole del vicino più vicino9 e dei calcoli dell’energia libera minima 10, questo software genera modelli di struttura che meglio si adattano ai dati sperimentali ottenuti11,12.
DMS-MaPseq utilizza DMS, che metila l’azoto N1 nelle adenosine e l’azoto N3 nelle citosine sulla loro faccia di Watson-Crick in modo altamente specifico13. L’uso della trascrittasi inversa dell’introne termostabile del gruppo II (TGIRT-III) nella trascrizione inversa crea profili mutazionali con rapporti segnale-rumore senza precedenti, consentendo anche la deconvoluzione di profili sovrapposti generati da due o più conformazioni alternative14,15. Inoltre, il DMS può penetrare nelle membrane cellulari e in interi tessuti, rendendo possibile il sondaggio all’interno di contesti fisiologici. Tuttavia, la generazione di dati di buona qualità è impegnativa, poiché le variazioni nella procedura di gestione possono influire sui risultati. Pertanto, forniamo un protocollo dettagliato per DMS-MaPseq sia in vitro che in cellula per ridurre i pregiudizi e guidare i nuovi arrivati al metodo attraverso le difficoltà che possono incontrare. Soprattutto alla luce della recente pandemia di SARS-CoV2, i dati di alta qualità sui virus a RNA sono uno strumento importante per studiare l’espressione genica e trovare possibili terapie.
Il protocollo qui descrive come sondare l’RNA in vitro e nelle cellule utilizzando esperimenti di profilazione mutazionale DMS. Inoltre, fornisce istruzioni su come preparare le librerie per il sequenziamento Illumina per generare dati gene-specifici e analizzare i file .fastq ottenuti. Inoltre, è possibile utilizzare approcci di libreria a livello di genoma. Tuttavia, la RT-PCR gene-specifica produce dati di altissima qualità e più robusti. Pertanto, quando si confrontano tra campioni, è importante assicurarsi che siano preparati con strategie di sequenziamento identiche, poiché la generazione della libreria causa alcune distorsioni. La riproducibilità deve sempre essere misurata utilizzando repliche.
Diverse precauzioni
L’RNA è una molecola instabile che è sensibile alla degradazione sia attraverso temperature elevate che da parte delle RNasi. Pertanto, si raccomandano misure speciali – l’uso di dispositivi di protezione individuale (DPI), materiale privo di RNAsi e inibitori della RNAsi. Ancora più importante, l’RNA dovrebbe essere tenuto sul ghiaccio quando possibile. Questo vale soprattutto per l’RNA metilato, che è ancora più sensibile alle alte temperature.
È importante confermare che la struttura dell’RNA di interesse non è sensibile alla concentrazione di DMS e alle condizioni tampone. Tamponi come 100 mM Tris, 100 mM MOPS e 100 mM HEPES a pH 7-7,5 danno un segnale elevato ma potrebbero non essere sufficienti per mantenere il pH durante la reazione21. Poiché il DMS si idrolizza in acqua, che diminuisce il pH, un tampone forte è fondamentale per mantenere un pH neutro durante la reazione di modifica. L’aggiunta di bicina ha dimostrato di aiutare a mantenere il pH leggermente basico21 , ma si traduce in una bassa modifica del DMS su Gs e Us, che potrebbe essere informativa ma dovrebbe essere analizzata separatamente a causa della produzione di un segnale molto più basso di As e Cs e non è discusso ulteriormente in questo protocollo.
Nella RT-PCR gene-specifica, l’RNA modificato viene trascritto inversamente nel DNA e amplificato in frammenti mediante PCR. Mentre la dimensione dell’RNA può teoricamente essere illimitata, questi frammenti PCR non dovrebbero superare una lunghezza di 400-500 coppie di basi (bp) per prevenire la distorsione durante la reazione di trascrizione inversa. Idealmente, i frammenti dovrebbero rientrare nell’ambito del sequenziamento (cioè, se il sequenziamento viene condotto utilizzando un programma di sequenziamento paired-end a ciclo 150 x 150, un singolo frammento non dovrebbe superare i 300 bp). Quando si utilizzano programmi di sequenziamento con meno cicli, i prodotti PCR possono essere frammentati utilizzando una dsDNasi. Inoltre, poiché le sequenze all’interno delle sequenze di primer non contengono alcuna informazione strutturale, i frammenti devono sovrapporsi quando l’RNA sondato comprende >1 frammento. Le reazioni RT possono contenere più primer RT per frammenti diversi (fino a 10 diversi primer RT). A seconda delle sequenze, il raggruppamento dei primer RT può rendere la trascrizione inversa meno efficiente, ma in genere funziona bene. Ogni reazione PCR deve essere condotta separatamente.
Quando si sonda l’RNA con DMS, le condizioni sperimentali svolgono un ruolo aggiuntivo, poiché molti RNA sono termodinamicamente instabili e cambiano la loro conformazione in base a fattori ambientali come la temperatura. Per evitare irregolarità, le condizioni sperimentali dovrebbero essere mantenute il più possibile costanti, anche per quanto riguarda i tempi di reazione. Le condizioni tampone sembrano essere scambiabili in una certa misura 17,20,22,23 quando vengono mantenute le condizioni di base — la capacità tampone e la presenza di ioni monovalenti (Na) e bivalenti (Mg) — per garantire il corretto ripiegamento dell’RNA 24.
Per quanto riguarda la preparazione in libreria di RNA modificati, diversi aspetti devono essere presi in considerazione. In primo luogo, come accennato in precedenza, gli RNA modificati sono meno stabili delle loro controparti non modificate, il che significa che potrebbero richiedere l’ottimizzazione dei tempi di frammentazione per una distribuzione ottimale delle dimensioni dei frammenti. Inoltre, alcuni kit di preparazione della libreria di RNA, così come molti altri approcci RNAseq, utilizzano primer casuali nel kit di trascrizione inversa. Ciò potrebbe portare a una minore copertura del riferimento, specialmente nei 3′ di un gene e, in definitiva, a una profondità di copertura insufficiente. Se la copertura di una determinata regione è troppo bassa, potrebbe essere necessario rimuovere tali basi dalla previsione della struttura. Oltre ai kit RT-PCR e RNAseq dell’intero genoma, possono essere utilizzati altri approcci di preparazione della libreria. I protocolli che includono la legatura di adattatori 3′ e/o 5′ all’RNA sono vantaggiosi quando si utilizzano piccoli frammenti di RNA o quando si deve evitare la perdita di informazioni di sondaggio nelle regioni di primer.
Infine, l’analisi degli esperimenti di sondaggio chimico deve sempre essere interpretata con attenzione. Attualmente, non esiste un software che preveda la struttura dell’RNA di qualsiasi RNA dalla sola sequenza con elevata precisione. Sebbene i vincoli del sondaggio chimico migliorino notevolmente l’accuratezza, generare buoni modelli per RNA lunghi (>500 nt) è ancora impegnativo. Questi modelli dovrebbero essere ulteriormente testati con altri approcci e/o mutagenesi. Il software di predizione dell’RNA ottimizza per il numero massimo di coppie di basi, penalizzando così significativamente le conformazioni aperte, che potrebbero non rappresentare accuratamente il ripiegamento dell’RNA5. Pertanto, il modello di struttura ottenuto dovrebbe essere testato quantificando l’accordo di previsione con i dati di sondaggio chimico sottostanti (ad esempio, da AUROC) e tra le repliche (ad esempio, da mFMI), come esemplificato da Lan et al.20.
Idealmente, diversi esperimenti in diversi sistemi per sfidare il modello di struttura ottenuto dovrebbero essere utilizzati per rafforzare la propria ipotesi. Questi possono includere l’uso di approcci in vitro e in-cellula , mutazioni compensative e diverse linee cellulari e specie. Inoltre, le reattività grezze sono spesso altrettanto o addirittura più informative delle previsioni di struttura, poiché registrano l’istantanea della “verità sul terreno” dell’insieme di ripiegamento dell’RNA. In quanto tali, le reattività grezze sono molto adatte e informative per confrontare i cambiamenti di struttura tra diverse condizioni. È importante sottolineare che le strutture a più bassa energia libera calcolate utilizzando vincoli di sondaggio chimico con previsione computazionale dovrebbero essere utilizzate solo come ipotesi di partenza verso un modello di struttura completo.
The authors have nothing to disclose.
Nessuno
1 Kb Plus DNA Ladder | 10787018 | Thermo | |
2-mercaptoethanol | M6250-250ML | Sigma | |
Acid-Phenol:Chloroform, pH 4.5 | AM9720 | Thermo | |
Advantage PCR | 639206 | Takara | |
CloneAmp HiFi PCR Premix | 639298 | Takara | |
DMS | D186309 |
Sigma | |
dNTPs 10 mM each | U151B | Promega | |
E-Gel EX Agarose Gels, 2% | G402022 | Thermo | precast agarose gels |
Ethanol (200 proof) | E7023-4X4L | Sigma | |
Falcon tubes, 15 mL, 50 mL | |||
GlycoBlue | co-precipitant | ||
HCT-8 cells | ATCC #CCL-244 | ||
Invitrogen MgCl2 (1 M) | AM9530G | fisherscientific | |
Isopropanol | 278475 | Sigma | |
Megascript T7 transcription | AM1334 | Thermo | |
NanoDrop spectrophotometer | |||
Novex TBE Gels, 8%, 10 well | EC6215BOX | Thermo | |
OC43 | ATCC #VR-1558 | ||
RiboRuler Low Range RNA Ladder | SM1831 | Thermo | |
RNAse H | M0297L | NEB | |
Sodium Cacodylate, 0.4 M, pH 7.2 | 102090-964 | VWR | |
Sodium hydroxide solution | S8263-150ML | Sigma | |
SuperScript II Reverse Transcriptase for FSB and DTT | 18064014 | Thermo | |
TGIRT-III Enzyme | TGIRT50 | Ingex | |
The Oligo Clean & Concentrator | D4060 | Genesee | |
The RNA Clean & Concentrator kits are RNA clean up kits | R1016 | Genesee | |
TRIzol Reagents | 15596018 | Thermo | RNA isolation reagent |
Water, (For RNA Work) (DEPC-Treated, DNASE, RNASE free/Mol. Biol.) | BP561-1 | fisherscientific | |
xGen Broad-range RNA Library Prep 16rxn | 10009865 | IDT | |
Zymo RNA clean and concentrator columns |