Das Protokoll enthält Anweisungen zur Modifizierung von RNA mit Dimethylsulfat für Mutationsprofilierungsexperimente. Es umfasst in vitro und in vivo Sondierung mit zwei alternativen Bibliothekspräparationsmethoden.
Die Rolle der RNA-Struktur in praktisch jedem biologischen Prozess ist vor allem in den letzten zehn Jahren immer deutlicher geworden. Klassische Ansätze zur Lösung der RNA-Struktur, wie RNA-Kristallographie oder Kryo-EM, haben jedoch nicht mit dem sich schnell entwickelnden Feld und dem Bedarf an Hochdurchsatzlösungen Schritt gehalten. Mutationsprofilierung mit Sequenzierung unter Verwendung von Dimethylsulfat (DMS) MaPseq ist ein sequenzierungsbasierter Ansatz, um die RNA-Struktur aus der Reaktivität einer Base mit DMS abzuleiten. DMS methyliert den N1-Stickstoff in Adenosinen und das N3 in Cytosinen an ihrer Watson-Crick-Seite, wenn die Base ungepaart ist. Die umgekehrte Transkription der modifizierten RNA mit der thermostabilen Intron-Reverse-Transkriptase der Gruppe II (TGIRT-III) führt dazu, dass die methylierten Basen als Mutationen in die cDNA eingebaut werden. Bei der Sequenzierung der resultierenden cDNA und der Zuordnung zu einem Referenztranskript sind die relativen Mutationsraten für jede Base ein Hinweis auf den “Status” der Base als gepaart oder ungepaart. Obwohl DMS-Reaktivitäten sowohl in vitro als auch in Zellen ein hohes Signal-Rausch-Verhältnis aufweisen, ist diese Methode empfindlich gegenüber Verzerrungen in den Handhabungsverfahren. Um diese Verzerrung zu reduzieren, bietet dieser Artikel ein Protokoll für die RNA-Behandlung mit DMS in Zellen und mit in vitro transkribierter RNA.
Seit der Entdeckung, dass RNA sowohl strukturelle1,2– als auch katalytische3-Eigenschaften besitzt, wurde die Bedeutung der RNA und ihre regulatorische Funktion in einer Vielzahl biologischer Prozesse nach und nach aufgedeckt. Tatsächlich hat der Einfluss der RNA-Struktur auf die Genregulation zunehmend Aufmerksamkeit erregt4. Wie Proteine hat RNA primäre, sekundäre und tertiäre Strukturen, die sich auf die Sequenz von Nukleotiden, die 2D-Kartierung von Basenpaarungsinteraktionen und die 3D-Faltung dieser Basenpaarstrukturen beziehen. Während die Bestimmung der Tertiärstruktur der Schlüssel zum Verständnis der genauen Mechanismen hinter RNA-abhängigen Prozessen ist, ist die Sekundärstruktur auch sehr informativ in Bezug auf die RNA-Funktion und ist die Grundlage für eine weitere 3D-Faltung5.
Die Bestimmung der RNA-Struktur war jedoch mit herkömmlichen Ansätzen eine intrinsische Herausforderung. Während für Proteine Kristallographie, Kernspinresonanz (NMR) und kryogene Elektronenmikroskopie (Kryo-EM) es ermöglicht haben, die Vielfalt der Strukturmotive zu bestimmen, was eine Strukturvorhersage allein aus der Sequenz ermöglicht6, sind diese Ansätze auf RNAs nicht allgemein anwendbar. Tatsächlich sind RNAs flexible Moleküle mit Bausteinen (Nukleotiden), die im Vergleich zu ihren Aminosäure-Gegenstücken viel mehr Konformations- und Rotationsfreiheit haben. Darüber hinaus sind die Wechselwirkungen durch Basenpaarung dynamischer und vielseitiger als die von Aminosäureresten. Infolgedessen waren klassische Ansätze nur für relativ kleine RNAs mit gut definierten, sehr kompakten Strukturen erfolgreich7.
Ein weiterer Ansatz zur Bestimmung der RNA-Struktur ist die chemische Sondierung in Kombination mit der Next-Generation-Sequenzierung (NGS). Diese Strategie generiert Informationen über den Bindungsstatus jeder Base in einer RNA-Sequenz (d.h. ihre Sekundärstruktur). Kurz gesagt, die Basen in einem RNA-Molekül, die nicht an Basenpaarung beteiligt sind, werden durch kleine chemische Verbindungen differentiell modifiziert. Die umgekehrte Transkription dieser RNAs mit spezialisierten reversen Transkriptasen (RTs) beinhaltet die Modifikationen in komplementäre Desoxyribonukleinsäure (cDNA) als Mutationen. Diese cDNA-Moleküle werden dann durch die Polymerase-Kettenreaktion (PCR) amplifiziert und sequenziert. Um Informationen über ihren “Status” als gebunden oder ungebunden zu erhalten, werden die Mutationshäufigkeiten an jeder Base in einer interessierenden RNA berechnet und als Randbedingungen8 in Strukturvorhersagesoftware eingegeben. Basierend auf den Regeln des nächsten Nachbarn9 und den Berechnungen der minimalen freien Energie 10 generiert diese Software Strukturmodelle, die am besten zu den erhaltenen experimentellen Daten11,12 passen.
DMS-MaPseq verwendet DMS, das den N1-Stickstoff in Adenosinen und den N3-Stickstoff in Cytosinen an ihrer Watson-Crick-Seite auf hochspezifische Weise methyliert13. Die Verwendung der thermostabilen Intron-Reverse-Transkriptase (TGIRT-III) der Gruppe II in umgekehrter Transkription erzeugt Mutationsprofile mit beispiellosen Signal-Rausch-Verhältnissen, die sogar die Dekonvolution von überlappenden Profilen ermöglichen, die von zwei oder mehr alternativen Konformationen erzeugt werden14,15. Darüber hinaus kann DMS Zellmembranen und ganze Gewebe durchdringen, wodurch Sondierungen in physiologischen Kontexten möglich werden. Die Generierung qualitativ hochwertiger Daten ist jedoch eine Herausforderung, da sich Unterschiede im Handhabungsverfahren auf die Ergebnisse auswirken können. Daher stellen wir ein detailliertes Protokoll für DMS-MaPseq in vitro und in der Zelle zur Verfügung, um Verzerrungen zu reduzieren und Neulinge durch die Schwierigkeiten, auf die sie stoßen können, an die Methode heranzuführen. Insbesondere vor dem Hintergrund der jüngsten SARS-CoV2-Pandemie sind qualitativ hochwertige Daten zu RNA-Viren ein wichtiges Instrument, um die Genexpression zu untersuchen und mögliche Therapeutika zu finden.
Das Protokoll hier beschreibt, wie RNA in vitro und in Zellen mit DMS-Mutationsprofilierungsexperimenten untersucht werden kann. Darüber hinaus gibt es Anweisungen, wie Bibliotheken für die Illumina-Sequenzierung vorbereitet werden, um genspezifische Daten zu generieren und die erhaltenen .fastq-Dateien zu analysieren. Darüber hinaus können genomweite Bibliotheksansätze verwendet werden. Die genspezifische RT-PCR liefert jedoch die hochwertigsten und robustesten Daten. Daher ist es beim Vergleich zwischen Stichproben wichtig sicherzustellen, dass sie mit identischen Sequenzierungsstrategien vorbereitet werden, da die Bibliotheksgenerierung eine gewisse Verzerrung verursacht. Die Reproduzierbarkeit sollte immer mit Hilfe von Replikaten gemessen werden.
Mehrere Vorsichtsmaßnahmen
RNA ist ein instabiles Molekül, das sowohl durch erhöhte Temperaturen als auch durch RNasen empfindlich auf Abbau reagiert. Daher werden besondere Maßnahmen – die Verwendung von persönlicher Schutzausrüstung (PSA), RNAse-freiem Material und RNASE-Inhibitoren – empfohlen. Am wichtigsten ist, dass RNA wann immer möglich auf Eis gehalten werden sollte. Dies gilt insbesondere für methylierte RNA, die noch empfindlicher auf hohe Temperaturen reagiert.
Es ist wichtig zu bestätigen, dass die interessierende RNA-Struktur nicht empfindlich auf die DMS-Konzentration und die Pufferbedingungen reagiert. Puffer wie 100 mM Tris, 100 mM MOPS und 100 mM HEPES bei pH 7-7,5 geben ein hohes Signal, reichen aber möglicherweise nicht aus, um den pH-Wert während der Reaktion aufrechtzuerhalten21. Da DMS in Wasser hydrolysiert, was den pH-Wert senkt, ist ein starker Puffer entscheidend, um während der Modifizierungsreaktion einen neutralen pH-Wert aufrechtzuerhalten. Es wurde gezeigt, dass die Zugabe von Bic dazu beiträgt, den pH-Wert als leicht basisch21 aufrechtzuerhalten, führt jedoch zu einer niedrigen DMS-Modifikation bei Gs und Us, was informativ sein könnte, aber aufgrund der Erzeugung eines viel niedrigeren Signals als As und Cs separat analysiert werden sollte und in diesem Protokoll nicht weiter diskutiert wird.
Bei der genspezifischen RT-PCR wird die modifizierte RNA reverse-transkribiert in die DNA transkribiert und mittels PCR fragmentiert amplifiziert. Während die Größe der RNA theoretisch unbegrenzt sein kann, sollten diese PCR-Fragmente eine Länge von 400-500 Basenpaaren (bp) nicht überschreiten, um Verzerrungen während der reversen Transkriptionsreaktion zu verhindern. Idealerweise sollten sich die Fragmente im Rahmen des Sequenzierungslaufs befinden (d. h. wenn die Sequenzierung mit einem 150 x 150-Zyklus-Paired-End-Sequenzierungsprogramm durchgeführt wird, sollte ein einzelnes Fragment 300 bp nicht überschreiten). Bei Verwendung von Sequenzierungsprogrammen mit weniger Zyklen können die PCR-Produkte mithilfe einer dsDNase fragmentiert werden. Da Sequenzen innerhalb der Primersequenzen keine Strukturinformationen enthalten, müssen sich die Fragmente überlappen, wenn die untersuchte RNA >1-Fragment umfasst. RT-Reaktionen können mehrere RT-Primer für verschiedene Fragmente enthalten (bis zu 10 verschiedene RT-Primer). Abhängig von den Sequenzen kann das Pooling der RT-Primer die umgekehrte Transkription weniger effizient machen, funktioniert aber in der Regel gut. Jede PCR-Reaktion sollte separat durchgeführt werden.
Bei der Sondierung von RNA mit DMS spielen die experimentellen Bedingungen eine zusätzliche Rolle, da viele RNAs thermodynamisch instabil sind und ihre Konformation aufgrund von Umweltfaktoren wie Temperatur ändern. Um Unregelmäßigkeiten zu vermeiden, sollten die experimentellen Bedingungen auch hinsichtlich der Reaktionszeiten so konstant wie möglich gehalten werden. Die Pufferbedingungen scheinen bis zu einem gewissen Grad austauschbar zu sein 17,20,22,23, wenn die Grundbedingungen – die Pufferkapazität und das Vorhandensein von einwertigen (Na) und zweiwertigen Ionen (Mg) – aufrechterhalten werden, um eine ordnungsgemäße Faltung von RNA 24 zu gewährleisten.
Bei der Bibliothekspräparation modifizierter RNAs müssen mehrere Aspekte berücksichtigt werden. Erstens sind modifizierte RNAs, wie bereits erwähnt, weniger stabil als ihre unmodifizierten Gegenstücke, was bedeutet, dass sie möglicherweise die Optimierung der Fragmentierungszeiten für eine optimale Fragmentgrößenverteilung erfordern. Darüber hinaus verwenden bestimmte RNA-Bibliotheksvorbereitungskits sowie viele andere RNAseq-Ansätze zufällige Primer im reversen Transkriptionskit. Dies könnte zu einer geringeren Abdeckung der Referenz, insbesondere in den 3′ eines Gens, und letztendlich zu einer unzureichenden Abdeckungstiefe führen. Wenn die Abdeckung einer bestimmten Region zu gering ist, kann es notwendig sein, diese Basen aus der Strukturvorhersage zu entfernen. Neben RT-PCR und Whole-Genome RNAseq Kits können auch andere Ansätze zur Bibliothekspräparation verwendet werden. Protokolle, die die Ligation von 3′- und/oder 5′-Adaptern an die RNA beinhalten, sind vorteilhaft, wenn kleine RNA-Fragmente verwendet werden oder wenn der Verlust von Sondierungsinformationen in den Primerbereichen vermieden werden muss.
Schließlich muss die Analyse der chemischen Sondierungsexperimente immer sorgfältig interpretiert werden. Derzeit gibt es keine Software, die die RNA-Struktur einer RNA allein aus der Sequenz mit hoher Genauigkeit vorhersagt. Obwohl chemische Sondierungsbeschränkungen die Genauigkeit erheblich verbessern, ist die Erstellung guter Modelle für lange RNAs (>500 nt) immer noch eine Herausforderung. Diese Modelle sollten durch andere Ansätze und/oder Mutagenese weiter getestet werden. Die RNA-Vorhersagesoftware optimiert für die maximale Anzahl von Basenpaaren und bestraft so offene Konformationen, die die RNA-Faltung möglicherweise nicht genau darstellen5. Daher sollte das erhaltene Strukturmodell getestet werden, indem die Vorhersageübereinstimmung mit den zugrunde liegenden chemischen Sondierungsdaten (z. B. durch AUROC) und zwischen Replikaten (z. B. durch mFMI) quantifiziert wird, wie von Lan et al.20 veranschaulicht.
Idealerweise sollten mehrere Experimente in verschiedenen Systemen verwendet werden, um das erhaltene Strukturmodell in Frage zu stellen, um die eigene Hypothese zu stärken. Diese können die Verwendung von In-vitro – und In-Cell-Ansätzen, kompensatorischen Mutationen und verschiedenen Zelllinien und -spezies umfassen. Darüber hinaus sind rohe Reaktivitäten oft genauso informativ oder sogar informativer als Strukturvorhersagen, da sie die “Ground Truth”-Momentaufnahme des RNA-Faltungsensembles aufzeichnen. Daher sind rohe Reaktivitäten sehr geeignet und informativ, um Strukturänderungen zwischen verschiedenen Bedingungen zu vergleichen. Wichtig ist, dass die Strukturen mit der niedrigsten freien Energie, die unter Verwendung chemischer Sondierungsbeschränkungen mit rechnerischer Vorhersage berechnet werden, nur als Ausgangshypothese für ein vollständiges Strukturmodell verwendet werden sollten.
The authors have nothing to disclose.
Nichts
1 Kb Plus DNA Ladder | 10787018 | Thermo | |
2-mercaptoethanol | M6250-250ML | Sigma | |
Acid-Phenol:Chloroform, pH 4.5 | AM9720 | Thermo | |
Advantage PCR | 639206 | Takara | |
CloneAmp HiFi PCR Premix | 639298 | Takara | |
DMS | D186309 |
Sigma | |
dNTPs 10 mM each | U151B | Promega | |
E-Gel EX Agarose Gels, 2% | G402022 | Thermo | precast agarose gels |
Ethanol (200 proof) | E7023-4X4L | Sigma | |
Falcon tubes, 15 mL, 50 mL | |||
GlycoBlue | co-precipitant | ||
HCT-8 cells | ATCC #CCL-244 | ||
Invitrogen MgCl2 (1 M) | AM9530G | fisherscientific | |
Isopropanol | 278475 | Sigma | |
Megascript T7 transcription | AM1334 | Thermo | |
NanoDrop spectrophotometer | |||
Novex TBE Gels, 8%, 10 well | EC6215BOX | Thermo | |
OC43 | ATCC #VR-1558 | ||
RiboRuler Low Range RNA Ladder | SM1831 | Thermo | |
RNAse H | M0297L | NEB | |
Sodium Cacodylate, 0.4 M, pH 7.2 | 102090-964 | VWR | |
Sodium hydroxide solution | S8263-150ML | Sigma | |
SuperScript II Reverse Transcriptase for FSB and DTT | 18064014 | Thermo | |
TGIRT-III Enzyme | TGIRT50 | Ingex | |
The Oligo Clean & Concentrator | D4060 | Genesee | |
The RNA Clean & Concentrator kits are RNA clean up kits | R1016 | Genesee | |
TRIzol Reagents | 15596018 | Thermo | RNA isolation reagent |
Water, (For RNA Work) (DEPC-Treated, DNASE, RNASE free/Mol. Biol.) | BP561-1 | fisherscientific | |
xGen Broad-range RNA Library Prep 16rxn | 10009865 | IDT | |
Zymo RNA clean and concentrator columns |