Протокол содержит инструкцию по модификации РНК диметилсульфатом для экспериментов по мутационному профилированию. Он включает в себя зондирование in vitro и in vivo с двумя альтернативными методами подготовки библиотеки.
Роль структуры РНК практически в любом биологическом процессе становится все более очевидной, особенно в последнее десятилетие. Однако классические подходы к решению структуры РНК, такие как кристаллография РНК или крио-ЭМ, не смогли угнаться за быстро развивающейся областью и потребностью в высокопроизводительных решениях. Мутационное профилирование с секвенированием с использованием диметилсульфата (DMS) MaPseq представляет собой основанный на секвенировании подход к выводу структуры РНК из реакционной способности основания с DMS. DMS метилирует азот N1 в аденозинах и N3 в цитозинах на грани Уотсона-Крика, когда основание непарно. Обратная транскрибирование модифицированной РНК термостабильной интронной обратной транскриптазой II группы (TGIRT-III) приводит к включению метилированных оснований в качестве мутаций в кДНК. При секвенировании полученной кДНК и сопоставлении ее с эталонной транскриптом относительные частоты мутаций для каждого основания указывают на «статус» основания как парного или непарного. Несмотря на то, что реактивность DMS имеет высокое отношение сигнал/шум как in vitro , так и в клетках, этот метод чувствителен к смещению в процедурах обработки. Чтобы уменьшить это смещение, в этой статье представлен протокол лечения РНК СДМ в клетках и транскрибированной РНК in vitro .
С момента открытия того, что РНК обладает как структурными 1,2, так и каталитическимисвойствами 3, важность РНК и ее регуляторной функции во множестве биологических процессов была постепенно раскрыта. Действительно, влияние структуры РНК на регуляцию генов привлекло все большее внимание4. Как и белки, РНК имеет первичные, вторичные и третичные структуры, ссылаясь на последовательность нуклеотидов, 2D-картирование парных взаимодействий оснований и 3D-сворачивание этих парных структур оснований, соответственно. В то время как определение третичной структуры является ключом к пониманию точных механизмов, лежащих в основе РНК-зависимых процессов, вторичная структура также очень информативна в отношении функции РНК и является основой для дальнейшего 3D-сворачивания5.
Тем не менее, определение структуры РНК было по своей сути сложной задачей с традиционными подходами. В то время как для белков кристаллография, ядерный магнитный резонанс (ЯМР) и криогенная электронная микроскопия (крио-ЭМ) позволили определить разнообразие структурных мотивов, что позволяет прогнозировать структуру только по последовательности6, эти подходы не широко применимы к РНК. Действительно, РНК представляют собой гибкие молекулы со строительными блоками (нуклеотидами), которые имеют гораздо большую конформационную и вращательную свободу по сравнению с их аминокислотными аналогами. Кроме того, взаимодействия через спаривание оснований более динамичны и универсальны, чем взаимодействия аминокислотных остатков. В результате классические подходы оказались успешными только для относительно небольших РНК с четко определенными, высококомпактными структурами7.
Другой подход к определению структуры РНК заключается в химическом зондировании в сочетании с секвенированием следующего поколения (NGS). Эта стратегия генерирует информацию о статусе связывания каждого основания в последовательности РНК (т.е. его вторичной структуре). Короче говоря, основания в молекуле РНК, которые не участвуют в спаривании оснований, дифференциально модифицируются небольшими химическими соединениями. Обратная транскрибирование этих РНК со специализированными обратными транскриптазами (RT) включает модификации в комплементарную дезоксирибонуклеиновую кислоту (кДНК) в качестве мутаций. Эти молекулы кДНК затем амплифицируются полимеразной цепной реакцией (ПЦР) и секвенируются. Чтобы получить информацию об их «статусе» как связанном или несвязанном, частоты мутаций на каждом основании в интересующей РНК вычисляются и вводятся в программное обеспечение для прогнозирования структуры в качестве ограничений8. Основываясь на правилахближайшего соседа 9 и расчетах минимальной свободной энергии10, это программное обеспечение генерирует структурные модели, которые наилучшим образом соответствуют полученным экспериментальным данным11,12.
DMS-MaPseq использует DMS, который метилирует азот N1 в аденозинах и азот N3 в цитозинах на их поверхности Watson-Crick оченьспецифическим образом 13. Использование термостабильной интронной обратной транскриптазы II группы (TGIRT-III) в обратной транскрипции создает мутационные профили с беспрецедентным отношением сигнал/шум, даже допуская деконволюцию перекрывающихся профилей, генерируемых двумя или более альтернативными конформациями14,15. Кроме того, DMS может проникать в клеточные мембраны и целые ткани, что делает возможным зондирование в физиологических контекстах. Однако получение данных хорошего качества является сложной задачей, поскольку различия в процедуре обработки могут повлиять на результаты. Поэтому мы предоставляем подробный протокол как для in vitro, так и для внутриклеточного DMS-MaPseq, чтобы уменьшить предвзятость и направить новичков в метод через трудности, с которыми они могут столкнуться. Особенно в свете недавней пандемии SARS-CoV2 высококачественные данные о РНК-вирусах являются важным инструментом для изучения экспрессии генов и поиска возможных терапевтических средств.
Протокол здесь описывает, как исследовать РНК in vitro и в клетках с использованием экспериментов по мутационному профилированию DMS. Кроме того, он дает инструкции о том, как подготовить библиотеки для секвенирования Illumina для генерации генно-специфических данных и анализа полученных файлов .fastq. Кроме того, могут использоваться общегеномные библиотечные подходы. Тем не менее, генно-специфическая ОТ-ПЦР дает самые качественные и наиболее надежные данные. Поэтому при сравнении образцов важно убедиться, что они подготовлены с одинаковыми стратегиями секвенирования, так как генерация библиотеки вызывает некоторую предвзятость. Воспроизводимость всегда должна измеряться с помощью реплик.
Несколько мер предосторожности
РНК представляет собой нестабильную молекулу, которая чувствительна к деградации как через повышенные температуры, так и через РНКазы. Поэтому рекомендуются специальные меры — использование средств индивидуальной защиты (СИЗ), материала, не содержащего РНКазы, ингибиторов РНКАЗы. Самое главное, что РНК следует держать на льду, когда это возможно. Особенно это касается метилированной РНК, которая еще более чувствительна к высоким температурам.
Важно подтвердить, что интересующая структура РНК не чувствительна к концентрации ДМС и буферным условиям. Буферы, такие как 100 мМ Tris, 100 мМ MOPS и 100 мM HEPES при рН 7-7,5, дают высокий сигнал, но могут быть недостаточными для поддержания рН во время реакции21. Поскольку DMS гидролизуется в воде, что снижает pH, сильный буфер имеет решающее значение для поддержания нейтрального pH во время реакции модификации. Было показано, что добавление бицина помогает поддерживать рН в качестве слегка основного21 , но приводит к низкой модификации DMS на Gs и Us, что может быть информативным, но должно быть проанализировано отдельно из-за производства гораздо более низкого сигнала, чем As и Cs, и не обсуждается далее в этом протоколе.
В ген-специфической ОТ-ПЦР модифицированная РНК обратно транскрибируется в ДНК и амплифицируется фрагментами с помощью ПЦР. Хотя размер РНК теоретически может быть неограниченным, эти фрагменты ПЦР не должны превышать длину 400-500 пар оснований (bp), чтобы предотвратить смещение во время реакции обратной транскрипции. В идеале фрагменты должны находиться в рамках последовательности (т.е. если секвенирование проводится с использованием программы парного секвенирования 150 x 150 циклов, один фрагмент не должен превышать 300 бит/с). При использовании программ секвенирования с меньшим количеством циклов продукты ПЦР могут быть фрагментированы с помощью dsDNase. Кроме того, поскольку последовательности внутри последовательностей праймера не содержат никакой структурной информации, фрагменты должны перекрываться, когда исследуемая РНК содержит фрагмент >1. Реакции RT могут содержать несколько праймеров RT для разных фрагментов (до 10 различных праймеров RT). В зависимости от последовательностей, объединение праймеров RT может сделать обратную транскрипцию менее эффективной, но обычно работает хорошо. Каждую реакцию ПЦР следует проводить отдельно.
При зондировании РНК с DMS экспериментальные условия играют дополнительную роль, так как многие РНК термодинамически нестабильны и изменяют свою конформацию в зависимости от факторов окружающей среды, таких как температура. Чтобы избежать неровностей, условия эксперимента должны быть как можно более постоянными, в том числе в отношении времени реакции. Буферные условия, по-видимому, в определенной степени взаимозаменяемы 17,20,22,23 при сохранении основных условий — буферной способности и наличия одновалентных (Na) и двухвалентных ионов (Mg) — для обеспечения надлежащего сворачивания РНК24.
Что касается библиотечной подготовки модифицированных РНК, то необходимо учитывать несколько аспектов. Во-первых, как упоминалось ранее, модифицированные РНК менее стабильны, чем их немодифицированные аналоги, что означает, что им может потребоваться оптимизация времени фрагментации для оптимального распределения размеров фрагментов. Кроме того, некоторые наборы для подготовки библиотеки РНК, а также многие другие подходы RNAseq используют случайные праймеры в наборе обратной транскрипции. Это может привести к снижению охвата референта, особенно в 3′ гена, и, в конечном счете, к недостаточной глубине охвата. Если охват определенного региона слишком низок, возможно, потребуется удалить эти основания из прогноза структуры. Помимо наборов ОТ-ПЦР и RNAseq для всего генома, могут использоваться и другие подходы к подготовке библиотек. Протоколы, которые включают лигирование 3′ и/или 5′ адапторов к РНК, выгодны при использовании небольших фрагментов РНК или когда следует избегать потери зондирующей информации в областях праймера.
Наконец, анализ экспериментов по химическому зондированию всегда должен интерпретироваться осторожно. В настоящее время не существует программного обеспечения, которое предсказывает структуру РНК любой РНК только из последовательности с высокой точностью. Хотя ограничения химического зондирования значительно повышают точность, создание хороших моделей для длинных РНК (>500 нт) по-прежнему является сложной задачей. Эти модели должны быть дополнительно проверены другими подходами и/или мутагенезом. Программное обеспечение для прогнозирования РНК оптимизирует максимальное количество пар оснований, тем самым значительно наказывая открытые конформации, которые могут не точно представлять сворачивание РНК5. Таким образом, полученная модель структуры должна быть проверена путем количественной оценки соглашения о прогнозировании с базовыми данными химического зондирования (например, AUROC) и между репликациями (например, mFMI), как показано на примере Lan et al.20.
В идеале для укрепления гипотезы следует использовать несколько экспериментов в разных системах, чтобы оспорить полученную структурную модель. Они могут включать использование in vitro и внутриклеточных подходов, компенсаторных мутаций и различных клеточных линий и видов. Более того, необработанные реактивности часто так же или даже более информативны, чем предсказания структуры, поскольку они записывают снимок «основной истины» складного ансамбля РНК. Таким образом, необработанные реактивности очень подходят и информативны для сравнения изменений структуры между различными условиями. Важно отметить, что структуры с самой низкой свободной энергией, рассчитанные с использованием ограничений химического зондирования с вычислительным прогнозированием, должны использоваться только в качестве начальной гипотезы для полной модели структуры.
The authors have nothing to disclose.
Никакой
1 Kb Plus DNA Ladder | 10787018 | Thermo | |
2-mercaptoethanol | M6250-250ML | Sigma | |
Acid-Phenol:Chloroform, pH 4.5 | AM9720 | Thermo | |
Advantage PCR | 639206 | Takara | |
CloneAmp HiFi PCR Premix | 639298 | Takara | |
DMS | D186309 |
Sigma | |
dNTPs 10 mM each | U151B | Promega | |
E-Gel EX Agarose Gels, 2% | G402022 | Thermo | precast agarose gels |
Ethanol (200 proof) | E7023-4X4L | Sigma | |
Falcon tubes, 15 mL, 50 mL | |||
GlycoBlue | co-precipitant | ||
HCT-8 cells | ATCC #CCL-244 | ||
Invitrogen MgCl2 (1 M) | AM9530G | fisherscientific | |
Isopropanol | 278475 | Sigma | |
Megascript T7 transcription | AM1334 | Thermo | |
NanoDrop spectrophotometer | |||
Novex TBE Gels, 8%, 10 well | EC6215BOX | Thermo | |
OC43 | ATCC #VR-1558 | ||
RiboRuler Low Range RNA Ladder | SM1831 | Thermo | |
RNAse H | M0297L | NEB | |
Sodium Cacodylate, 0.4 M, pH 7.2 | 102090-964 | VWR | |
Sodium hydroxide solution | S8263-150ML | Sigma | |
SuperScript II Reverse Transcriptase for FSB and DTT | 18064014 | Thermo | |
TGIRT-III Enzyme | TGIRT50 | Ingex | |
The Oligo Clean & Concentrator | D4060 | Genesee | |
The RNA Clean & Concentrator kits are RNA clean up kits | R1016 | Genesee | |
TRIzol Reagents | 15596018 | Thermo | RNA isolation reagent |
Water, (For RNA Work) (DEPC-Treated, DNASE, RNASE free/Mol. Biol.) | BP561-1 | fisherscientific | |
xGen Broad-range RNA Library Prep 16rxn | 10009865 | IDT | |
Zymo RNA clean and concentrator columns |