이 프로토콜은 돌연변이 프로파일링 실험을 위해 디메틸 설페이트로 RNA를 변형하기 위한 지침을 제공합니다. 여기에는 두 가지 대체 라이브러리 준비 방법을 사용한 시험관 내 및 생체 내 프로빙이 포함됩니다.
거의 모든 생물학적 과정에서 RNA 구조의 역할은 특히 지난 10 년 동안 점점 더 분명 해졌습니다. 그러나 RNA 결정학 또는 Cryo-EM과 같은 RNA 구조를 해결하는 기존의 접근 방식은 빠르게 진화하는 분야와 고처리량 솔루션에 대한 요구를 따라가지 못했습니다. 디메틸 설페이트(DMS)를 사용한 시퀀싱을 통한 돌연변이 프로파일링 MaPseq는 염기와 DMS의 반응성에서 RNA 구조를 추론하는 시퀀싱 기반 접근 방식입니다. DMS는 염기가 짝을 이루지 않을 때 왓슨-크릭 얼굴에서 아데노신의 N1 질소와 시토신의 N3을 메틸화합니다. 변형된 RNA를 열안정 II 인트론 역전사효소 (TGIRT-III)로 역전사하면 메틸화된 염기가 cDNA 내로 돌연변이로서 혼입된다. 결과 cDNA를 시퀀싱하고 이를 참조 전사체에 다시 매핑할 때 각 염기에 대한 상대적 돌연변이율은 염기의 “상태”가 쌍 또는 쌍을 이루지 않았음을 나타냅니다. DMS 반응성은 시험관 내 및 세포 내 모두 높은 신호 대 잡음비를 갖지만 이 방법은 처리 절차의 편향에 민감합니다. 이러한 편향을 줄이기 위해 이 논문은 세포 내 DMS 및 체외 전사 RNA를 사용한 RNA 치료 프로토콜을 제공합니다.
RNA가 구조적1,2 및 촉매3 특성을 모두 가지고 있다는 발견 이후, 과다한 생물학적 과정에서 RNA의 중요성과 조절 기능이 점차 밝혀졌습니다. 실제로, 유전자 조절에 대한 RNA 구조의 효과는 점점 더 주목을 받고 있습니다4. 단백질과 마찬가지로 RNA는 각각 뉴클레오티드의 서열, 염기쌍 상호 작용의 2D 매핑 및 이러한 염기쌍 구조의 3D 접힘을 나타내는 1차, 2차 및 3차 구조를 가지고 있습니다. 3차 구조를 결정하는 것이 RNA 의존적 과정의 정확한 메커니즘을 이해하는 데 중요하지만, 2차 구조는 RNA 기능과 관련하여 매우 유익하며 추가 3D폴딩5의 기초가 됩니다.
그러나 RNA 구조를 결정하는 것은 기존의 접근 방식으로는 본질적으로 어려웠습니다. 단백질의 경우 결정학, 핵자기 공명(NMR) 및 극저온 전자 현미경(cryo-EM)을 통해 구조적 모티프의 다양성을 결정할 수 있어서열만으로는 구조 예측이 가능하지만6, 이러한 접근 방식은 RNA에 널리 적용되지 않습니다. 실제로 RNA는 아미노산 대응 물에 비해 훨씬 더 구조적 및 회전 자유도를 갖는 빌딩 블록 (뉴클레오티드)을 가진 유연한 분자입니다. 또한, 염기 쌍을 통한 상호 작용은 아미노산 잔기의 상호 작용보다 더 역동적이고 다재다능합니다. 결과적으로, 고전적인 접근법은 잘 정의되고 고도로 조밀 한 구조를 갖는 비교적 작은 RNA에 대해서만 성공적이었습니다7.
RNA 구조를 결정하는 또 다른 접근법은 차세대 시퀀싱(NGS)과 결합된 화학적 프로빙을 통한 것입니다. 이 전략은 RNA 서열에서 각 염기의 결합 상태 (즉, 2 차 구조)에 대한 정보를 생성합니다. 간단히 말해서, 염기 쌍에 관여하지 않는 RNA 분자의 염기는 작은 화합물에 의해 차등적으로 변형됩니다. 특수 역전사효소(RT)로 이러한 RNA를 역전사하면 변형을 상보적인 디옥시리보 핵산(cDNA)에 돌연변이로 통합합니다. 이러한 cDNA 분자는 중합 효소 연쇄 반응 (PCR)에 의해 증폭되고 시퀀싱됩니다. 결합 또는 비결합으로서의 “상태”에 대한 정보를 얻기 위해, 관심 RNA의 각 염기에서의 돌연변이 빈도가 계산되고 제약 조건8로서 구조 예측 소프트웨어에 입력된다. 최근접 이웃 규칙(9) 및 최소 자유 에너지 계산(10)에 기초하여, 이 소프트웨어는 획득된 실험 데이터(11, 12)에 가장 적합한 구조 모델을 생성한다.
DMS-MaPseq는 매우 특이적인 방식으로 왓슨-크릭 얼굴의 아데노신 및 시토신의 N3 질소를 메틸화하는 DMS를 사용합니다13. 역전사에서 열안정성 그룹 II 인트론 역전사효소(TGIRT-III)를 사용하면 전례 없는 신호 대 잡음비를 갖는 돌연변이 프로파일이 생성되며, 심지어 둘 이상의 대체 형태(14,15)에 의해 생성된 중첩 프로파일의 디콘볼루션이 가능합니다. 또한 DMS는 세포막과 전체 조직을 관통할 수 있어 생리학적 맥락 내에서 프로빙이 가능합니다. 그러나 처리 절차의 변형이 결과에 영향을 미칠 수 있으므로 양질의 데이터를 생성하는 것은 어렵습니다. 따라서 우리는 시험관 내 및 세포 내 DMS-MaPseq 모두에 대한 자세한 프로토콜을 제공하여 편견을 줄이고 신규 이민자가 직면할 수 있는 어려움을 통해 방법을 안내하도록 합니다. 특히 최근의 SARS-CoV2 대유행에 비추어 RNA 바이러스에 대한 고품질 데이터는 유전자 발현을 연구하고 가능한 치료법을 찾는 데 중요한 도구입니다.
여기서 프로토콜은 DMS 돌연변이 프로파일링 실험을 사용하여 시험관 내 및 세포에서 RNA를 프로브하는 방법을 설명합니다. 또한 유전자 특이적 데이터를 생성하고 획득한 .fastq 파일을 분석하기 위해 Illumina 시퀀싱을 위한 라이브러리를 준비하는 방법에 대한 지침을 제공합니다. 또한 게놈 전체 라이브러리 접근 방식을 사용할 수 있습니다. 그러나 유전자 특이적 RT-PCR은 최고 품질의 가장 강력한 데이터를 생성합니다. 따라서 샘플을 비교하는 경우 라이브러리 생성으로 인해 약간의 편향이 발생하므로 동일한 시퀀싱 전략으로 준비되었는지 확인하는 것이 중요합니다. 재현성은 항상 반복실험을 사용하여 측정해야 합니다.
몇 가지주의 사항
RNA는 고온과 RNase에 의한 분해에 민감한 불안정한 분자입니다. 따라서 개인 보호 장비 (PPE), RNAse가없는 물질 및 RNAse 억제제의 사용과 같은 특별한 조치가 권장됩니다. 가장 중요한 것은 RNA가 가능할 때마다 얼음 위에 보관되어야한다는 것입니다. 이것은 특히 고온에 훨씬 더 민감한 메틸화 RNA에 적용됩니다.
관심 RNA 구조가 DMS 농도 및 완충액 조건에 민감하지 않은지 확인하는 것이 중요합니다. pH 7-7.5에서 100mM 트리스, 100mM MOPS 및 100mM HEPES와 같은 완충액은 높은 신호를 주지만 반응 동안 pH를 유지하기에 충분하지 않을 수 있다(21). DMS는 물에서 가수분해되어 pH를 낮추기 때문에 변형 반응 중에 중성 pH를 유지하려면 강력한 완충액이 중요합니다. 비신의 첨가는 pH를 약간 염기성21 로 유지하는 데 도움이 되는 것으로 나타났지만 Gs 및 Us에 대한 DMS 변형이 낮으며, 이는 유익할 수 있지만 As 및 Cs보다 훨씬 낮은 신호의 생성으로 인해 별도로 분석되어야 하며 이 프로토콜에서 더 이상 논의되지 않습니다.
유전자 특이적 RT-PCR에서, 변형된 RNA는 DNA로 역전사되고 PCR에 의해 단편으로 증폭된다. RNA의 크기는 이론적으로 무제한일 수 있지만, 이러한 PCR 단편은 역전사 반응 동안 편향을 방지하기 위해 400-500 염기쌍(bp)의 길이를 초과해서는 안 됩니다. 이상적으로, 프래그먼트는 시퀀싱 실행의 범위 내에 있어야 한다(즉, 시퀀싱이 150 x 150 사이클 쌍단 시퀀싱 프로그램을 사용하여 수행되는 경우, 단일 프래그먼트는 300bp를 초과하지 않아야 함). 더 적은 주기로 시퀀싱 프로그램을 사용하는 경우 dsDNase를 사용하여 PCR 산물을 단편화할 수 있습니다. 또한, 프라이머 서열 내의 서열은 어떠한 구조적 정보도 보유하지 않기 때문에, 프로빙된 RNA가 >1 단편을 포함할 때 단편이 겹쳐야 한다. RT 반응은 서로 다른 단편에 대해 여러 개의 RT 프라이머를 포함할 수 있습니다(최대 10개의 서로 다른 RT 프라이머). 서열에 따라 RT 프라이머를 풀링하면 역전사의 효율성이 떨어질 수 있지만 일반적으로 잘 작동합니다. 각 PCR 반응은 별도로 수행되어야합니다.
DMS로 RNA를 프로빙할 때 많은 RNA가 열역학적으로 불안정하고 온도와 같은 환경 요인에 따라 형태가 변하기 때문에 실험 조건이 추가적인 역할을 합니다. 불규칙성을 피하기 위해 실험 조건은 반응 시간과 관련하여 가능한 한 일정하게 유지되어야합니다. 완충 조건은 RNA24의 적절한 접힘을 보장하기 위해 기본 조건(완충 용량 및 1가 이온(Na) 및 2가 이온(Mg)의 존재)이 유지될 때 어느 정도 17,20,22,23까지 교환할 수 있는 것으로 보입니다.
변형 된 RNA의 라이브러리 준비와 관련하여 몇 가지 측면을 고려해야합니다. 첫째, 앞서 언급했듯이 변형된 RNA는 변형되지 않은 RNA보다 안정성이 떨어지므로 최적의 단편 크기 분포를 위해 단편화 시간을 최적화해야 할 수 있습니다. 또한 특정 RNA 라이브러리 준비 키트와 다른 많은 RNAseq 접근법은 역전사 키트에서 무작위 프라이머를 사용합니다. 이것은 특히 유전자의 3’에서 참조의 커버리지를 낮추고 궁극적으로 커버리지 깊이가 불충분해질 수 있습니다. 특정 영역의 적용 범위가 너무 낮으면 구조 예측에서 해당 염기를 제거해야 할 수 있습니다. RT-PCR 및 전체 게놈 RNAseq 키트 외에도 다른 라이브러리 준비 접근법을 사용할 수 있습니다. RNA에 대한 3′ 및/또는 5′ 어댑터의 결찰을 포함하는 프로토콜은 RNA의 작은 단편을 사용하거나 프라이머 영역에서 프로빙 정보의 손실을 피해야 할 때 유리합니다.
마지막으로, 화학 프로빙 실험의 분석은 항상 신중하게 해석되어야 합니다. 현재, 서열만으로 RNA의 RNA 구조를 높은 정확도로 예측하는 소프트웨어는 없습니다. 화학적 프로빙 제약이 정확도를 크게 향상시키지만 긴 RNA(>500nt)에 대한 좋은 모델을 생성하는 것은 여전히 어렵습니다. 이러한 모델은 다른 접근법 및/또는 돌연변이 유발에 의해 추가로 테스트되어야 합니다. RNA 예측 소프트웨어는 최대 염기쌍 수에 대해 최적화하여RNA 접힘5을 정확하게 나타내지 않을 수 있는 개방 형태에 상당한 벌칙을 줍니다. 따라서, 수득된 구조 모델은 Lan et al.20에 의해 예시된 바와 같이, 기본 화학적 프로빙 데이터(예를 들어, AUROC에 의해) 및 반복체 간(예를 들어, mFMI에 의해)과의 예측 일치를 정량화함으로써 시험되어야 한다.
이상적으로는 얻은 구조 모델에 도전하기 위해 서로 다른 시스템에서 여러 실험을 사용하여 가설을 강화해야합니다. 여기에는 시험관 내 및 세포 내 접근법, 보상 돌연변이, 다양한 세포주 및 종의 사용이 포함될 수 있습니다. 더욱이, 원시 반응성은 RNA 폴딩 앙상블의 “지상 진실” 스냅샷을 기록하기 때문에 구조 예측과 같거나 훨씬 더 유익한 경우가 많습니다. 따라서 원시 반응성은 서로 다른 조건 간의 구조 변화를 비교하는 데 매우 적합하고 유익합니다. 중요한 것은 계산 예측과 함께 화학적 프로빙 제약 조건을 사용하여 계산 된 가장 낮은 자유 에너지 구조는 완전한 구조 모델에 대한 시작 가설로만 사용되어야한다는 것입니다.
The authors have nothing to disclose.
없음
1 Kb Plus DNA Ladder | 10787018 | Thermo | |
2-mercaptoethanol | M6250-250ML | Sigma | |
Acid-Phenol:Chloroform, pH 4.5 | AM9720 | Thermo | |
Advantage PCR | 639206 | Takara | |
CloneAmp HiFi PCR Premix | 639298 | Takara | |
DMS | D186309 |
Sigma | |
dNTPs 10 mM each | U151B | Promega | |
E-Gel EX Agarose Gels, 2% | G402022 | Thermo | precast agarose gels |
Ethanol (200 proof) | E7023-4X4L | Sigma | |
Falcon tubes, 15 mL, 50 mL | |||
GlycoBlue | co-precipitant | ||
HCT-8 cells | ATCC #CCL-244 | ||
Invitrogen MgCl2 (1 M) | AM9530G | fisherscientific | |
Isopropanol | 278475 | Sigma | |
Megascript T7 transcription | AM1334 | Thermo | |
NanoDrop spectrophotometer | |||
Novex TBE Gels, 8%, 10 well | EC6215BOX | Thermo | |
OC43 | ATCC #VR-1558 | ||
RiboRuler Low Range RNA Ladder | SM1831 | Thermo | |
RNAse H | M0297L | NEB | |
Sodium Cacodylate, 0.4 M, pH 7.2 | 102090-964 | VWR | |
Sodium hydroxide solution | S8263-150ML | Sigma | |
SuperScript II Reverse Transcriptase for FSB and DTT | 18064014 | Thermo | |
TGIRT-III Enzyme | TGIRT50 | Ingex | |
The Oligo Clean & Concentrator | D4060 | Genesee | |
The RNA Clean & Concentrator kits are RNA clean up kits | R1016 | Genesee | |
TRIzol Reagents | 15596018 | Thermo | RNA isolation reagent |
Water, (For RNA Work) (DEPC-Treated, DNASE, RNASE free/Mol. Biol.) | BP561-1 | fisherscientific | |
xGen Broad-range RNA Library Prep 16rxn | 10009865 | IDT | |
Zymo RNA clean and concentrator columns |