Summary

small RNA 정량을 위한 AQRNA-seq

Published: February 02, 2024
doi:

Summary

절대 정량 RNA 염기서열분석(AQRNA-seq)은 생물학적 혼합물에서 모든 소형 RNA의 환경을 정량화하기 위해 개발된 기술입니다. 여기에서는 AQRNA-seq의 라이브러리 준비 및 데이터 처리 단계를 모두 시연하여 기아 유발 휴면 기간 동안 Mycobacterium bovis BCG의 전달 RNA(tRNA) 풀의 변화를 정량화합니다.

Abstract

AQRNA-seq는 생물학적 샘플에서 염기서열분석 판독 횟수와 small RNA copy numbers 사이에 직접적인 선형 관계를 제공하여 small RNA pool의 정확한 정량화를 가능하게 합니다. 여기에 설명된 AQRNA-seq 라이브러리 준비 절차에는 맞춤형으로 설계된 염기서열분석 링커의 사용과 역전사 진행성을 차단하는 메틸화 RNA 변형을 줄이는 단계가 포함되며, 이로 인해 전장 cDNA의 수율이 증가합니다. 또한 수반되는 생물정보학 파이프라인의 자세한 구현이 제시됩니다. 이 AQRNA-seq 시연은 20일간의 영양 결핍 과정과 6일의 소생술에 걸쳐 선택된 5일에 걸쳐 수확된 Mycobacterium bovis BCG의 45개 tRNA에 대한 정량 분석을 통해 수행되었습니다. AQRNA-seq의 효율성과 엄격성을 개선하기 위한 지속적인 노력도 여기에서 논의될 것입니다. 여기에는 PCR 증폭 후 primer dimer 문제를 완화하기 위해 gel purification을 없애고 보다 정확한 read mapping을 가능하게 하기 위해 full-length read의 비율을 늘리는 방법을 탐색하는 것이 포함됩니다. AQRNA-seq에 대한 향후 개선 사항은 다양한 유기체의 세포 및 조직 샘플에서 모든 small RNA 종을 정량화하기 위한 이 기술의 자동화 및 고처리량 구현을 촉진하는 데 중점을 둘 것입니다.

Introduction

대규모 병렬 염기서열분석(MMS)이라고도 하는 차세대 염기서열분석(NGS)은 DNA 단편화, 어댑터 올리고뉴클레오티드의 ligation, 중합효소연쇄반응(PCR) 기반 증폭, DNA 염기서열분석, 단편 염기서열을 게놈으로 재조립하는 DNA 염기서열 분석 기술입니다. RNA 염기서열(RNA-seq)에 대한 NGS의 적응은 RNA 전사체와 그 변이체를 식별하고 정량화하는 강력한 접근법입니다1. RNA 라이브러리 준비 워크플로우 및 생물정보학 분석 파이프라인의 혁신적인 개발과 실험실 기기의 발전은 RNA-seq 애플리케이션의 레퍼토리를 확장하여 엑솜 시퀀싱을 넘어 non-coding RNA 프로파일링2, 단일 세포 분석3, 공간 전사체학 4,5, 대체 스플라이싱 분석6과 같은 고급 기능 오믹스로 발전했습니다, 다른 사람들 사이에서. 이러한 첨단 RNA-seq 방법은 정상 및 병든 세포 및 조직에서 전사체의 정량 분석을 통해 복잡한 RNA 기능을 밝힙니다.

RNA-seq의 이러한 발전에도 불구하고 몇 가지 주요 기술적 특징이 분석법의 정량적 능력을 제한합니다. 대부분의 RNA-seq 분석법은 실험 변수(즉, 생물학적 시료 및/또는 생리학적 상태) 간의 RNA 수준 변화를 정밀하고 정확하게 정량화할 수 있지만, 시료 내 RNA 분자 수준의 정량적 비교는 제공할 수 없습니다. 예를 들어, 대부분의 RNA-seq 분석법은 발현된 tRNA의 세포 풀에서 개별 tRNA 동수용체 분자의 상대적 복제 수를 정확하게 정량화할 수 없습니다. 동반 간행물7에서 강조된 바와 같이, RNA-seq에 대한 이러한 제한은 RNA 구조의 여러 특징과 라이브러리 준비의 생화학에서 발생합니다. 예를 들어, 3′ 및 5′-말단 염기서열분석 링커를 RNA 분자에 부착하는 데 사용되는 연결 효소의 활성은 RNA의 말단 뉴클레오티드와 염기서열분석 링커의 정체성에 의해 크게 영향을 받습니다. 이로 인해 링커 결찰(linker ligation)의 효율성에 큰 변화가 발생하고 염기서열분석 판독(sequencing read) 8,9,10에서 아티팩트(artifactual)가 크게 증가합니다.

두 번째 한계는 RNA 분자의 고유한 구조적 특성에서 발생합니다. 특히, epitranscriptome의 수십 개의 전사 후 RNA 변형에서 RNA 2차 구조 형성 및 동적 변화는 역전사 중에 중합효소 감소 또는 돌연변이를 유발할 수 있습니다. 이러한 오류는 불완전하거나 잘린 cDNA 합성 또는 변형된 RNA 염기서열을 초래합니다. 이 두 가지 현상 모두 2차 구조 또는 일부 변형을 매핑하는 데 활용될 수 있지만, 후속 라이브러리 준비 단계에서 절단된 cDNA를 캡처하지 못하거나 데이터 처리에서 참조 데이터 세트(11,12)와 일치하지 않는 돌연변이 서열이 발생하는 경우 RNA-seq의 정량적 정확도가 저하됩니다. 더욱이, RNA 전사체의 엄청난 화학적, 길이 및 구조적 다양성과 긴 RNA를 균일하게 단편화할 수 있는 도구의 부족으로 인해 대부분의 RNA-seq 방법의 적용 가능성이 모든 RNA 종에 감소합니다13.

AQRNA-seq(절대 정량 RNA 염기서열분석) 분석법은 정량 정확도를 제한하는 이러한 기술적, 생물학적 제약 중 몇 가지를 제거하기 위해 개발되었다7. RNA 염기서열분석 라이브러리 준비 중 capture, ligation 및 증폭에서 염기서열 의존적 바이어스를 최소화함으로써 AQRNA-seq는 다른 방법에 비해 우수한 선형성을 달성하여 963개의 miRNA로 구성된 참조 라이브러리의 75%를 2배 정확도 내에서 정확하게 정량화합니다. 염기서열분석, 판독 횟수와 RNA 풍부도의 이러한 선형 상관관계는 RNA 올리고뉴클레오티드 표준물질의 가변 길이 풀 분석과 노던 블로팅(northern blotting)과 같은 직교 방법에서도 관찰됩니다. 염기서열분석 판독 횟수와 RNA 풍부도 간의 선형성을 통해 AQRNA-seq는 시료 내 모든 RNA 종에 대한 정확하고 절대적인 정량화를 달성할 수 있습니다.

다음은 AQRNA-seq 라이브러리 준비 워크플로우를 위한 프로토콜과 함께 제공되는 다운스트림 데이터 분석 파이프라인에 대한 설명입니다. 이 방법은 결핵의 Mycobacterium bovis bacilli de Calmette et Guérin(BCG) 모델에서 기아 유발 휴면 및 후속 소생술 중 tRNA 풍부의 역학을 설명하기 위해 적용되었습니다. 염기서열분석 데이터의 탐색적 시각화를 위한 결과가 제시되었으며, 후속 클러스터링 및 차등 발현 분석을 통해 다양한 표현형과 관련된 tRNA 풍부도에서 식별 가능한 패턴을 밝혀냈습니다.

Protocol

참고: 그림 1 은 AQRNA-seq 라이브러리 준비와 관련된 절차를 그래픽으로 보여줍니다. 절차에 사용된 시약, 화학 물질 및 컬럼/키트에 대한 자세한 정보는 재료 표에서 확인할 수 있습니다. (i) 3% 아가로스 겔 전기영동, (ii) 생체 분자의 시료 품질 관리를 위한 자동 전기영동 도구( 재료 표 참조), (iii) UV-Visible 분광광도법 및/또는 형광 정량화를 사용하여 ?…

Representative Results

마이코박테리움 보비스 기하급수적 성장을 겪고 있는 BCG(bacilli de Calmette et Guérin) 균주 1173P2는 영양 결핍의 시계열(0, 4, 10 및 20일)을 거친 후 이전에 Hu et al.7에서 제시된 바와 같이 영양이 풍부한 배지에서 6일 동안 소생시켰습니다. Small RNA는 5개의 지정된 시점 각각에서 3개의 생물학적 복제를 통해 박테리아 배양에서 분리되었습니다. Illumina 라이브러리는 위에서 설명한 AQ…

Discussion

AQRNA-seq 라이브러리 준비 워크플로우는 시료 내 RNA의 캡처를 극대화하고 역전사 중 중합효소 감소를 최소화하도록 설계되었습니다7. 2단계 링커 결찰을 통해 새로운 DNA 올리고(링커 1 및 링커 2)가 과도하게 결찰되어 시료 내 RNA를 완전히 보완합니다. 과잉 링커는 단일 가닥 DNA에 특이적인 5′ 내지 3′ 엑소뉴클레아제인 RecJf를 사용하여 효율적으로 제거할 수 있으며, 접합된 산물은 ?…

Divulgations

The authors have nothing to disclose.

Acknowledgements

본 연구의 저자들은 AQRNA-seq 기술7을 설명하는 원본 논문의 저자들에게 감사한다. 이 연구는 미국 국립보건원(National Institutes of Health, ES002109, AG063341, ES031576, ES031529, ES026856)과 싱가포르 국립연구재단(National Research Foundation of Singapore)의 보조금으로 이루어졌으며, 싱가포르-MIT 연구 및 기술 항균 내성 연합(Singapore-MIT Alliance for Research and Technology Antimicrobial Resistance IRG)을 통해 이루어졌습니다.

Materials

2-ketoglutarate  Sigma-Aldrich 75890 Prepare a working solution (1 M) and store it at -20ºC
2100 Bioanalyzer Instrument Agilent G2938C
5'-deadenylase (50 U/μL)  New England Biolabs M0331S (component #: M0331SVIAL) Store at -20 °C
Adenosine 5'-Triphosphate (ATP)  New England Biolabs M0437M (component #: N0437AVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
AGAROSE GPG/LE AmericanBio AB00972-00500 Store at ambient temperature
Ammonium iron(II) sulfate hexahydrate Sigma-Aldrich F2262 Prepare a working solution (0.25 M) and store it at -20 °C
Bioanalyzer Small RNA Analysis Agilent 5067-1548  The Small RNA Analysis is used for checking the quality of input RNAs and the efficiency of enzymatic reactions (e.g., Linker 1 ligation)
Bovine Serum Albumin (BSA; 10 mg/mL)  New England Biolabs B9000 This product was discontinued on 12/15/2022 and is replaced with Recombinant Albumin, Molecular Biology Grade (NEB B9200).
Chloroform  Macron Fine Chemicals 4441-10
Demethylase  ArrayStar AS-FS-004 Demethylase comes with the rtStar tRNA Pretreatment & First-Strand cDNA Synthesis Kit (AS-FS-004)
Deoxynucleotide (dNTP) Solution Mix New England Biolabs N0447L (component #: N0447LVIAL) This dNTP Solution Mix contains equimolar concentrations of dATP, dCTP, dGTP and dTTP (10 mM each)
Digital Dual Heat Block VWR Scientific Products 13259-052 Heating block is used with the QIAquick Gel Extraction Kit 
DyeEx 2.0 Spin Kit  Qiagen 63204  Effective at removing short remnants (e.g., oligos less than 10 bp in length)
Electrophoresis Power Supply Bio-Rad Labrotories PowerPac 300
Eppendorf PCR Tubes (0.5 mL) Eppendorf 0030124537
Eppendorf Safe-Lock Tubes (0.5 mL) Eppendorf 022363611
Eppendorf Safe-Lock Tubes (1.5 mL) Eppendorf 022363204
Eppendorf Safe-Lock Tubes (2 mL) Eppendorf 022363352
Ethyl alcohol (Ethanol), Pure Sigma-Aldrich E7023  The pure ethanol is used with the Oligo Clean and Concentrator Kit from Zymo Research
Gel Imaging System Alpha Innotech FluorChem 8900
Gel Loading Dye, Purple (6X), no SDS New England Biolabs N0556S (component #: B7025SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
GENESYS 180 UV-Vis Spectrophotometer Thermo Fisher Scientific 840-309000 The spectrophotometer is used for measuring the oligo concentrations using the Beer's law
HEPES Sigma-Aldrich H4034 Prepare a working solution (1 M; pH = 8 with NaOH) and store it at -20 °C
Hydrochloric acid (HCl)  VWR Scientific Products BDH3028  Prepare a working solution (5 M) and store it at ambient temperature
Isopropyl Alcohol (Isopropanol), Pure Macron Fine Chemicals 3032-16 Isopropanol is used with the QIAquick Gel Extraction Kit 
L-Ascorbic acid Sigma-Aldrich A5960 Prepare a working solution (0.5 M) and store it at -20ºC
Microcentrifuge Eppendorf 5415D
NanoDrop 2000 Spectrophotometer Thermo Fisher Scientific ND-2000
NEBuffer 2 (10X) New England Biolabs M0264L (component #: B7002SVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
Nuclease-Free Water (not DEPC-Treated) Thermo Fisher Scientific AM9938 
Oligo Clean & Concentrator Kit  Zymo Research D4061  Store at ambient temperature
PEG 8000 (50% solution)  New England Biolabs M0437M (component #: B1004SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
Peltier Thermal Cycler MJ Research PTC-200
Phenol:choloroform:isoamyl alcohol 25:24:1 pH = 5.2  Thermo Fisher Scientific J62336 
PrimeScript Buffer (5X) TaKaRa 2680A 
PrimeScript Reverse Transcriptase TaKaRa 2680A 
QIAquick Gel Extraction Kit  Qiagen 28704 This kit requires a heating block and isopropanol to work with
Quick-Load Purple 100 bp DNA Ladder New England Biolabs N0551S (component #: N0551SVIAL)
Quick-Load Purple 50 bp DNA Ladder New England Biolabs N0556S (component #: N0556SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
RecJf (30 U/μL)  New England Biolabs M0264L (component #: M0264LVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
RNase Inhibitor (murine; 40 U/μL)  New England Biolabs M0314L (component #: M0314LVIAL) Store at -20 °C
SeqAMP DNA Polymerase  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
SeqAMP PCR Buffer (2X)  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
Shrimp Alkaline Phosphatase (1 U/μL)  New England Biolabs M0371L (component #: M0371LVIAL)
Sodium hydroxide (NaOH) Sigma-Aldrich  S5881 Prepare a working solution (5 M) and store it at ambient temperature
T4 DNA Ligase (400 U/μL)  New England Biolabs M0202L (component #: M0202LVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 DNA Ligase Reaction Buffer (10X)  New England Biolabs M0202L (component #: B0202SVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 RNA Ligase 1 (30 U/μL)  New England Biolabs M0437M (component #: M0437MVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)
T4 RNA Ligase Reaction Buffer (10X)  New England Biolabs M0437M (component #: B0216SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)

References

  1. Byron, S. A., Van Keuren-Jensen, K. R., Engelthaler, D. M., Carpten, J. D., Craig, D. W. Translating RNA sequencing into clinical diagnostics: opportunities and challenges. Nat Rev Gen. 17 (5), 257-271 (2016).
  2. Grillone, K., et al. Non-coding RNAs in cancer: platforms and strategies for investigating the genomic "dark matter.&#34. J Exp Clin Cancer Res. 39 (1), 117 (2020).
  3. Hwang, B., Lee, J. H., Bang, D. Single-cell RNA sequencing technologies and bioinformatics pipelines. Exp Mol Med. 50 (8), 1-14 (2018).
  4. Goh, J. J. L., et al. Highly specific multiplexed RNA imaging in tissues with split-FISH. Nat Methods. 17 (7), 689-693 (2020).
  5. Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
  6. Cummings, B. B., et al. Improving genetic diagnosis in Mendelian disease with transcriptome sequencing. Sci Transl Med. 9 (386), 5209 (2017).
  7. Hu, J. F., et al. Quantitative mapping of the cellular small RNA landscape with AQRNA-seq. Nat Biotech. 39 (8), 978-988 (2021).
  8. Alon, S., et al. Barcoding bias in high-throughput multiplex sequencing of miRNA. Genome Res. 21 (9), 1506-1511 (2011).
  9. Fuchs, R. T., Sun, Z., Zhuang, F., Robb, G. B. Bias in ligation-based small RNA sequencing library construction is determined by adaptor and RNA structure. PLoS One. 10 (5), e0126049 (2015).
  10. Pang, Y. L. J., Abo, R., Levine, S. S., Dedon, P. C. Diverse cell stresses induce unique patterns of tRNA up- and down-regulation: tRNA-seq for quantifying changes in tRNA copy number. Nuc Acids Res. 42 (22), e170 (2014).
  11. Machnicka, M. A., Olchowik, A., Grosjean, H., Bujnicki, J. M. Distribution and frequencies of post-transcriptional modifications in tRNAs. RNA Biol. 11 (12), 1619-1629 (2014).
  12. Li, F., et al. Regulatory impact of RNA secondary structure across the Arabidopsis transcriptome. Plant Cell. 24 (11), 4346-4359 (2012).
  13. García-Nieto, P. E., Wang, B., Fraser, H. B. Transcriptome diversity is a systematic source of variation in RNA-sequencing data. PLOS Comput Biol. 18 (3), e1009939 (2022).
  14. . FASTQC: a quality control tool for high throughput sequence data Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  15. Chen, S., Zhou, Y., Chen, Y., Gu, J. Fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics. 34 (17), i884-i890 (2018).
  16. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biol. 15 (12), 550 (2014).
  17. R Core Team. R: a language and environment for statistical computing. R Foundation for Statistical Computing. , (2022).
  18. Ougland, R., et al. AlkB restores the biological function of mRNA and tRNA inactivated by chemical methylation. Mol Cell. 16 (1), 107-116 (2004).
  19. Bernhardt, H. S., Tate, W. P. Primordial soup or vinaigrette: did the RNA world evolve at acidic pH. Biol Direct. 7, 4 (2012).
  20. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J Mol Biol. 215 (3), 403-410 (1990).
  21. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet. J. 17 (1), 10-12 (2011).

Play Video

Citer Cet Article
Chen, R., Yim, D., Dedon, P. C. AQRNA-seq for Quantifying Small RNAs. J. Vis. Exp. (204), e66335, doi:10.3791/66335 (2024).

View Video