Summary

低分子RNAの定量のためのAQRNA-seq

Published: February 02, 2024
doi:

Summary

Absolute quantification RNA Sequencing (AQRNA-seq) は、生物学的混合物中のすべての低分子 RNA の状況を定量するために開発された技術です。ここでは、AQRNA-seqのライブラリー調製とデータ処理の両方のステップを実証し、飢餓誘発性休眠中の Mycobacterium bovis BCGのトランスファーRNA(tRNA)プールの変化を定量化します。

Abstract

AQRNA-seqは、生体サンプル中のシーケンシングリードカウントとsmall RNAコピー数との間に直接的な線形関係を提供し、small RNAのプールの正確な定量を可能にします。ここで説明するAQRNA-seqライブラリ調製手順には、カスタム設計のシーケンシングリンカーの使用と、逆転写処理性をブロックするメチル化RNA修飾を減らすステップが含まれ、これにより完全長cDNAの収量が増加します。さらに、付随するバイオインフォマティクスパイプラインの詳細な実装についても説明します。このAQRNA-seqのデモンストレーションは、20日間の栄養欠乏と6日間の蘇生の時間経過で5日間に採取された Mycobacterium bovis BCG中の45のtRNAの定量分析を通じて行われました。AQRNA-seqの効率と厳密性を向上させるための継続的な取り組みについても、ここで説明します。これには、PCR増幅後のプライマーダイマーの問題を軽減するためのゲル精製の回避方法や、より正確なリードマッピングを可能にするために全長リードの割合を増やす方法の検討が含まれます。AQRNA-seqの今後の機能強化は、多様な生物の細胞および組織サンプル中のすべてのsmall RNA種を定量するためのこの技術の自動化とハイスループットの実装を促進することに焦点を当てます。

Introduction

次世代シーケンシング(NGS)は、超並列シーケンシングとも呼ばれ、DNA断片化、アダプターオリゴヌクレオチドのライゲーション、ポリメラーゼ連鎖反応(PCR)ベースの増幅、DNAのシーケンシング、およびフラグメント配列のゲノムへの再アセンブルを含むDNAシーケンシング技術です。NGSのシーケンシングRNAへの適応(RNA-seq)は、RNA転写産物とそのバリアント同定および定量するための強力なアプローチです1。RNAライブラリー調製ワークフローとバイオインフォマティクス解析パイプラインの革新的な開発は、ラボ装置の進歩と相まって、RNA-seqアプリケーションのレパートリーを拡大し、エクソームシーケンシングを超えて、ノンコーディングRNAプロファイリング2、シングルセル解析3、空間トランスクリプトミクス4,5、選択的スプライシング解析6などの高度な機能オミクスへと進歩していますなど。これらの高度なRNA-seq法は、正常細胞および疾患細胞および組織におけるトランスクリプトームの定量解析を通じて、複雑なRNA機能を明らかにします。

RNA-seqのこれらの進歩にもかかわらず、いくつかの重要な技術的特徴が、このメソッドの定量的な検出力を制限しています。ほとんどのRNA-seq法では、実験変数(生体サンプルや生理学的状態)間のRNAレベルの変化を正確かつ正確に定量することができますが、サンプル内のRNA分子レベルを定量的に比較することはできません。例えば、ほとんどのRNA-seq法では、発現したtRNAの細胞プールにおける個々のtRNAアイソアクセプター分子の相対的なコピー数を正確に定量することはできません。コンパニオンの出版物7で強調されているように、RNA-seqに対するこの制限は、RNA構造のいくつかの特徴とライブラリ調製の生化学から生じます。例えば、3’末端および5’末端シーケンシングリンカーをRNA分子に結合するために使用されるライゲーション酵素の活性は、RNAの末端ヌクレオチドとシーケンシングリンカーの同一性に強く影響されます。これにより、リンカーライゲーションの効率に大きなばらつきが生じ、シーケンシングリード8,9,10の大幅な人工的な増加がもたらされます。

2つ目の制限は、RNA分子の固有の構造特性から生じます。具体的には、エピトランスクリプトームの数十の転写後RNA修飾におけるRNA二次構造の形成と動的変化は、逆転写中にポリメラーゼのフォールオフまたは突然変異を引き起こす可能性があります。これらのエラーは、不完全または切断されたcDNA合成またはRNA配列の変更につながります。これらの現象は両方とも二次構造またはいくつかの修飾をマッピングするために利用することができますが、その後のライブラリ調製ステップが切断されたcDNAを捕捉できない場合、またはデータ処理が参照データセット11,12と一致しない変異配列を捨てる場合、RNA-seqの定量精度を低下させます。さらに、RNA転写産物の化学的、長さ、構造的多様性が膨大であること、および長いRNAを均一に断片化するためのツールが不足しているため、ほとんどのRNA-seq法の全てのRNA種への適用性が低下しています13

AQRNA-seq(Absolute Quantification RNA Sequencing)法は、定量精度を制限するこれらの技術的および生物学的制約のいくつかを取り除くために開発されました7。AQRNA-seqは、RNAシーケンシングライブラリー調製時の捕捉、ライゲーション、増幅における配列依存バイアスを最小限に抑えることで、他の方法と比較して優れた直線性を達成し、963のmiRNAのリファレンスライブラリーの75%を2倍の精度で正確に定量します。シーケンシングリード数とRNA存在量のこの線形相関は、RNAオリゴヌクレオチドスタンダードの可変長プールの分析や、ノーザンブロッティングなどの直交法を参照しても観察されます。シーケンシングリードカウントとRNA量との間に直線性を確立することで、AQRNA-seqはサンプル内のすべてのRNA分子種を正確かつ絶対的に定量することができます。

ここでは、AQRNA-seqライブラリ調製ワークフローのプロトコルと、それに付随するダウンストリームデータ解析パイプラインについて説明します。この方法は、結核の Mycobacterium bovis bacilli de Calmette et Guérin(BCG)モデルにおける飢餓誘発性休眠およびその後の蘇生中のtRNA存在量のダイナミクスを解明するために適用されました。シーケンシングデータの探索的可視化の結果と、その後のクラスタリングおよび差次的発現解析の結果が発表され、さまざまな表現型に関連するtRNA存在量の識別可能なパターンが明らかになりました。

Protocol

注: 図1 は、AQRNA-seqライブラリの調製に関連する手順を図示したものです。この手順で使用した試薬、化学薬品、カラム/キットに関する詳細な情報は、 材料表に記載されています。インプット RNA サンプルの純度、完全性、および量の包括的な評価は、(i)3% アガロースゲル電気泳動、(ii)生体分子のサンプル品質管理のための自動電気泳動ツール( 材料?…

Representative Results

マイコバクテリウム・ボビス 指数関数的に成長しているBCG(Bacilli de Calmette et Guérin)株1173P2は、時系列(0、4、10、および20日)の栄養飢餓にさらされ、その後、以前にHu et al.7で提示されたように、栄養豊富な培地で6日間の蘇生が行われました。細菌培養からsmall RNAを単離し、指定された5つの時点のそれぞれで3つの生物学的複製を行いました。Illuminaライブラリは、上記?…

Discussion

AQRNA-seqライブラリ調製ワークフローは、サンプル中のRNAの捕捉を最大化し、逆転写中のポリメラーゼのフォールオフを最小限に抑えるように設計されています7。2段階のリンカーライゲーションにより、新規DNAオリゴ(Linker 1およびLinker 2)が過剰にライゲーションされ、サンプル内のRNAが完全に補完されます。余分なリンカーは、一本鎖DNAに特異的な5’から3’のエキソヌクレア?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

本研究の著者は、AQRNA-seq技術7について記述した原著論文の著者に感謝する。この研究は、国立衛生研究所(ES002109、AG063341、ES031576、ES031529、ES026856)およびシンガポール国立研究財団からの助成金により、Singapore-MIT Alliance for Research and Technology Antimicrobial Resistance IRGを通じて支援されました。

Materials

2-ketoglutarate  Sigma-Aldrich 75890 Prepare a working solution (1 M) and store it at -20ºC
2100 Bioanalyzer Instrument Agilent G2938C
5'-deadenylase (50 U/μL)  New England Biolabs M0331S (component #: M0331SVIAL) Store at -20 °C
Adenosine 5'-Triphosphate (ATP)  New England Biolabs M0437M (component #: N0437AVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
AGAROSE GPG/LE AmericanBio AB00972-00500 Store at ambient temperature
Ammonium iron(II) sulfate hexahydrate Sigma-Aldrich F2262 Prepare a working solution (0.25 M) and store it at -20 °C
Bioanalyzer Small RNA Analysis Agilent 5067-1548  The Small RNA Analysis is used for checking the quality of input RNAs and the efficiency of enzymatic reactions (e.g., Linker 1 ligation)
Bovine Serum Albumin (BSA; 10 mg/mL)  New England Biolabs B9000 This product was discontinued on 12/15/2022 and is replaced with Recombinant Albumin, Molecular Biology Grade (NEB B9200).
Chloroform  Macron Fine Chemicals 4441-10
Demethylase  ArrayStar AS-FS-004 Demethylase comes with the rtStar tRNA Pretreatment & First-Strand cDNA Synthesis Kit (AS-FS-004)
Deoxynucleotide (dNTP) Solution Mix New England Biolabs N0447L (component #: N0447LVIAL) This dNTP Solution Mix contains equimolar concentrations of dATP, dCTP, dGTP and dTTP (10 mM each)
Digital Dual Heat Block VWR Scientific Products 13259-052 Heating block is used with the QIAquick Gel Extraction Kit 
DyeEx 2.0 Spin Kit  Qiagen 63204  Effective at removing short remnants (e.g., oligos less than 10 bp in length)
Electrophoresis Power Supply Bio-Rad Labrotories PowerPac 300
Eppendorf PCR Tubes (0.5 mL) Eppendorf 0030124537
Eppendorf Safe-Lock Tubes (0.5 mL) Eppendorf 022363611
Eppendorf Safe-Lock Tubes (1.5 mL) Eppendorf 022363204
Eppendorf Safe-Lock Tubes (2 mL) Eppendorf 022363352
Ethyl alcohol (Ethanol), Pure Sigma-Aldrich E7023  The pure ethanol is used with the Oligo Clean and Concentrator Kit from Zymo Research
Gel Imaging System Alpha Innotech FluorChem 8900
Gel Loading Dye, Purple (6X), no SDS New England Biolabs N0556S (component #: B7025SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
GENESYS 180 UV-Vis Spectrophotometer Thermo Fisher Scientific 840-309000 The spectrophotometer is used for measuring the oligo concentrations using the Beer's law
HEPES Sigma-Aldrich H4034 Prepare a working solution (1 M; pH = 8 with NaOH) and store it at -20 °C
Hydrochloric acid (HCl)  VWR Scientific Products BDH3028  Prepare a working solution (5 M) and store it at ambient temperature
Isopropyl Alcohol (Isopropanol), Pure Macron Fine Chemicals 3032-16 Isopropanol is used with the QIAquick Gel Extraction Kit 
L-Ascorbic acid Sigma-Aldrich A5960 Prepare a working solution (0.5 M) and store it at -20ºC
Microcentrifuge Eppendorf 5415D
NanoDrop 2000 Spectrophotometer Thermo Fisher Scientific ND-2000
NEBuffer 2 (10X) New England Biolabs M0264L (component #: B7002SVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
Nuclease-Free Water (not DEPC-Treated) Thermo Fisher Scientific AM9938 
Oligo Clean & Concentrator Kit  Zymo Research D4061  Store at ambient temperature
PEG 8000 (50% solution)  New England Biolabs M0437M (component #: B1004SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
Peltier Thermal Cycler MJ Research PTC-200
Phenol:choloroform:isoamyl alcohol 25:24:1 pH = 5.2  Thermo Fisher Scientific J62336 
PrimeScript Buffer (5X) TaKaRa 2680A 
PrimeScript Reverse Transcriptase TaKaRa 2680A 
QIAquick Gel Extraction Kit  Qiagen 28704 This kit requires a heating block and isopropanol to work with
Quick-Load Purple 100 bp DNA Ladder New England Biolabs N0551S (component #: N0551SVIAL)
Quick-Load Purple 50 bp DNA Ladder New England Biolabs N0556S (component #: N0556SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
RecJf (30 U/μL)  New England Biolabs M0264L (component #: M0264LVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
RNase Inhibitor (murine; 40 U/μL)  New England Biolabs M0314L (component #: M0314LVIAL) Store at -20 °C
SeqAMP DNA Polymerase  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
SeqAMP PCR Buffer (2X)  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
Shrimp Alkaline Phosphatase (1 U/μL)  New England Biolabs M0371L (component #: M0371LVIAL)
Sodium hydroxide (NaOH) Sigma-Aldrich  S5881 Prepare a working solution (5 M) and store it at ambient temperature
T4 DNA Ligase (400 U/μL)  New England Biolabs M0202L (component #: M0202LVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 DNA Ligase Reaction Buffer (10X)  New England Biolabs M0202L (component #: B0202SVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 RNA Ligase 1 (30 U/μL)  New England Biolabs M0437M (component #: M0437MVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)
T4 RNA Ligase Reaction Buffer (10X)  New England Biolabs M0437M (component #: B0216SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)

References

  1. Byron, S. A., Van Keuren-Jensen, K. R., Engelthaler, D. M., Carpten, J. D., Craig, D. W. Translating RNA sequencing into clinical diagnostics: opportunities and challenges. Nat Rev Gen. 17 (5), 257-271 (2016).
  2. Grillone, K., et al. Non-coding RNAs in cancer: platforms and strategies for investigating the genomic "dark matter.&#34. J Exp Clin Cancer Res. 39 (1), 117 (2020).
  3. Hwang, B., Lee, J. H., Bang, D. Single-cell RNA sequencing technologies and bioinformatics pipelines. Exp Mol Med. 50 (8), 1-14 (2018).
  4. Goh, J. J. L., et al. Highly specific multiplexed RNA imaging in tissues with split-FISH. Nat Methods. 17 (7), 689-693 (2020).
  5. Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
  6. Cummings, B. B., et al. Improving genetic diagnosis in Mendelian disease with transcriptome sequencing. Sci Transl Med. 9 (386), 5209 (2017).
  7. Hu, J. F., et al. Quantitative mapping of the cellular small RNA landscape with AQRNA-seq. Nat Biotech. 39 (8), 978-988 (2021).
  8. Alon, S., et al. Barcoding bias in high-throughput multiplex sequencing of miRNA. Genome Res. 21 (9), 1506-1511 (2011).
  9. Fuchs, R. T., Sun, Z., Zhuang, F., Robb, G. B. Bias in ligation-based small RNA sequencing library construction is determined by adaptor and RNA structure. PLoS One. 10 (5), e0126049 (2015).
  10. Pang, Y. L. J., Abo, R., Levine, S. S., Dedon, P. C. Diverse cell stresses induce unique patterns of tRNA up- and down-regulation: tRNA-seq for quantifying changes in tRNA copy number. Nuc Acids Res. 42 (22), e170 (2014).
  11. Machnicka, M. A., Olchowik, A., Grosjean, H., Bujnicki, J. M. Distribution and frequencies of post-transcriptional modifications in tRNAs. RNA Biol. 11 (12), 1619-1629 (2014).
  12. Li, F., et al. Regulatory impact of RNA secondary structure across the Arabidopsis transcriptome. Plant Cell. 24 (11), 4346-4359 (2012).
  13. García-Nieto, P. E., Wang, B., Fraser, H. B. Transcriptome diversity is a systematic source of variation in RNA-sequencing data. PLOS Comput Biol. 18 (3), e1009939 (2022).
  14. . FASTQC: a quality control tool for high throughput sequence data Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  15. Chen, S., Zhou, Y., Chen, Y., Gu, J. Fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics. 34 (17), i884-i890 (2018).
  16. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biol. 15 (12), 550 (2014).
  17. R Core Team. R: a language and environment for statistical computing. R Foundation for Statistical Computing. , (2022).
  18. Ougland, R., et al. AlkB restores the biological function of mRNA and tRNA inactivated by chemical methylation. Mol Cell. 16 (1), 107-116 (2004).
  19. Bernhardt, H. S., Tate, W. P. Primordial soup or vinaigrette: did the RNA world evolve at acidic pH. Biol Direct. 7, 4 (2012).
  20. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J Mol Biol. 215 (3), 403-410 (1990).
  21. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet. J. 17 (1), 10-12 (2011).

Play Video

Cite This Article
Chen, R., Yim, D., Dedon, P. C. AQRNA-seq for Quantifying Small RNAs. J. Vis. Exp. (204), e66335, doi:10.3791/66335 (2024).

View Video