Summary

AQRNA-seq pour la quantification de petits ARN

Published: February 02, 2024
doi:

Summary

Le séquençage de l’ARN par quantification absolue (AQRNA-seq) est une technologie développée pour quantifier le paysage de tous les petits ARN dans les mélanges biologiques. Ici, les étapes de préparation de la bibliothèque et de traitement des données d’AQRNA-seq sont démontrées, quantifiant les changements dans le pool d’ARN de transfert (ARNt) chez Mycobacterium bovis BCG pendant la dormance induite par la famine.

Abstract

AQRNA-seq fournit une relation linéaire directe entre le nombre de lectures de séquençage et le petit nombre de copies d’ARN dans un échantillon biologique, permettant ainsi une quantification précise du pool de petits ARN. La procédure de préparation de la banque AQRNA-seq décrite ici implique l’utilisation de liaisons de séquençage conçues sur mesure et une étape pour réduire les modifications de l’ARN de méthylation qui bloquent la processivité de la transcription inverse, ce qui entraîne une augmentation du rendement d’ADNc de pleine longueur. En outre, une mise en œuvre détaillée du pipeline bioinformatique qui l’accompagne est présentée. Cette démonstration de l’AQRNA-seq a été réalisée au moyen d’une analyse quantitative des 45 ARNt de Mycobacterium bovis BCG récoltés pendant 5 jours choisis au cours d’une période de 20 jours de privation de nutriments et de 6 jours de réanimation. Les efforts en cours pour améliorer l’efficacité et la rigueur d’AQRNA-seq seront également abordés ici. Il s’agit notamment d’explorer des méthodes permettant d’éviter la purification sur gel afin d’atténuer les problèmes de dimères d’amorce après l’amplification par PCR et d’augmenter la proportion de lectures sur toute la longueur afin de permettre une cartographie de lecture plus précise. Les améliorations futures d’AQRNA-seq seront axées sur la facilitation de l’automatisation et de la mise en œuvre à haut débit de cette technologie pour quantifier toutes les petites espèces d’ARN dans des échantillons de cellules et de tissus provenant de divers organismes.

Introduction

Le séquençage de nouvelle génération (NGS), également connu sous le nom de séquençage massivement parallèle, est une technologie de séquençage de l’ADN qui implique la fragmentation de l’ADN, la ligature d’oligonucléotides adaptateurs, l’amplification basée sur la réaction en chaîne par polymérase (PCR), le séquençage de l’ADN et le réassemblage des séquences de fragments dans un génome. L’adaptation du NGS à l’ARN séquencé (RNA-seq) est une approche puissante pour identifier et quantifier les transcrits d’ARN et leurs variants1. Des développements innovants dans les flux de travail de préparation de banques d’ARN et les pipelines d’analyse bioinformatique, associés aux progrès de l’instrumentation de laboratoire, ont élargi le répertoire des applications de séquençage de l’ARN, progressant au-delà du séquençage de l’exome vers des omiques fonctionnelles avancées telles que le profilage d’ARN non codant2, l’analyse de cellule unique3, la transcriptomique spatiale 4,5, l’analyse d’épissage alternatif6, entre autres. Ces méthodes avancées de séquençage de l’ARN révèlent des fonctions complexes de l’ARN grâce à l’analyse quantitative du transcriptome dans les cellules et les tissus normaux et malades.

Malgré ces avancées en matière de RNA-seq, plusieurs caractéristiques techniques clés limitent la puissance quantitative de la méthode. Bien que la plupart des méthodes de séquençage de l’ARN permettent une quantification précise et exacte des changements dans les niveaux d’ARN entre des variables expérimentales (c’est-à-dire des échantillons biologiques et/ou des états physiologiques), elles ne peuvent pas fournir de comparaisons quantitatives des niveaux de molécules d’ARN dans un échantillon. Par exemple, la plupart des méthodes de séquençage de l’ARN ne peuvent pas quantifier avec précision le nombre relatif de copies de molécules isoaccepteurs d’ARNt individuelles dans un pool cellulaire d’ARNt exprimés. Comme souligné dans la publicationcomplémentaire 7, cette limitation du séquençage de l’ARN découle de plusieurs caractéristiques de la structure de l’ARN et de la biochimie de la préparation des banques. Par exemple, l’activité des enzymes de ligature utilisées pour fixer les liaisons de séquençage aux extrémités 3′ et 5′ aux molécules d’ARN est fortement influencée par l’identité des nucléotides terminaux de l’ARN et des liaisons de séquençage. Cela conduit à de grandes variations dans l’efficacité des ligatures de liaison et à de profondes augmentations artificielles des lectures de séquençage 8,9,10.

Une deuxième série de limitations découle des propriétés structurelles inhérentes aux molécules d’ARN. Plus précisément, la formation de la structure secondaire de l’ARN et les changements dynamiques dans les dizaines de modifications post-transcriptionnelles de l’ARN de l’épitranscriptome peuvent provoquer une chute ou une mutation de la polymérase au cours de la transcription inverse. Ces erreurs entraînent une synthèse incomplète ou tronquée de l’ADNc ou une séquence d’ARN altérée. Bien que ces deux phénomènes puissent être exploités pour cartographier des structures secondaires ou certaines modifications, ils dégradent la précision quantitative du séquençage de l’ARN si les étapes ultérieures de préparation de la bibliothèque ne parviennent pas à capturer des ADNc tronqués ou si le traitement des données rejette des séquences mutées ne correspondant pas à un ensemble de données de référence11,12. De plus, l’immense diversité chimique, de longueur et structurelle des transcrits d’ARN, ainsi que le manque d’outils pour fragmenter uniformément les ARN longs, diminuent l’applicabilité de la plupart des méthodes de séquençage de l’ARN à toutes les espèces d’ARN13.

La méthode AQRNA-seq (absolute quantification RNA sequencing) a été développée pour lever plusieurs de ces contraintes techniques et biologiques qui limitent la précision quantitative7. En minimisant les biais dépendants de la séquence dans la capture, la ligature et l’amplification lors de la préparation de la bibliothèque de séquençage de l’ARN, AQRNA-seq atteint une linéarité supérieure par rapport aux autres méthodes, quantifiant avec précision 75 % d’une bibliothèque de référence de 963 miARN avec une précision 2 fois supérieure. Cette corrélation linéaire du nombre de lectures de séquençage et de l’abondance de l’ARN est également observée dans l’analyse d’un pool de longueurs variables d’étalons d’oligonucléotides d’ARN et en référence à des méthodes orthogonales comme le transfert de Northern. L’établissement de la linéarité entre le nombre de lectures de séquençage et l’abondance de l’ARN permet à l’AQRNA-seq d’obtenir une quantification précise et absolue de toutes les espèces d’ARN au sein d’un échantillon.

Voici une description du protocole pour le flux de travail de préparation de la bibliothèque AQRNA-seq et du pipeline d’analyse de données en aval qui l’accompagne. La méthode a été appliquée pour élucider la dynamique de l’abondance de l’ARNt pendant la dormance induite par la famine et la réanimation ultérieure dans le modèle de tuberculose du modèle de la tuberculose à Bacilles de Calmette et Guérin de Mycobacterium bovis . Les résultats ont été présentés pour la visualisation exploratoire des données de séquençage, ainsi que pour les analyses ultérieures de regroupement et d’expression différentielle qui ont révélé des modèles discernables dans l’abondance de l’ARNt associés à divers phénotypes.

Protocol

REMARQUE : La figure 1 fournit une illustration graphique des procédures impliquées dans la préparation de la bibliothèque AQRNA-seq. Des informations détaillées concernant les réactifs, les produits chimiques et les colonnes/kits utilisés dans la procédure se trouvent dans la table des matériaux. Il est recommandé d’effectuer une évaluation complète de la pureté, de l’intégrité et de la quantité des échantillons d’ARN d’entrée à l’aide (i) d’…

Representative Results

Mycobacterium bovis La souche 1173P2 du BCG (bacilles de Calmette et Guérin) subissant une croissance exponentielle a été soumise à une série chronologique (0, 4, 10 et 20 jours) de privation en nutriments, suivie d’une réanimation de 6 jours dans un milieu riche en nutriments, comme présenté précédemment dans Hu et al.7. De petits ARN ont été isolés à partir d’une culture bactérienne, avec trois réplicats biologiques, à chacun des cinq points temporels désignés. Le…

Discussion

Le flux de travail de préparation de la banque AQRNA-seq est conçu pour maximiser la capture d’ARN dans un échantillon et minimiser la chute de polymérase lors de la transcription inverse7. Grâce à une ligature de liaison en deux étapes, de nouveaux oligonucléotides d’ADN (Linker 1 et Linker 2) sont ligaturés en excès pour compléter pleinement l’ARN de l’échantillon. Les agents de liaison en excès peuvent être éliminés efficacement avec RecJf, une exonucléase de 5′ à 3′ s…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Les auteurs de ce travail sont reconnaissants envers les auteurs de l’article original décrivant la technologie AQRNA-seq7. Ce travail a été soutenu par des subventions des National Institutes of Health (ES002109, AG063341, ES031576, ES031529, ES026856) et de la National Research Foundation de Singapour par le biais de l’Alliance Singapour-MIT pour la recherche et la technologie Antimicrobial Resistance IRG.

Materials

2-ketoglutarate  Sigma-Aldrich 75890 Prepare a working solution (1 M) and store it at -20ºC
2100 Bioanalyzer Instrument Agilent G2938C
5'-deadenylase (50 U/μL)  New England Biolabs M0331S (component #: M0331SVIAL) Store at -20 °C
Adenosine 5'-Triphosphate (ATP)  New England Biolabs M0437M (component #: N0437AVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
AGAROSE GPG/LE AmericanBio AB00972-00500 Store at ambient temperature
Ammonium iron(II) sulfate hexahydrate Sigma-Aldrich F2262 Prepare a working solution (0.25 M) and store it at -20 °C
Bioanalyzer Small RNA Analysis Agilent 5067-1548  The Small RNA Analysis is used for checking the quality of input RNAs and the efficiency of enzymatic reactions (e.g., Linker 1 ligation)
Bovine Serum Albumin (BSA; 10 mg/mL)  New England Biolabs B9000 This product was discontinued on 12/15/2022 and is replaced with Recombinant Albumin, Molecular Biology Grade (NEB B9200).
Chloroform  Macron Fine Chemicals 4441-10
Demethylase  ArrayStar AS-FS-004 Demethylase comes with the rtStar tRNA Pretreatment & First-Strand cDNA Synthesis Kit (AS-FS-004)
Deoxynucleotide (dNTP) Solution Mix New England Biolabs N0447L (component #: N0447LVIAL) This dNTP Solution Mix contains equimolar concentrations of dATP, dCTP, dGTP and dTTP (10 mM each)
Digital Dual Heat Block VWR Scientific Products 13259-052 Heating block is used with the QIAquick Gel Extraction Kit 
DyeEx 2.0 Spin Kit  Qiagen 63204  Effective at removing short remnants (e.g., oligos less than 10 bp in length)
Electrophoresis Power Supply Bio-Rad Labrotories PowerPac 300
Eppendorf PCR Tubes (0.5 mL) Eppendorf 0030124537
Eppendorf Safe-Lock Tubes (0.5 mL) Eppendorf 022363611
Eppendorf Safe-Lock Tubes (1.5 mL) Eppendorf 022363204
Eppendorf Safe-Lock Tubes (2 mL) Eppendorf 022363352
Ethyl alcohol (Ethanol), Pure Sigma-Aldrich E7023  The pure ethanol is used with the Oligo Clean and Concentrator Kit from Zymo Research
Gel Imaging System Alpha Innotech FluorChem 8900
Gel Loading Dye, Purple (6X), no SDS New England Biolabs N0556S (component #: B7025SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
GENESYS 180 UV-Vis Spectrophotometer Thermo Fisher Scientific 840-309000 The spectrophotometer is used for measuring the oligo concentrations using the Beer's law
HEPES Sigma-Aldrich H4034 Prepare a working solution (1 M; pH = 8 with NaOH) and store it at -20 °C
Hydrochloric acid (HCl)  VWR Scientific Products BDH3028  Prepare a working solution (5 M) and store it at ambient temperature
Isopropyl Alcohol (Isopropanol), Pure Macron Fine Chemicals 3032-16 Isopropanol is used with the QIAquick Gel Extraction Kit 
L-Ascorbic acid Sigma-Aldrich A5960 Prepare a working solution (0.5 M) and store it at -20ºC
Microcentrifuge Eppendorf 5415D
NanoDrop 2000 Spectrophotometer Thermo Fisher Scientific ND-2000
NEBuffer 2 (10X) New England Biolabs M0264L (component #: B7002SVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
Nuclease-Free Water (not DEPC-Treated) Thermo Fisher Scientific AM9938 
Oligo Clean & Concentrator Kit  Zymo Research D4061  Store at ambient temperature
PEG 8000 (50% solution)  New England Biolabs M0437M (component #: B1004SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
Peltier Thermal Cycler MJ Research PTC-200
Phenol:choloroform:isoamyl alcohol 25:24:1 pH = 5.2  Thermo Fisher Scientific J62336 
PrimeScript Buffer (5X) TaKaRa 2680A 
PrimeScript Reverse Transcriptase TaKaRa 2680A 
QIAquick Gel Extraction Kit  Qiagen 28704 This kit requires a heating block and isopropanol to work with
Quick-Load Purple 100 bp DNA Ladder New England Biolabs N0551S (component #: N0551SVIAL)
Quick-Load Purple 50 bp DNA Ladder New England Biolabs N0556S (component #: N0556SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
RecJf (30 U/μL)  New England Biolabs M0264L (component #: M0264LVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
RNase Inhibitor (murine; 40 U/μL)  New England Biolabs M0314L (component #: M0314LVIAL) Store at -20 °C
SeqAMP DNA Polymerase  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
SeqAMP PCR Buffer (2X)  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
Shrimp Alkaline Phosphatase (1 U/μL)  New England Biolabs M0371L (component #: M0371LVIAL)
Sodium hydroxide (NaOH) Sigma-Aldrich  S5881 Prepare a working solution (5 M) and store it at ambient temperature
T4 DNA Ligase (400 U/μL)  New England Biolabs M0202L (component #: M0202LVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 DNA Ligase Reaction Buffer (10X)  New England Biolabs M0202L (component #: B0202SVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 RNA Ligase 1 (30 U/μL)  New England Biolabs M0437M (component #: M0437MVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)
T4 RNA Ligase Reaction Buffer (10X)  New England Biolabs M0437M (component #: B0216SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)

References

  1. Byron, S. A., Van Keuren-Jensen, K. R., Engelthaler, D. M., Carpten, J. D., Craig, D. W. Translating RNA sequencing into clinical diagnostics: opportunities and challenges. Nat Rev Gen. 17 (5), 257-271 (2016).
  2. Grillone, K., et al. Non-coding RNAs in cancer: platforms and strategies for investigating the genomic "dark matter.&#34. J Exp Clin Cancer Res. 39 (1), 117 (2020).
  3. Hwang, B., Lee, J. H., Bang, D. Single-cell RNA sequencing technologies and bioinformatics pipelines. Exp Mol Med. 50 (8), 1-14 (2018).
  4. Goh, J. J. L., et al. Highly specific multiplexed RNA imaging in tissues with split-FISH. Nat Methods. 17 (7), 689-693 (2020).
  5. Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
  6. Cummings, B. B., et al. Improving genetic diagnosis in Mendelian disease with transcriptome sequencing. Sci Transl Med. 9 (386), 5209 (2017).
  7. Hu, J. F., et al. Quantitative mapping of the cellular small RNA landscape with AQRNA-seq. Nat Biotech. 39 (8), 978-988 (2021).
  8. Alon, S., et al. Barcoding bias in high-throughput multiplex sequencing of miRNA. Genome Res. 21 (9), 1506-1511 (2011).
  9. Fuchs, R. T., Sun, Z., Zhuang, F., Robb, G. B. Bias in ligation-based small RNA sequencing library construction is determined by adaptor and RNA structure. PLoS One. 10 (5), e0126049 (2015).
  10. Pang, Y. L. J., Abo, R., Levine, S. S., Dedon, P. C. Diverse cell stresses induce unique patterns of tRNA up- and down-regulation: tRNA-seq for quantifying changes in tRNA copy number. Nuc Acids Res. 42 (22), e170 (2014).
  11. Machnicka, M. A., Olchowik, A., Grosjean, H., Bujnicki, J. M. Distribution and frequencies of post-transcriptional modifications in tRNAs. RNA Biol. 11 (12), 1619-1629 (2014).
  12. Li, F., et al. Regulatory impact of RNA secondary structure across the Arabidopsis transcriptome. Plant Cell. 24 (11), 4346-4359 (2012).
  13. García-Nieto, P. E., Wang, B., Fraser, H. B. Transcriptome diversity is a systematic source of variation in RNA-sequencing data. PLOS Comput Biol. 18 (3), e1009939 (2022).
  14. . FASTQC: a quality control tool for high throughput sequence data Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  15. Chen, S., Zhou, Y., Chen, Y., Gu, J. Fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics. 34 (17), i884-i890 (2018).
  16. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biol. 15 (12), 550 (2014).
  17. R Core Team. R: a language and environment for statistical computing. R Foundation for Statistical Computing. , (2022).
  18. Ougland, R., et al. AlkB restores the biological function of mRNA and tRNA inactivated by chemical methylation. Mol Cell. 16 (1), 107-116 (2004).
  19. Bernhardt, H. S., Tate, W. P. Primordial soup or vinaigrette: did the RNA world evolve at acidic pH. Biol Direct. 7, 4 (2012).
  20. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J Mol Biol. 215 (3), 403-410 (1990).
  21. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet. J. 17 (1), 10-12 (2011).

Play Video

Cite This Article
Chen, R., Yim, D., Dedon, P. C. AQRNA-seq for Quantifying Small RNAs. J. Vis. Exp. (204), e66335, doi:10.3791/66335 (2024).

View Video