Summary

AQRNA-seq para cuantificar ARNs pequeños

Published: February 02, 2024
doi:

Summary

La secuenciación de ARN de cuantificación absoluta (AQRNA-seq) es una tecnología desarrollada para cuantificar el panorama de todos los ARN pequeños en mezclas biológicas. Aquí, se demuestran los pasos de preparación de la biblioteca y procesamiento de datos de AQRNA-seq, cuantificando los cambios en el grupo de ARN de transferencia (ARNt) en Mycobacterium bovis BCG durante la latencia inducida por inanición.

Abstract

AQRNA-seq proporciona una relación lineal directa entre los recuentos de lecturas de secuenciación y el número pequeño de copias de ARN en una muestra biológica, lo que permite una cuantificación precisa del grupo de ARN pequeños. El procedimiento de preparación de la biblioteca AQRNA-seq descrito aquí implica el uso de enlazadores de secuenciación diseñados a medida y un paso para reducir las modificaciones del ARN de metilación que bloquean la procesividad de transcripción inversa, lo que da como resultado un mayor rendimiento de ADNc de longitud completa. Además, se presenta una implementación detallada de la cartera de productos bioinformáticos que la acompaña. Esta demostración de AQRNA-seq se llevó a cabo a través de un análisis cuantitativo de los 45 ARNt en Mycobacterium bovis BCG cosechados en 5 días seleccionados a lo largo de un curso de 20 días de privación de nutrientes y 6 días de reanimación. Los esfuerzos en curso para mejorar la eficiencia y el rigor de AQRNA-seq también se discutirán aquí. Esto incluye explorar métodos para obviar la purificación en gel para mitigar los problemas de dímero de cebador después de la amplificación de PCR y para aumentar la proporción de lecturas completas para permitir un mapeo de lectura más preciso. Las futuras mejoras de AQRNA-seq se centrarán en facilitar la automatización y la implementación de alto rendimiento de esta tecnología para cuantificar todas las especies pequeñas de ARN en muestras de células y tejidos de diversos organismos.

Introduction

La secuenciación de próxima generación (NGS), también conocida como secuenciación paralela masiva, es una tecnología de secuenciación de ADN que implica la fragmentación del ADN, la ligadura de oligonucleótidos adaptadores, la amplificación basada en la reacción en cadena de la polimerasa (PCR), la secuenciación del ADN y el reensamblaje de las secuencias de fragmentos en un genoma. La adaptación de NGS a la secuencia de ARN (RNA-seq) es un enfoque poderoso para identificar y cuantificar las transcripciones de ARN y sus variantes1. Los desarrollos innovadores en los flujos de trabajo de preparación de bibliotecas de ARN y las tuberías de análisis bioinformático, junto con los avances en la instrumentación de laboratorio, han ampliado el repertorio de aplicaciones de secuenciación de ARN, progresando más allá de la secuenciación del exoma hacia ómicas funcionales avanzadas como el perfil de ARN no codificante2, el análisis de células individuales3, la transcriptómica espacial 4,5, el análisis de empalme alternativo6entre otros. Estos métodos avanzados de secuenciación de ARN revelan funciones complejas de ARN a través del análisis cuantitativo del transcriptoma en células y tejidos normales y enfermos.

A pesar de estos avances en la secuenciación de ARN, varias características técnicas clave limitan el poder cuantitativo del método. Si bien la mayoría de los métodos de secuenciación de ARN permiten una cuantificación precisa y precisa de los cambios en los niveles de ARN entre variables experimentales (es decir, muestras biológicas y/o estados fisiológicos), no pueden proporcionar comparaciones cuantitativas de los niveles de moléculas de ARN dentro de una muestra. Por ejemplo, la mayoría de los métodos de secuenciación de ARN no pueden cuantificar con precisión el número relativo de copias de moléculas isoaceptoras de ARNt individuales en un grupo celular de ARNt expresados. Como se destaca en la publicación complementaria7, esta limitación a la secuenciación de ARN surge de varias características de la estructura del ARN y la bioquímica de la preparación de la biblioteca. Por ejemplo, la actividad de las enzimas de ligadura utilizadas para unir los enlazadores de secuenciación de los extremos 3′ y 5′ a las moléculas de ARN está fuertemente influenciada por la identidad de los nucleótidos terminales del ARN y los enlazadores de secuenciación. Esto conduce a grandes variaciones en la eficiencia de las ligaduras de enlazadores y profundos aumentos artifactuales en las lecturas de secuenciación 8,9,10.

Un segundo conjunto de limitaciones surgen de las propiedades estructurales inherentes de las moléculas de ARN. Específicamente, la formación de la estructura secundaria del ARN y los cambios dinámicos en las docenas de modificaciones postranscripcionales del ARN del epitranscriptoma pueden causar la caída de la polimerasa o la mutación durante la transcripción inversa. Estos errores dan lugar a una síntesis de ADNc incompleta o truncada o a una secuencia de ARN alterada. Si bien ambos fenómenos pueden explotarse para mapear estructuras secundarias o algunas modificaciones, degradan la precisión cuantitativa de la secuenciación de ARN si los pasos posteriores de preparación de la biblioteca no logran capturar ADNc truncados o si el procesamiento de datos arroja secuencias mutadas que no coinciden con un conjunto de datos de referencia11,12. Además, la inmensa diversidad química, estructural y de longitud de los transcritos de ARN, así como la falta de herramientas para fragmentar uniformemente los ARN largos, disminuye la aplicabilidad de la mayoría de los métodos de secuenciación de ARN a todas las especies de ARN13.

El método AQRNA-seq (secuenciación de ARN de cuantificación absoluta) se ha desarrollado para eliminar varias de estas restricciones técnicas y biológicas que limitan la precisión cuantitativa7. Al minimizar los sesgos dependientes de la secuencia en la captura, ligadura y amplificación durante la preparación de la biblioteca de secuenciación de ARN, AQRNA-seq logra una linealidad superior en comparación con otros métodos, cuantificando con precisión el 75% de una biblioteca de referencia de 963 miARN con una precisión de 2 veces. Esta correlación lineal entre el recuento de lecturas de secuenciación y la abundancia de ARN también se observa en un análisis de un grupo de longitud variable de estándares de oligonucleótidos de ARN y en referencia a métodos ortogonales como el Northern blot. El establecimiento de la linealidad entre el recuento de lecturas de secuenciación y la abundancia de ARN permite a AQRNA-seq lograr una cuantificación precisa y absoluta de todas las especies de ARN dentro de una muestra.

A continuación, se muestra una descripción del protocolo para el flujo de trabajo de preparación de la biblioteca AQRNA-seq y la canalización de análisis de datos descendente que lo acompaña. El método se aplicó para dilucidar la dinámica de la abundancia de ARNt durante la latencia inducida por inanición y la posterior reanimación en el modelo de tuberculosis Mycobacterium bovis bacilli de Calmette et Guérin (BCG). Se presentaron los resultados para la visualización exploratoria de los datos de secuenciación, junto con los posteriores análisis de agrupamiento y expresión diferencial que revelaron patrones discernibles en la abundancia de ARNt asociados con varios fenotipos.

Protocol

NOTA: La Figura 1 proporciona una ilustración gráfica de los procedimientos involucrados en la preparación de la biblioteca AQRNA-seq. La información detallada sobre los reactivos, productos químicos y columnas/kits utilizados en el procedimiento se puede encontrar en la Tabla de Materiales. Se recomienda realizar una evaluación exhaustiva de la pureza, integridad y cantidad de las muestras de ARN de entrada utilizando (i) electroforesis en gel de agarosa al 3%, (ii) h…

Representative Results

Mycobacterium bovis La cepa BCG (bacilos de Calmette et Guérin) 1173P2 en crecimiento exponencial se sometió a una serie temporal (0, 4, 10 y 20 días) de inanición de nutrientes, seguida de una reanimación de 6 días en un medio rico en nutrientes, como se presentó previamente en Hu et al.7. Se aislaron pequeños ARN de cultivo bacteriano, con tres réplicas biológicas, en cada uno de los cinco puntos de tiempo designados. Las bibliotecas de Illumina se construyeron utilizando el f…

Discussion

El flujo de trabajo de preparación de la biblioteca AQRNA-seq está diseñado para maximizar la captura de ARN dentro de una muestra y minimizar la caída de la polimerasa durante la transcripción inversa7. A través de una ligadura de enlazador de dos pasos, los nuevos oligonucleótidos de ADN (Linker 1 y Linker 2) se ligan en exceso para complementar completamente el ARN dentro de la muestra. El exceso de enlazadores se puede eliminar de manera eficiente con RecJf, una exonucleasa de 5′ a 3′ e…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Los autores del presente trabajo agradecen a los autores del artículo original que describe la tecnología AQRNA-seq7. Este trabajo fue apoyado por subvenciones de los Institutos Nacionales de Salud (ES002109, AG063341, ES031576, ES031529, ES026856) y la Fundación Nacional de Investigación de Singapur a través de la Alianza Singapur-MIT para la Investigación y Tecnología de la Resistencia a los Antimicrobianos IRG.

Materials

2-ketoglutarate  Sigma-Aldrich 75890 Prepare a working solution (1 M) and store it at -20ºC
2100 Bioanalyzer Instrument Agilent G2938C
5'-deadenylase (50 U/μL)  New England Biolabs M0331S (component #: M0331SVIAL) Store at -20 °C
Adenosine 5'-Triphosphate (ATP)  New England Biolabs M0437M (component #: N0437AVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
AGAROSE GPG/LE AmericanBio AB00972-00500 Store at ambient temperature
Ammonium iron(II) sulfate hexahydrate Sigma-Aldrich F2262 Prepare a working solution (0.25 M) and store it at -20 °C
Bioanalyzer Small RNA Analysis Agilent 5067-1548  The Small RNA Analysis is used for checking the quality of input RNAs and the efficiency of enzymatic reactions (e.g., Linker 1 ligation)
Bovine Serum Albumin (BSA; 10 mg/mL)  New England Biolabs B9000 This product was discontinued on 12/15/2022 and is replaced with Recombinant Albumin, Molecular Biology Grade (NEB B9200).
Chloroform  Macron Fine Chemicals 4441-10
Demethylase  ArrayStar AS-FS-004 Demethylase comes with the rtStar tRNA Pretreatment & First-Strand cDNA Synthesis Kit (AS-FS-004)
Deoxynucleotide (dNTP) Solution Mix New England Biolabs N0447L (component #: N0447LVIAL) This dNTP Solution Mix contains equimolar concentrations of dATP, dCTP, dGTP and dTTP (10 mM each)
Digital Dual Heat Block VWR Scientific Products 13259-052 Heating block is used with the QIAquick Gel Extraction Kit 
DyeEx 2.0 Spin Kit  Qiagen 63204  Effective at removing short remnants (e.g., oligos less than 10 bp in length)
Electrophoresis Power Supply Bio-Rad Labrotories PowerPac 300
Eppendorf PCR Tubes (0.5 mL) Eppendorf 0030124537
Eppendorf Safe-Lock Tubes (0.5 mL) Eppendorf 022363611
Eppendorf Safe-Lock Tubes (1.5 mL) Eppendorf 022363204
Eppendorf Safe-Lock Tubes (2 mL) Eppendorf 022363352
Ethyl alcohol (Ethanol), Pure Sigma-Aldrich E7023  The pure ethanol is used with the Oligo Clean and Concentrator Kit from Zymo Research
Gel Imaging System Alpha Innotech FluorChem 8900
Gel Loading Dye, Purple (6X), no SDS New England Biolabs N0556S (component #: B7025SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
GENESYS 180 UV-Vis Spectrophotometer Thermo Fisher Scientific 840-309000 The spectrophotometer is used for measuring the oligo concentrations using the Beer's law
HEPES Sigma-Aldrich H4034 Prepare a working solution (1 M; pH = 8 with NaOH) and store it at -20 °C
Hydrochloric acid (HCl)  VWR Scientific Products BDH3028  Prepare a working solution (5 M) and store it at ambient temperature
Isopropyl Alcohol (Isopropanol), Pure Macron Fine Chemicals 3032-16 Isopropanol is used with the QIAquick Gel Extraction Kit 
L-Ascorbic acid Sigma-Aldrich A5960 Prepare a working solution (0.5 M) and store it at -20ºC
Microcentrifuge Eppendorf 5415D
NanoDrop 2000 Spectrophotometer Thermo Fisher Scientific ND-2000
NEBuffer 2 (10X) New England Biolabs M0264L (component #: B7002SVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
Nuclease-Free Water (not DEPC-Treated) Thermo Fisher Scientific AM9938 
Oligo Clean & Concentrator Kit  Zymo Research D4061  Store at ambient temperature
PEG 8000 (50% solution)  New England Biolabs M0437M (component #: B1004SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC
Peltier Thermal Cycler MJ Research PTC-200
Phenol:choloroform:isoamyl alcohol 25:24:1 pH = 5.2  Thermo Fisher Scientific J62336 
PrimeScript Buffer (5X) TaKaRa 2680A 
PrimeScript Reverse Transcriptase TaKaRa 2680A 
QIAquick Gel Extraction Kit  Qiagen 28704 This kit requires a heating block and isopropanol to work with
Quick-Load Purple 100 bp DNA Ladder New England Biolabs N0551S (component #: N0551SVIAL)
Quick-Load Purple 50 bp DNA Ladder New England Biolabs N0556S (component #: N0556SVIAL) NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS
RecJf (30 U/μL)  New England Biolabs M0264L (component #: M0264LVIAL) NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C
RNase Inhibitor (murine; 40 U/μL)  New England Biolabs M0314L (component #: M0314LVIAL) Store at -20 °C
SeqAMP DNA Polymerase  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
SeqAMP PCR Buffer (2X)  TaKaRa 638509  TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X)
Shrimp Alkaline Phosphatase (1 U/μL)  New England Biolabs M0371L (component #: M0371LVIAL)
Sodium hydroxide (NaOH) Sigma-Aldrich  S5881 Prepare a working solution (5 M) and store it at ambient temperature
T4 DNA Ligase (400 U/μL)  New England Biolabs M0202L (component #: M0202LVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 DNA Ligase Reaction Buffer (10X)  New England Biolabs M0202L (component #: B0202SVIAL) NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X)
T4 RNA Ligase 1 (30 U/μL)  New England Biolabs M0437M (component #: M0437MVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)
T4 RNA Ligase Reaction Buffer (10X)  New England Biolabs M0437M (component #: B0216SVIAL) NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM)

References

  1. Byron, S. A., Van Keuren-Jensen, K. R., Engelthaler, D. M., Carpten, J. D., Craig, D. W. Translating RNA sequencing into clinical diagnostics: opportunities and challenges. Nat Rev Gen. 17 (5), 257-271 (2016).
  2. Grillone, K., et al. Non-coding RNAs in cancer: platforms and strategies for investigating the genomic "dark matter.&#34. J Exp Clin Cancer Res. 39 (1), 117 (2020).
  3. Hwang, B., Lee, J. H., Bang, D. Single-cell RNA sequencing technologies and bioinformatics pipelines. Exp Mol Med. 50 (8), 1-14 (2018).
  4. Goh, J. J. L., et al. Highly specific multiplexed RNA imaging in tissues with split-FISH. Nat Methods. 17 (7), 689-693 (2020).
  5. Moses, L., Pachter, L. Museum of spatial transcriptomics. Nat Methods. 19 (5), 534-546 (2022).
  6. Cummings, B. B., et al. Improving genetic diagnosis in Mendelian disease with transcriptome sequencing. Sci Transl Med. 9 (386), 5209 (2017).
  7. Hu, J. F., et al. Quantitative mapping of the cellular small RNA landscape with AQRNA-seq. Nat Biotech. 39 (8), 978-988 (2021).
  8. Alon, S., et al. Barcoding bias in high-throughput multiplex sequencing of miRNA. Genome Res. 21 (9), 1506-1511 (2011).
  9. Fuchs, R. T., Sun, Z., Zhuang, F., Robb, G. B. Bias in ligation-based small RNA sequencing library construction is determined by adaptor and RNA structure. PLoS One. 10 (5), e0126049 (2015).
  10. Pang, Y. L. J., Abo, R., Levine, S. S., Dedon, P. C. Diverse cell stresses induce unique patterns of tRNA up- and down-regulation: tRNA-seq for quantifying changes in tRNA copy number. Nuc Acids Res. 42 (22), e170 (2014).
  11. Machnicka, M. A., Olchowik, A., Grosjean, H., Bujnicki, J. M. Distribution and frequencies of post-transcriptional modifications in tRNAs. RNA Biol. 11 (12), 1619-1629 (2014).
  12. Li, F., et al. Regulatory impact of RNA secondary structure across the Arabidopsis transcriptome. Plant Cell. 24 (11), 4346-4359 (2012).
  13. García-Nieto, P. E., Wang, B., Fraser, H. B. Transcriptome diversity is a systematic source of variation in RNA-sequencing data. PLOS Comput Biol. 18 (3), e1009939 (2022).
  14. . FASTQC: a quality control tool for high throughput sequence data Available from: https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ (2010)
  15. Chen, S., Zhou, Y., Chen, Y., Gu, J. Fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics. 34 (17), i884-i890 (2018).
  16. Love, M. I., Huber, W., Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biol. 15 (12), 550 (2014).
  17. R Core Team. R: a language and environment for statistical computing. R Foundation for Statistical Computing. , (2022).
  18. Ougland, R., et al. AlkB restores the biological function of mRNA and tRNA inactivated by chemical methylation. Mol Cell. 16 (1), 107-116 (2004).
  19. Bernhardt, H. S., Tate, W. P. Primordial soup or vinaigrette: did the RNA world evolve at acidic pH. Biol Direct. 7, 4 (2012).
  20. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J Mol Biol. 215 (3), 403-410 (1990).
  21. Martin, M. Cutadapt removes adapter sequences from high-throughput sequencing reads. EMBnet. J. 17 (1), 10-12 (2011).

Play Video

Cite This Article
Chen, R., Yim, D., Dedon, P. C. AQRNA-seq for Quantifying Small RNAs. J. Vis. Exp. (204), e66335, doi:10.3791/66335 (2024).

View Video