La secuenciación de ARN de cuantificación absoluta (AQRNA-seq) es una tecnología desarrollada para cuantificar el panorama de todos los ARN pequeños en mezclas biológicas. Aquí, se demuestran los pasos de preparación de la biblioteca y procesamiento de datos de AQRNA-seq, cuantificando los cambios en el grupo de ARN de transferencia (ARNt) en Mycobacterium bovis BCG durante la latencia inducida por inanición.
AQRNA-seq proporciona una relación lineal directa entre los recuentos de lecturas de secuenciación y el número pequeño de copias de ARN en una muestra biológica, lo que permite una cuantificación precisa del grupo de ARN pequeños. El procedimiento de preparación de la biblioteca AQRNA-seq descrito aquí implica el uso de enlazadores de secuenciación diseñados a medida y un paso para reducir las modificaciones del ARN de metilación que bloquean la procesividad de transcripción inversa, lo que da como resultado un mayor rendimiento de ADNc de longitud completa. Además, se presenta una implementación detallada de la cartera de productos bioinformáticos que la acompaña. Esta demostración de AQRNA-seq se llevó a cabo a través de un análisis cuantitativo de los 45 ARNt en Mycobacterium bovis BCG cosechados en 5 días seleccionados a lo largo de un curso de 20 días de privación de nutrientes y 6 días de reanimación. Los esfuerzos en curso para mejorar la eficiencia y el rigor de AQRNA-seq también se discutirán aquí. Esto incluye explorar métodos para obviar la purificación en gel para mitigar los problemas de dímero de cebador después de la amplificación de PCR y para aumentar la proporción de lecturas completas para permitir un mapeo de lectura más preciso. Las futuras mejoras de AQRNA-seq se centrarán en facilitar la automatización y la implementación de alto rendimiento de esta tecnología para cuantificar todas las especies pequeñas de ARN en muestras de células y tejidos de diversos organismos.
La secuenciación de próxima generación (NGS), también conocida como secuenciación paralela masiva, es una tecnología de secuenciación de ADN que implica la fragmentación del ADN, la ligadura de oligonucleótidos adaptadores, la amplificación basada en la reacción en cadena de la polimerasa (PCR), la secuenciación del ADN y el reensamblaje de las secuencias de fragmentos en un genoma. La adaptación de NGS a la secuencia de ARN (RNA-seq) es un enfoque poderoso para identificar y cuantificar las transcripciones de ARN y sus variantes1. Los desarrollos innovadores en los flujos de trabajo de preparación de bibliotecas de ARN y las tuberías de análisis bioinformático, junto con los avances en la instrumentación de laboratorio, han ampliado el repertorio de aplicaciones de secuenciación de ARN, progresando más allá de la secuenciación del exoma hacia ómicas funcionales avanzadas como el perfil de ARN no codificante2, el análisis de células individuales3, la transcriptómica espacial 4,5, el análisis de empalme alternativo6entre otros. Estos métodos avanzados de secuenciación de ARN revelan funciones complejas de ARN a través del análisis cuantitativo del transcriptoma en células y tejidos normales y enfermos.
A pesar de estos avances en la secuenciación de ARN, varias características técnicas clave limitan el poder cuantitativo del método. Si bien la mayoría de los métodos de secuenciación de ARN permiten una cuantificación precisa y precisa de los cambios en los niveles de ARN entre variables experimentales (es decir, muestras biológicas y/o estados fisiológicos), no pueden proporcionar comparaciones cuantitativas de los niveles de moléculas de ARN dentro de una muestra. Por ejemplo, la mayoría de los métodos de secuenciación de ARN no pueden cuantificar con precisión el número relativo de copias de moléculas isoaceptoras de ARNt individuales en un grupo celular de ARNt expresados. Como se destaca en la publicación complementaria7, esta limitación a la secuenciación de ARN surge de varias características de la estructura del ARN y la bioquímica de la preparación de la biblioteca. Por ejemplo, la actividad de las enzimas de ligadura utilizadas para unir los enlazadores de secuenciación de los extremos 3′ y 5′ a las moléculas de ARN está fuertemente influenciada por la identidad de los nucleótidos terminales del ARN y los enlazadores de secuenciación. Esto conduce a grandes variaciones en la eficiencia de las ligaduras de enlazadores y profundos aumentos artifactuales en las lecturas de secuenciación 8,9,10.
Un segundo conjunto de limitaciones surgen de las propiedades estructurales inherentes de las moléculas de ARN. Específicamente, la formación de la estructura secundaria del ARN y los cambios dinámicos en las docenas de modificaciones postranscripcionales del ARN del epitranscriptoma pueden causar la caída de la polimerasa o la mutación durante la transcripción inversa. Estos errores dan lugar a una síntesis de ADNc incompleta o truncada o a una secuencia de ARN alterada. Si bien ambos fenómenos pueden explotarse para mapear estructuras secundarias o algunas modificaciones, degradan la precisión cuantitativa de la secuenciación de ARN si los pasos posteriores de preparación de la biblioteca no logran capturar ADNc truncados o si el procesamiento de datos arroja secuencias mutadas que no coinciden con un conjunto de datos de referencia11,12. Además, la inmensa diversidad química, estructural y de longitud de los transcritos de ARN, así como la falta de herramientas para fragmentar uniformemente los ARN largos, disminuye la aplicabilidad de la mayoría de los métodos de secuenciación de ARN a todas las especies de ARN13.
El método AQRNA-seq (secuenciación de ARN de cuantificación absoluta) se ha desarrollado para eliminar varias de estas restricciones técnicas y biológicas que limitan la precisión cuantitativa7. Al minimizar los sesgos dependientes de la secuencia en la captura, ligadura y amplificación durante la preparación de la biblioteca de secuenciación de ARN, AQRNA-seq logra una linealidad superior en comparación con otros métodos, cuantificando con precisión el 75% de una biblioteca de referencia de 963 miARN con una precisión de 2 veces. Esta correlación lineal entre el recuento de lecturas de secuenciación y la abundancia de ARN también se observa en un análisis de un grupo de longitud variable de estándares de oligonucleótidos de ARN y en referencia a métodos ortogonales como el Northern blot. El establecimiento de la linealidad entre el recuento de lecturas de secuenciación y la abundancia de ARN permite a AQRNA-seq lograr una cuantificación precisa y absoluta de todas las especies de ARN dentro de una muestra.
A continuación, se muestra una descripción del protocolo para el flujo de trabajo de preparación de la biblioteca AQRNA-seq y la canalización de análisis de datos descendente que lo acompaña. El método se aplicó para dilucidar la dinámica de la abundancia de ARNt durante la latencia inducida por inanición y la posterior reanimación en el modelo de tuberculosis Mycobacterium bovis bacilli de Calmette et Guérin (BCG). Se presentaron los resultados para la visualización exploratoria de los datos de secuenciación, junto con los posteriores análisis de agrupamiento y expresión diferencial que revelaron patrones discernibles en la abundancia de ARNt asociados con varios fenotipos.
El flujo de trabajo de preparación de la biblioteca AQRNA-seq está diseñado para maximizar la captura de ARN dentro de una muestra y minimizar la caída de la polimerasa durante la transcripción inversa7. A través de una ligadura de enlazador de dos pasos, los nuevos oligonucleótidos de ADN (Linker 1 y Linker 2) se ligan en exceso para complementar completamente el ARN dentro de la muestra. El exceso de enlazadores se puede eliminar de manera eficiente con RecJf, una exonucleasa de 5′ a 3′ e…
The authors have nothing to disclose.
Los autores del presente trabajo agradecen a los autores del artículo original que describe la tecnología AQRNA-seq7. Este trabajo fue apoyado por subvenciones de los Institutos Nacionales de Salud (ES002109, AG063341, ES031576, ES031529, ES026856) y la Fundación Nacional de Investigación de Singapur a través de la Alianza Singapur-MIT para la Investigación y Tecnología de la Resistencia a los Antimicrobianos IRG.
2-ketoglutarate | Sigma-Aldrich | 75890 | Prepare a working solution (1 M) and store it at -20ºC |
2100 Bioanalyzer Instrument | Agilent | G2938C | |
5'-deadenylase (50 U/μL) | New England Biolabs | M0331S (component #: M0331SVIAL) | Store at -20 °C |
Adenosine 5'-Triphosphate (ATP) | New England Biolabs | M0437M (component #: N0437AVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC |
AGAROSE GPG/LE | AmericanBio | AB00972-00500 | Store at ambient temperature |
Ammonium iron(II) sulfate hexahydrate | Sigma-Aldrich | F2262 | Prepare a working solution (0.25 M) and store it at -20 °C |
Bioanalyzer Small RNA Analysis | Agilent | 5067-1548 | The Small RNA Analysis is used for checking the quality of input RNAs and the efficiency of enzymatic reactions (e.g., Linker 1 ligation) |
Bovine Serum Albumin (BSA; 10 mg/mL) | New England Biolabs | B9000 | This product was discontinued on 12/15/2022 and is replaced with Recombinant Albumin, Molecular Biology Grade (NEB B9200). |
Chloroform | Macron Fine Chemicals | 4441-10 | |
Demethylase | ArrayStar | AS-FS-004 | Demethylase comes with the rtStar tRNA Pretreatment & First-Strand cDNA Synthesis Kit (AS-FS-004) |
Deoxynucleotide (dNTP) Solution Mix | New England Biolabs | N0447L (component #: N0447LVIAL) | This dNTP Solution Mix contains equimolar concentrations of dATP, dCTP, dGTP and dTTP (10 mM each) |
Digital Dual Heat Block | VWR Scientific Products | 13259-052 | Heating block is used with the QIAquick Gel Extraction Kit |
DyeEx 2.0 Spin Kit | Qiagen | 63204 | Effective at removing short remnants (e.g., oligos less than 10 bp in length) |
Electrophoresis Power Supply | Bio-Rad Labrotories | PowerPac 300 | |
Eppendorf PCR Tubes (0.5 mL) | Eppendorf | 0030124537 | |
Eppendorf Safe-Lock Tubes (0.5 mL) | Eppendorf | 022363611 | |
Eppendorf Safe-Lock Tubes (1.5 mL) | Eppendorf | 022363204 | |
Eppendorf Safe-Lock Tubes (2 mL) | Eppendorf | 022363352 | |
Ethyl alcohol (Ethanol), Pure | Sigma-Aldrich | E7023 | The pure ethanol is used with the Oligo Clean and Concentrator Kit from Zymo Research |
Gel Imaging System | Alpha Innotech | FluorChem 8900 | |
Gel Loading Dye, Purple (6X), no SDS | New England Biolabs | N0556S (component #: B7025SVIAL) | NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS |
GENESYS 180 UV-Vis Spectrophotometer | Thermo Fisher Scientific | 840-309000 | The spectrophotometer is used for measuring the oligo concentrations using the Beer's law |
HEPES | Sigma-Aldrich | H4034 | Prepare a working solution (1 M; pH = 8 with NaOH) and store it at -20 °C |
Hydrochloric acid (HCl) | VWR Scientific Products | BDH3028 | Prepare a working solution (5 M) and store it at ambient temperature |
Isopropyl Alcohol (Isopropanol), Pure | Macron Fine Chemicals | 3032-16 | Isopropanol is used with the QIAquick Gel Extraction Kit |
L-Ascorbic acid | Sigma-Aldrich | A5960 | Prepare a working solution (0.5 M) and store it at -20ºC |
Microcentrifuge | Eppendorf | 5415D | |
NanoDrop 2000 Spectrophotometer | Thermo Fisher Scientific | ND-2000 | |
NEBuffer 2 (10X) | New England Biolabs | M0264L (component #: B7002SVIAL) | NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C |
Nuclease-Free Water (not DEPC-Treated) | Thermo Fisher Scientific | AM9938 | |
Oligo Clean & Concentrator Kit | Zymo Research | D4061 | Store at ambient temperature |
PEG 8000 (50% solution) | New England Biolabs | M0437M (component #: B1004SVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC |
Peltier Thermal Cycler | MJ Research | PTC-200 | |
Phenol:choloroform:isoamyl alcohol 25:24:1 pH = 5.2 | Thermo Fisher Scientific | J62336 | |
PrimeScript Buffer (5X) | TaKaRa | 2680A | |
PrimeScript Reverse Transcriptase | TaKaRa | 2680A | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | This kit requires a heating block and isopropanol to work with |
Quick-Load Purple 100 bp DNA Ladder | New England Biolabs | N0551S (component #: N0551SVIAL) | |
Quick-Load Purple 50 bp DNA Ladder | New England Biolabs | N0556S (component #: N0556SVIAL) | NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS |
RecJf (30 U/μL) | New England Biolabs | M0264L (component #: M0264LVIAL) | NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C |
RNase Inhibitor (murine; 40 U/μL) | New England Biolabs | M0314L (component #: M0314LVIAL) | Store at -20 °C |
SeqAMP DNA Polymerase | TaKaRa | 638509 | TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X) |
SeqAMP PCR Buffer (2X) | TaKaRa | 638509 | TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X) |
Shrimp Alkaline Phosphatase (1 U/μL) | New England Biolabs | M0371L (component #: M0371LVIAL) | |
Sodium hydroxide (NaOH) | Sigma-Aldrich | S5881 | Prepare a working solution (5 M) and store it at ambient temperature |
T4 DNA Ligase (400 U/μL) | New England Biolabs | M0202L (component #: M0202LVIAL) | NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X) |
T4 DNA Ligase Reaction Buffer (10X) | New England Biolabs | M0202L (component #: B0202SVIAL) | NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X) |
T4 RNA Ligase 1 (30 U/μL) | New England Biolabs | M0437M (component #: M0437MVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM) |
T4 RNA Ligase Reaction Buffer (10X) | New England Biolabs | M0437M (component #: B0216SVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM) |