Le séquençage de l’ARN par quantification absolue (AQRNA-seq) est une technologie développée pour quantifier le paysage de tous les petits ARN dans les mélanges biologiques. Ici, les étapes de préparation de la bibliothèque et de traitement des données d’AQRNA-seq sont démontrées, quantifiant les changements dans le pool d’ARN de transfert (ARNt) chez Mycobacterium bovis BCG pendant la dormance induite par la famine.
AQRNA-seq fournit une relation linéaire directe entre le nombre de lectures de séquençage et le petit nombre de copies d’ARN dans un échantillon biologique, permettant ainsi une quantification précise du pool de petits ARN. La procédure de préparation de la banque AQRNA-seq décrite ici implique l’utilisation de liaisons de séquençage conçues sur mesure et une étape pour réduire les modifications de l’ARN de méthylation qui bloquent la processivité de la transcription inverse, ce qui entraîne une augmentation du rendement d’ADNc de pleine longueur. En outre, une mise en œuvre détaillée du pipeline bioinformatique qui l’accompagne est présentée. Cette démonstration de l’AQRNA-seq a été réalisée au moyen d’une analyse quantitative des 45 ARNt de Mycobacterium bovis BCG récoltés pendant 5 jours choisis au cours d’une période de 20 jours de privation de nutriments et de 6 jours de réanimation. Les efforts en cours pour améliorer l’efficacité et la rigueur d’AQRNA-seq seront également abordés ici. Il s’agit notamment d’explorer des méthodes permettant d’éviter la purification sur gel afin d’atténuer les problèmes de dimères d’amorce après l’amplification par PCR et d’augmenter la proportion de lectures sur toute la longueur afin de permettre une cartographie de lecture plus précise. Les améliorations futures d’AQRNA-seq seront axées sur la facilitation de l’automatisation et de la mise en œuvre à haut débit de cette technologie pour quantifier toutes les petites espèces d’ARN dans des échantillons de cellules et de tissus provenant de divers organismes.
Le séquençage de nouvelle génération (NGS), également connu sous le nom de séquençage massivement parallèle, est une technologie de séquençage de l’ADN qui implique la fragmentation de l’ADN, la ligature d’oligonucléotides adaptateurs, l’amplification basée sur la réaction en chaîne par polymérase (PCR), le séquençage de l’ADN et le réassemblage des séquences de fragments dans un génome. L’adaptation du NGS à l’ARN séquencé (RNA-seq) est une approche puissante pour identifier et quantifier les transcrits d’ARN et leurs variants1. Des développements innovants dans les flux de travail de préparation de banques d’ARN et les pipelines d’analyse bioinformatique, associés aux progrès de l’instrumentation de laboratoire, ont élargi le répertoire des applications de séquençage de l’ARN, progressant au-delà du séquençage de l’exome vers des omiques fonctionnelles avancées telles que le profilage d’ARN non codant2, l’analyse de cellule unique3, la transcriptomique spatiale 4,5, l’analyse d’épissage alternatif6, entre autres. Ces méthodes avancées de séquençage de l’ARN révèlent des fonctions complexes de l’ARN grâce à l’analyse quantitative du transcriptome dans les cellules et les tissus normaux et malades.
Malgré ces avancées en matière de RNA-seq, plusieurs caractéristiques techniques clés limitent la puissance quantitative de la méthode. Bien que la plupart des méthodes de séquençage de l’ARN permettent une quantification précise et exacte des changements dans les niveaux d’ARN entre des variables expérimentales (c’est-à-dire des échantillons biologiques et/ou des états physiologiques), elles ne peuvent pas fournir de comparaisons quantitatives des niveaux de molécules d’ARN dans un échantillon. Par exemple, la plupart des méthodes de séquençage de l’ARN ne peuvent pas quantifier avec précision le nombre relatif de copies de molécules isoaccepteurs d’ARNt individuelles dans un pool cellulaire d’ARNt exprimés. Comme souligné dans la publicationcomplémentaire 7, cette limitation du séquençage de l’ARN découle de plusieurs caractéristiques de la structure de l’ARN et de la biochimie de la préparation des banques. Par exemple, l’activité des enzymes de ligature utilisées pour fixer les liaisons de séquençage aux extrémités 3′ et 5′ aux molécules d’ARN est fortement influencée par l’identité des nucléotides terminaux de l’ARN et des liaisons de séquençage. Cela conduit à de grandes variations dans l’efficacité des ligatures de liaison et à de profondes augmentations artificielles des lectures de séquençage 8,9,10.
Une deuxième série de limitations découle des propriétés structurelles inhérentes aux molécules d’ARN. Plus précisément, la formation de la structure secondaire de l’ARN et les changements dynamiques dans les dizaines de modifications post-transcriptionnelles de l’ARN de l’épitranscriptome peuvent provoquer une chute ou une mutation de la polymérase au cours de la transcription inverse. Ces erreurs entraînent une synthèse incomplète ou tronquée de l’ADNc ou une séquence d’ARN altérée. Bien que ces deux phénomènes puissent être exploités pour cartographier des structures secondaires ou certaines modifications, ils dégradent la précision quantitative du séquençage de l’ARN si les étapes ultérieures de préparation de la bibliothèque ne parviennent pas à capturer des ADNc tronqués ou si le traitement des données rejette des séquences mutées ne correspondant pas à un ensemble de données de référence11,12. De plus, l’immense diversité chimique, de longueur et structurelle des transcrits d’ARN, ainsi que le manque d’outils pour fragmenter uniformément les ARN longs, diminuent l’applicabilité de la plupart des méthodes de séquençage de l’ARN à toutes les espèces d’ARN13.
La méthode AQRNA-seq (absolute quantification RNA sequencing) a été développée pour lever plusieurs de ces contraintes techniques et biologiques qui limitent la précision quantitative7. En minimisant les biais dépendants de la séquence dans la capture, la ligature et l’amplification lors de la préparation de la bibliothèque de séquençage de l’ARN, AQRNA-seq atteint une linéarité supérieure par rapport aux autres méthodes, quantifiant avec précision 75 % d’une bibliothèque de référence de 963 miARN avec une précision 2 fois supérieure. Cette corrélation linéaire du nombre de lectures de séquençage et de l’abondance de l’ARN est également observée dans l’analyse d’un pool de longueurs variables d’étalons d’oligonucléotides d’ARN et en référence à des méthodes orthogonales comme le transfert de Northern. L’établissement de la linéarité entre le nombre de lectures de séquençage et l’abondance de l’ARN permet à l’AQRNA-seq d’obtenir une quantification précise et absolue de toutes les espèces d’ARN au sein d’un échantillon.
Voici une description du protocole pour le flux de travail de préparation de la bibliothèque AQRNA-seq et du pipeline d’analyse de données en aval qui l’accompagne. La méthode a été appliquée pour élucider la dynamique de l’abondance de l’ARNt pendant la dormance induite par la famine et la réanimation ultérieure dans le modèle de tuberculose du modèle de la tuberculose à Bacilles de Calmette et Guérin de Mycobacterium bovis . Les résultats ont été présentés pour la visualisation exploratoire des données de séquençage, ainsi que pour les analyses ultérieures de regroupement et d’expression différentielle qui ont révélé des modèles discernables dans l’abondance de l’ARNt associés à divers phénotypes.
Le flux de travail de préparation de la banque AQRNA-seq est conçu pour maximiser la capture d’ARN dans un échantillon et minimiser la chute de polymérase lors de la transcription inverse7. Grâce à une ligature de liaison en deux étapes, de nouveaux oligonucléotides d’ADN (Linker 1 et Linker 2) sont ligaturés en excès pour compléter pleinement l’ARN de l’échantillon. Les agents de liaison en excès peuvent être éliminés efficacement avec RecJf, une exonucléase de 5′ à 3′ s…
The authors have nothing to disclose.
Les auteurs de ce travail sont reconnaissants envers les auteurs de l’article original décrivant la technologie AQRNA-seq7. Ce travail a été soutenu par des subventions des National Institutes of Health (ES002109, AG063341, ES031576, ES031529, ES026856) et de la National Research Foundation de Singapour par le biais de l’Alliance Singapour-MIT pour la recherche et la technologie Antimicrobial Resistance IRG.
2-ketoglutarate | Sigma-Aldrich | 75890 | Prepare a working solution (1 M) and store it at -20ºC |
2100 Bioanalyzer Instrument | Agilent | G2938C | |
5'-deadenylase (50 U/μL) | New England Biolabs | M0331S (component #: M0331SVIAL) | Store at -20 °C |
Adenosine 5'-Triphosphate (ATP) | New England Biolabs | M0437M (component #: N0437AVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC |
AGAROSE GPG/LE | AmericanBio | AB00972-00500 | Store at ambient temperature |
Ammonium iron(II) sulfate hexahydrate | Sigma-Aldrich | F2262 | Prepare a working solution (0.25 M) and store it at -20 °C |
Bioanalyzer Small RNA Analysis | Agilent | 5067-1548 | The Small RNA Analysis is used for checking the quality of input RNAs and the efficiency of enzymatic reactions (e.g., Linker 1 ligation) |
Bovine Serum Albumin (BSA; 10 mg/mL) | New England Biolabs | B9000 | This product was discontinued on 12/15/2022 and is replaced with Recombinant Albumin, Molecular Biology Grade (NEB B9200). |
Chloroform | Macron Fine Chemicals | 4441-10 | |
Demethylase | ArrayStar | AS-FS-004 | Demethylase comes with the rtStar tRNA Pretreatment & First-Strand cDNA Synthesis Kit (AS-FS-004) |
Deoxynucleotide (dNTP) Solution Mix | New England Biolabs | N0447L (component #: N0447LVIAL) | This dNTP Solution Mix contains equimolar concentrations of dATP, dCTP, dGTP and dTTP (10 mM each) |
Digital Dual Heat Block | VWR Scientific Products | 13259-052 | Heating block is used with the QIAquick Gel Extraction Kit |
DyeEx 2.0 Spin Kit | Qiagen | 63204 | Effective at removing short remnants (e.g., oligos less than 10 bp in length) |
Electrophoresis Power Supply | Bio-Rad Labrotories | PowerPac 300 | |
Eppendorf PCR Tubes (0.5 mL) | Eppendorf | 0030124537 | |
Eppendorf Safe-Lock Tubes (0.5 mL) | Eppendorf | 022363611 | |
Eppendorf Safe-Lock Tubes (1.5 mL) | Eppendorf | 022363204 | |
Eppendorf Safe-Lock Tubes (2 mL) | Eppendorf | 022363352 | |
Ethyl alcohol (Ethanol), Pure | Sigma-Aldrich | E7023 | The pure ethanol is used with the Oligo Clean and Concentrator Kit from Zymo Research |
Gel Imaging System | Alpha Innotech | FluorChem 8900 | |
Gel Loading Dye, Purple (6X), no SDS | New England Biolabs | N0556S (component #: B7025SVIAL) | NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS |
GENESYS 180 UV-Vis Spectrophotometer | Thermo Fisher Scientific | 840-309000 | The spectrophotometer is used for measuring the oligo concentrations using the Beer's law |
HEPES | Sigma-Aldrich | H4034 | Prepare a working solution (1 M; pH = 8 with NaOH) and store it at -20 °C |
Hydrochloric acid (HCl) | VWR Scientific Products | BDH3028 | Prepare a working solution (5 M) and store it at ambient temperature |
Isopropyl Alcohol (Isopropanol), Pure | Macron Fine Chemicals | 3032-16 | Isopropanol is used with the QIAquick Gel Extraction Kit |
L-Ascorbic acid | Sigma-Aldrich | A5960 | Prepare a working solution (0.5 M) and store it at -20ºC |
Microcentrifuge | Eppendorf | 5415D | |
NanoDrop 2000 Spectrophotometer | Thermo Fisher Scientific | ND-2000 | |
NEBuffer 2 (10X) | New England Biolabs | M0264L (component #: B7002SVIAL) | NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C |
Nuclease-Free Water (not DEPC-Treated) | Thermo Fisher Scientific | AM9938 | |
Oligo Clean & Concentrator Kit | Zymo Research | D4061 | Store at ambient temperature |
PEG 8000 (50% solution) | New England Biolabs | M0437M (component #: B1004SVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM); prepare a working solution (10 mM) and store it at -20ºC |
Peltier Thermal Cycler | MJ Research | PTC-200 | |
Phenol:choloroform:isoamyl alcohol 25:24:1 pH = 5.2 | Thermo Fisher Scientific | J62336 | |
PrimeScript Buffer (5X) | TaKaRa | 2680A | |
PrimeScript Reverse Transcriptase | TaKaRa | 2680A | |
QIAquick Gel Extraction Kit | Qiagen | 28704 | This kit requires a heating block and isopropanol to work with |
Quick-Load Purple 100 bp DNA Ladder | New England Biolabs | N0551S (component #: N0551SVIAL) | |
Quick-Load Purple 50 bp DNA Ladder | New England Biolabs | N0556S (component #: N0556SVIAL) | NEB N0556S contains Quick-Load Purple 50 bp DNA Ladder and Gel Loading Dye, Purple (6X), no SDS |
RecJf (30 U/μL) | New England Biolabs | M0264L (component #: M0264LVIAL) | NEB M0264L contains RecJf (30 U/μL) and NEBuffer 2 (10X); store at -20 °C |
RNase Inhibitor (murine; 40 U/μL) | New England Biolabs | M0314L (component #: M0314LVIAL) | Store at -20 °C |
SeqAMP DNA Polymerase | TaKaRa | 638509 | TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X) |
SeqAMP PCR Buffer (2X) | TaKaRa | 638509 | TaKaRa 638509 contains SeqAMP DNA Polymerase and SeqAMP PCR Buffer (2X) |
Shrimp Alkaline Phosphatase (1 U/μL) | New England Biolabs | M0371L (component #: M0371LVIAL) | |
Sodium hydroxide (NaOH) | Sigma-Aldrich | S5881 | Prepare a working solution (5 M) and store it at ambient temperature |
T4 DNA Ligase (400 U/μL) | New England Biolabs | M0202L (component #: M0202LVIAL) | NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X) |
T4 DNA Ligase Reaction Buffer (10X) | New England Biolabs | M0202L (component #: B0202SVIAL) | NEB M0202L contains T4 DNA Ligase (400 U/μL) and T4 DNA Ligase Reaction Buffer (10X) |
T4 RNA Ligase 1 (30 U/μL) | New England Biolabs | M0437M (component #: M0437MVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM) |
T4 RNA Ligase Reaction Buffer (10X) | New England Biolabs | M0437M (component #: B0216SVIAL) | NEB M0437M contains T4 RNA Ligase 1 (30 U/μL), T4 RNA Ligase Reaction Buffer (10X), PEG 8000 (1X), and ATP (100 mM) |