Nous présentons une approche de séquençage en profondeur qui fournit une détermination impartiale du naissant 3′-termini ainsi que des profils de mutations des molécules d’ADN simple brin. L’application principale est la caractérisation de naissants DNAs rétrovirales complémentaires (ADNc), les intermédiaires générés lors du processus de transcription inverse rétrovirale.
Surveillance des acides nucléiques intermédiaires au cours de la réplication du virus permet de mieux comprendre les effets et les mécanismes d’action des composés antiviraux et protéines de cellules hôtes sur la synthèse de l’ADN virale. Ici nous combler l’absence d’un essai sur les cellules, la haute-couverture et haute résolution qui peut être capable de définir des intermédiaires retroviral transcriptase inverse dans le contexte physiologique de l’infection par le virus. La méthode décrite capte la 3′-termini naissants complémentaires (ADNc) des molécules d’ADN dans les cellules infectés par le VIH-1 à la résolution de nucléotide. Le protocole consiste à récolter de l’ADN, enrichissement ciblée d’ADN virale via capture de l’hybride, ligation de l’adaptateur, fractionnement de taille par gel de purification, d’amplification PCR, séquençage en profondeur et analyse des données de la cellule entière. Une étape clé est la ligature efficace et impartiale des molécules d’adapteur pour ouvrir termini 3′-ADN. Application de la méthode décrite détermine l’abondance de transcription inverse de chaque longueur donnée dans un échantillon donné. Il fournit également des informations sur la variation de la séquence (interne) par transcription inverse et donc toute mutations potentielles. En général, le dosage est adapté pour toutes les questions relatives à l’ADN 3′-extension, pourvu que la séquence de modèle est connue.
Pour disséquer et de comprendre la réplication virale entièrement, de plus en plus affiné les techniques qui rendent compte de réplication intermédiaires sont requis. En particulier, la définition précise des espèces acide nucléique viral dans le contexte des cellules infectées peut apporter un nouvel éclairage, étant donné que plusieurs mécanismes de réplication virale ont jusqu’à présent été examinés dans les réactions isolées in vitro . Un exemple typique est le processus de transcription inverse dans les rétrovirus, comme le virus d’immunodéficience humaine 1 (VIH-1). Les différentes étapes de la transcriptase inverse du VIH-1, au cours de laquelle l’enzyme virale la transcriptase inverse (RT) copie du génome d’ARN simple brin en ADN double-brin, ont été étudiés principalement lors d’essais extension amorce avec protéines purifiées et acides nucléiques les acides1,2,3,4,5. Alors que les principes fondamentaux ont été établis, ces tests n’intègrent pas tous les composants virus et cellulaires et peuvent ne pas refléter les stoechiométries biologiquement pertinentes des facteurs impliqués. Par conséquent, nous avons conçu une technique puissante pour déterminer le spectre de la transcription inverse intermédiaires avec leurs ADNc précise 3′ termini-(p. ex., déterminer leurs longueurs précises) et des séquences de nucléotides dans le cadre des infections de la vie 6de cellules. Collecte des données de temps des expériences de cours peuvent être utilisés pour comparer le profil de transcriptions dans diverses conditions, telles que la présence de molécules antivirales ou de protéines, qui peuvent influer sur l’efficacité et la processivité de synthèse de l’ADN et accumulation. Cela permet une meilleure compréhension du cycle de vie naturel pathogène, qui est souvent la base pour la conception de médicaments ciblés et une intervention thérapeutique réussie.
Transcriptase inverse du VIH-1 comprend une série d’événements successifs initiée par recuit d’une amorce de tRNA pour le descripteur d’ARN génomique, qui est ensuite étendue par RT de produire une transcription court simple brin ADNc appelée un brin moins forte-stop (-sss) (voir La figure 1). Par la suite, l’ADNc – sss est transféré depuis le terminal 5′-longue répétition (LTR) à la LTR 3′ de l’ARN génomique, où il recuits et sert comme l’amorce pour RT continue véhiculée par l’élongation de la minus brin ADN (voir les commentaires sur la transcription inverse1 , 2 , 3 , 4). ce premier transfert de brin est l’une des mesures limitant la vitesse de transcription inverse ; par conséquent, le cDNA – sss est connu pour s’accumuler. La conception de flux de travail et de la bibliothèque de base pour saisir les produits de transcription inverse dans les cellules infectées est décrit dans la Figure 2 a. Les amorces spécifiques et analyse les paramètres qui sont utilisés dans le protocole et figurant au tableau 1 ciblent tous tôt reverse transcription cDNA intermédiaires au sein de la gamme de longueur de 23 à 650 ~ nt, qui comprend le nt 180-182 – sss ADN. Toutefois, des adaptations mineures appropriées à la stratégie permettra demande non seulement des produits de transcription inverse fin mais aussi autres virus et systèmes, dont l’objectif est de détecter les extrémités de l’ADN contenant 3′-OH. Des restrictions importantes à considérer comprennent la gamme de longueur de l’amplicon final dans la bibliothèque ; en particulier, dans lequel la distance entre l’adaptateur sur l’ouvert 3′-terminale et le site de l’apprêt en amont dépasse 1000 ~ nt des modèles seront probablement moins efficacement séquencés, présentant potentiellement trompeuse biais techniques au cours de la préparation () bibliothèque voir la discussion pour plus de détails et de suggestions d’adaptation).
Précédemment techniques signalés pour la détermination systématique des extrémités 3′ des brins d’acide nucléique ont mis l’accent sur l’ARN, pas l’ADN, les molécules. Un exemple est la 3′ RACE (amplification rapide des extrémités d’ADNc)7, qui s’appuie sur la polyadénylation de l’ARNm. En outre, des stratégies axées sur la ligature d’adaptateur employant ligases RNA ont été développées, qui ont inclus le RLM-RACE (course de ligase-mediated RNA)8 ou9de la dentelle (axée sur la ligature de l’amplification des extrémités d’ADNc). Il est important de souligner que des amplifications axée sur la ligature sont sensibles à tout biais introduit par la réaction de ligature lui-même. Par exemple, la ligature peut s’avérer plus ou moins efficace selon un nucléotide donné dans la position 3′, la séquence, longueur totale molécule ou structure locale. Ces préférences de ligase conduisent à capture incomplète des molécules et de la présentation inexacte des faits dans la lecture, qui nous et autres avons observé9,10. Pour minimiser les biais de ligature au cours des étapes d’addition adaptateur dans le protocole décrit ci-après, nous avons testé un certain nombre de stratégies de ligature et constaté l’utilisation de T4 DNA ligase avec un adaptateur d’ADN simple brin en épingle à cheveux (tel que décrit par Kwok et al. 11) d’être la seule procédure avec près de ligature quantitative qui n’a pas entraîné des différences significatives dans l’efficacité de la ligature lorsque évalué avec un ensemble de contrôle oligonucléotides6spécialement sélectionnés. Le choix de cette stratégie de ligature est donc un élément clé dans la réussite de ce protocole.
A ce jour, suivi de la progression du VIH-1 RT dans les cellules infectées a principalement été réalisé en mesurant les produits de la transcription inverse de longueur différentes avec la PCR quantitative (qPCR) en utilisant des ensembles de primer-sonde unique de mesurer plus ou moins longue (début et vers la fin, respectivement) cDNA produits12,13,14. Bien que cette approche de qPCR est appropriée pour déterminer l’efficacité intrinsèque du processus de transcription inverse dans les systèmes cellulaires, la sortie est de résolution relativement faible, sans informations de séquence étant dérivé. Notre nouvelle approche, basée sur la ligature adaptateur optimisé, génération de bibliothèque-mediated PCR et séquençage en profondeur adresses le fossé technologique et offre la possibilité de surveiller la transcription renversée au cours de l’infection à VIH-1 quantitativement et au nucléotide résolution.
Nous avons illustré l’utilité de cette méthode dans une étude qui a établi une distinction entre les deux modèles proposés pour la capacité du VIH-1 facteur de restriction APOBEC3G (enzyme édition apolipoprotéine B-ARNm catalytique polypeptide comme 3G) d’interférer avec le production de transcription inverse virale6.
La disponibilité de séquençage rapide, fiable et rentable en profondeur a révolutionné beaucoup d’aspects dans le domaine des sciences de la vie, permettant à grande profondeur dans les analyses axées sur le séquençage. Un défi reste réside dans la conception innovante et la création du représentant les bibliothèques de séquençage. Nous décrivons ici un protocole visant à capturer les molécules de cDNA viral naissant, spécifiquement les intermédiaires du processus de transcriptase inverse du VIH-1.
L’étape la plus critique de cette stratégie est la ligature d’un adaptateur pour l’ouvrir 3′-termini de manière quantitative et non biaisée. Efficacité des trompes entre deux terminus d’ADN simple brin, inter- et intramoléculaires, ont été étudiés et optimisés pour différentes applications11,26,27,28,29. Le choix d’utiliser un adaptateur en épingle à cheveux avec T4 DNA ligase dans les conditions décrites à l’étape 3.3 est le résultat de l’optimisation empirique dont nous avons évalué différentes ligases, adaptateurs et réactifs pour la ligature des oligonucléotides synthétiques représentant Séquences de VIH-1 (tableau 2) (données non présentées). Dans ces réactions de test in vitro , nous avons confirmé que la T4 DNA ligase médiée par ligation de l’adaptateur de l’épingle à cheveux, tel que décrit par Kwok et al. 11a un écart très faible et réalise près de ligature complète de molécules accepteur lorsque l’adaptateur est utilisé en excès. L’efficacité de la ligature n’est pas affectée par l’ajout de séquence nucléotidique pour restituer l’adaptateur compatible pour le système d’amorçage multiplex (voir Figure 4). En comparaison, nous avons constaté qu’une ligase ADN/ARN thermostable de 5′ (voir « Ligase A », Table des matières pour les ligases exactes par rapport ici), qui est une ligase machiné de RNA qui a été développé en partie d’améliorer efficacité ligature avec ADN simple brin comme accepteur 27, était en effet plus efficace à la ligature des deux molécules d’ADN simple brin de ligase RNA (« Ligase B »), mais avait un biais important, avec fortes différences dans l’efficacité de la ligature, même entre les oligonucléotides avec des différences de longueur de base individuelle [tableau 2 ; HTP con mi G (a) et (b)]. En outre, nous avons trouvé seulement un biais minime dans les réactions avec « Ligase C » combiné avec un adaptateur transportant un essai randomisé 5′-termini (une stratégie pour compenser les biais de nucléotides connue de « Ligase C » ; voir par exemple Ding et al. 30). Cependant, le « Ligase C »-médiation des trompes intermoléculaires étaient incomplètes, rendant le système de ligase d’ADN T4 le meilleur choix.
Plusieurs mesures de contrôle de la qualité sur le golf du protocole et de l’inclusion des témoins positifs et négatifs permettant de détecter des problèmes potentiels avant la poursuite de l’analyse et des directives pour le dépannage des efforts. Les quantifications de qPCR en étapes 2.2.2 et 2.3.12 veiller à ce que la quantité du matériel d’entrée suffit. Nombre de copies d’ADNc typiques dans la gamme d’élution (à l’étape 2.1) 200 µL d’environ 10 000 à 300 000 par µL. L’étape de capture hybride peut entraîner une perte globale du VIH-1 cDNA quantité mais devrait se traduire par un fort enrichissement spécifiques applicables à l’ARNC VIH-1 au cours de l’ADN cellulaire, qui peut être déterminé en utilisant des amorces appropriées pour quantifier l’ADN génomique, avant et après enrichissement par qPCR ou en mesurant la concentration totale de l’ADN. Récupéré le VIH-1 cDNA après l’hybride capture étapes devrait être au moins 10 % de l’apport. Faible à partir de matériel peut expliquer autrement un témoin positif de l’oligonucléotide réussie (voir étape 3.3.2) mais seulement limité lectures atteints dans les échantillons. Faible lire nombres globale pourrait également s’expliquer par une surestimation de la concentration de la bibliothèque en raison de la présence d’espèces d’ADN non pertinents sans MiSeq adaptateurs. Cela se traduirait par une densité faible de cluster et peut être améliorée par la détermination de la concentration des séquences de VIH-1 dans la bibliothèque de qPCR en plus de la quantité d’ADN totale par dosages fluorimétrique. En raison de la nature hautement délicate de la méthode, spécial il faut pour éviter la contamination même à basse altitude, les deux autres échantillons (en particulier, depuis les stocks oligonucléotide contrôle de concentration élevée) ainsi que de matériel de laboratoire. Travaillant dans une UV de stérilisation workstation PCR est bénéfique à cet égard. L’électrophorèse automatisée de la bibliothèque finale (étape 6.1.2) est une autre mesure de contrôle de la qualité. Le calibre de l’acide nucléique généralement observé est entre 150 et 500 nt. amorces qui peuvent être détectées dans le contrôle facultatif après le PCR et avant purification (voir la note à l’étape 5.2) convient désormais absente. Un résultat représentatif, la courbe d’intensité échantillon a un pic autour de 160 à 170 nt et une nette deuxième pic autour de 320 à 350 nt. Cela reflète probablement l’abondance plu souvent vus en relativement courte transcription inverse (longueur d’insert nt 1 à 20) et forte non-stop pleine longueur (longueur de 180 à 182 nt insert) (Figure 3b).
Alors que le protocole présenté et les amorces sélectionnées sont spécifiques pour des constructions de transcriptase inverse du VIH-1 au début, la méthode est généralement applicable à toute étude visant à déterminer ouvert 3′-termini d’ADN. Les principales modifications requises dans d’autres contextes sera la méthode de capture hybride et la stratégie de conception d’amorce. Par exemple, si la cible doit être adapté aux fin transcrits du VIH-1, un plus grand nombre de différents oligonucléotides biotinylé capture recuit sur toute la longueur de l’ADNc serait souhaitable et diminuera probablement la perte lors de l’étape de capture hybride. Tel que mentionné dans l’introduction, il est important de tenir compte des limitations lors de la conception de la gamme sur laquelle est les 3′-termini à détecter pour éviter les différentes sources de biais. Tout d’abord, il peut y avoir un biais dans les réactions de PCR si les modèles avec l’adaptateur sont de longueur très variable. Deuxièmement, la plate-forme de séquençage utilisée ici (p. ex., MiSeq) a une gamme de longueur d’insertion privilégiée pour le clustering optimale et significativement plus courtes et plus de produits ne peuvent pas être séquencés avec la même efficacité. En partie, cela peut être résolu par le calcul, comme l’a fait en calculant un facteur de correction du biais de longueur linéaire (voir la Figure 4, graphique du bas). Toutefois, si la région où 3′-termini cartographie est souhaitée est longue (> 1000 nt), il est plus judicieux de diviser les réactions avec les transcriptions ligaturées et utilisent plusieurs amorces en amont pour évaluer les extrémités 3′ dans les sections.
Le programme d’analyse a été écrite à l’interne dans le but spécifique de l’analyse de ces deux derniers nucléotides de la séquence de HIV-1 adjacente à la séquence de l’adaptateur fixe ainsi que la variation de base de toutes les bases de détecter des mutations. Les différentes étapes, répartis comme suit : tout d’abord, les séquences de l’adaptateur sont taillés à l’aide de l’outil fastx-0.0.13 ; Ensuite, toutes les séquences qui sont en double (c’est-à-dire des séquences identiques, y compris le code à barres) sont supprimés. Toutes les lectures uniques restants sont alors alignés sur la séquence de VIH-1 en utilisant le nœud papillon (http://bowtie-bio.sourceforge.net/index.shtml) avec le décalage maximal fixé à trois bases. La séquence de modèle est composée de la première 635 nt du VIH-1 cDNA (souche NL4.3), qui comprend la séquence – sss et le premier produit de transfert de brin jusqu’à la piste d’appariement (U5-R-U3-PPT ; voir Figure 1). Ainsi, le logiciel fourni et modèles conviennent uniquement directement si la méthode est utilisée pour la même application (détection de début transcription inverse de l’ HIV-1NL4.3). Ajustements devront être faites pour les autres séquences cibles. Les positions de la 3′-termini pour chaque lecture ont été déterminées par la position dans l’alignement. Les appels de base pour chaque position sont enregistrés et des taux de mutation sont calculés à partir de la couverture totale de chaque base, qui varie, comme lectures sont de différentes longueurs et inserts de longs ne peuvent pas être entièrement couverts par le séquençage de 125-base dans Read 2.
Pour conclure, nous pensons que la méthode décrite pour être un outil précieux pour de nombreux types d’études. Des applications évidentes comprennent des enquêtes sur les mécanismes sous-jacents à l’inhibition de la transcription inverse grâce à des médicaments antirétroviraux ou facteurs de restriction cellulaires. Cependant, des ajustements relativement mineurs devraient être nécessaires d’adapter le système à 3′-termini cartographie au sein d’autres intermédiaires virales ADN simple brin, qui sont présents, par exemple, dans la réplication de parvovirus. En outre, le principe de la méthode, en particulier son étape de ligature optimisé, peut fournir une partie essentielle de la conception de préparation de bibliothèque pour la caractérisation de toute extension de 3′-ADN, y compris les allongements catalysées par cellulaire ADN à double brin polymérases.
The authors have nothing to disclose.
Les auteurs tiennent à souligner le soutien des membres du laboratoire Malim, Luis Apolonia, Jernej Ule et Rebecca Oakey. Les auteurs remercient Matt Arno au Centre génomique de la College de Londres du roi et Debbie Hughes à l’University College London (UCL), Institut de neurologie génération prochaine installation de séquençage, pour obtenir de l’aide MiSeq séquençage s’exécute. Le travail a été soutenu par le Conseil de recherches médicales UK (G1000196 et MR/M001199/1 à M.M.), le Wellcome Trust (106223/Z/14/Z à M.M.), septième Programme-cadre (7e PC/2007-2013) de la Commission européenne en vertu de la convention de subvention sans. PIIF-GA-2012-329679 (de D.P.) et le ministère de la santé via un instituts nationaux pour le prix de la santé recherche globale Biomedical Research Center à Guy et St. Thomas’ NHS Foundation Trust en partenariat avec King College de Londres et du roi College Hospital NHS Foundation Trust.
293T cells | ATCC | CRL-3216 | |
Dulbecco's Modified Eagle's Medium | Gibco | 31966-021 | |
Penicillin/Streptomycin | Gibco | 15150-122 | |
Fetal Bovine Serum | Gibco | 10270-106 | |
HeraCell Vios 250i CO2 Incubator | Thermo Scientific | 51030966 | |
Laminar flow hood – CAS BioMAT2 | Wolflabs | CAS001-C2R-1800 | |
10mm TC-treated culture dish | Corning | 430167 | |
TrypLE™ Express (1x), Stable Trypsin Replacement Enzyme | Gibco | 12605-010 | |
OptiMEM® (Minimal Essential Medium) | Gibco | 31985-047 | |
HIV-1 NL4-3 Infectious Molecular Clone (pNL4-3) | NIH Aids reagent program | 114 | |
Polyethylenimine (PEI) – MW:25000 | PolySciences Inc | 23966-2 | dissolved at 1mg/ml and adjusted to pH7 |
RQ1- Rnase free Dnase | Promega | M6101 | |
Filter 0.22 μm | Triple Red Limited | FPE404025 | |
15 mL polypropylene tubes | Corning | CLS430791 | |
Sucrose | Calbiochem | 573113 | |
Phosphate Buffered Saline (1x) | Gibco | 14190-094 | |
Ultracentrifuge tubes | Beckman Coulter | 344060 | |
Ultracentrifuge | Sorval | WX Ultra Series | Th-641 Rotor |
Alliance HIV-1 p24 antigen ELISA kit | Perkin Elmer | NEK050001KT | |
CEM-SS cells | NIH Aids reagent program | 776 | |
Roswell Park Memorial Institute Medium | Gibco | 31870-025 | |
CoStar® TC treated multiple well plates | Corning | CLS3513-50EA | |
Benchtop centrifuge: Heraus™ Multifuge™ X3 FR | Thermo Scientific | 75004536 | |
TX-1000 Swinging Bucket Rotor | Thermo Scientific | 75003017 | |
Microcentrifuge: 5424R | Eppendorf | 5404000060 | |
Total DNA extraction kit (DNeasy Blood and Tissue kit) | Qiagen | 69504 | |
Nuclease free H2O | Ambion | AM9937 | |
Cutsmart buffer | New England Biolabs (part of DpnI enzyme) | R0176S | |
DpnI restriction enzyme | New England Biolabs | R0176S | |
Oligonucleotides for qPCR | MWG Eurofins | N/A | HPSF purification |
TaqMan PCR Universal Mastermix | Thermo | 4304437 | |
LoBind Eppendorf® tubes | Eppendorf | 30108078 | |
Axygen™ aerosol filter pipette tips, 1000 μL | Fisher Scientific | TF-000-R-S | |
Axygen™ aerosol filter pipette tips, 200 μL | Fisher Scientific | TF-200-R-S | |
Axygen™ aerosol filter pipette tips, 20 μL | Fisher Scientific | TF-20-R-S | |
Axygen™ aerosol filter pipette tips, 10 μL | Fisher Scientific | TF-10-R-S | |
PCR clean hood | LabCaire | Model PCR-62 | |
DynaMag™2-magnet | Thermo | 12321D | |
Streptavidin MagneSphere® paramagnetic particles | Promega | Z5481 | |
Casein | Thermo Scientific | 37582 | |
End over end rotator, Revolver™ 360° | Labnet | H5600 | |
Tris-Base | Fisher Scientific | BP152-5 | |
Hydrochloric Acid | Sigma | H1758-100ML | |
EDTA disodium salt dihydrate | Electran (VWR) | 443885J | |
Sodium Chloride | Sigma | S3014 | |
Dri-Block® Analog Block Heater | Techne | UY-36620-13 | |
PCR tubes and domed caps | Thermo Scientific | AB0266 | |
PCR machine | Eppendorf | Mastercycler® series | |
T4 DNA ligase | New England Biolabs | M0202M | |
40% Polyethylene glycol solution (PEG) in H2O, MW: 8000 | Sigma | P1458-25ML | |
Betaine solution, 5M | Sigma | B0300-1VL | |
Gel loading buffer II (formamide buffer) | Thermo Scientific | AM8546G | |
Precast 6% TBE urea gels | Invitrogen | EC6865BOX | |
Mini cell electrophoresis system | Invitrogen, Novex | XCell SureLock™ | |
Tris/Borate/EDTA solution (10x) | Fisher Scientific | 10031223 | |
Needle 21 G x1 1/2 | VWR | 613-2022 | |
SYBR Gold nucleic acid stain (10000x) | Life Technologies | S11494 | |
Dark Reader DR46B transilluminator | Fisher Scientific | NC9800797 | |
Ammonium acetate | Merck | 101116 | |
SDS solution 20% (w/v) | Biorad | 161-0418 | |
Centrifuge tube filter | Appleton Woods | BC591 | |
Filter Glass Fibre Gf/D 10mm | Whatman (VWR) | 512-0427 | |
polyadenylic acid (polyA) RNA | Sigma | 10108626001 | |
Glycogen, molecular biology grade | Thermo Scientific | R0561 | |
Isopropanol (2-propanol) | Fisher Scientific | 15809665 | |
Ethanol, molecular biology grade | Fisher Scientific | 10041814 | |
Accuprime™ Supermix I (DNA polymerase premix) | Life Technologies | 12342-010 | |
NEBNext® Multiplex Oligo for Illumina (Index Primer Set 1 and 2) | New England Biolabs | E7335S; E7500S | |
Tapestation D1000 Screentape High sensitivity | Agilent Technologies | 5067- 5584 | |
Tapestation D1000 Reagents | Agilent Technologies | 5067- 5585 | |
2200 Tapestation – automated gel electrophoresis system | Agilent Technologies | G2965AA | |
Agencourt® AMPure® beads XP | Beckman Coulter | A63880 | |
Qubit™ dsDNA HS Assay Kit | Invitrogen | Q32851 | |
Qubit™ 2.0 Fluorometer | Invitrogen | Q32866 | |
Topo™ TA cloning Kit | Invitrogen | 450071 | |
Sequencing platform: MiSeq System | Illumina | ||
Experiment Manager (Sample sheet software) | Illumina | Note: Use TruSeq LT as a template | |
Miseq™ Reagent kit V3 (150 cycle) | Illumina | MS-102-3001 | |
Sequencing hub: Basespace | Illumina | https://basespace.illumina.com | |
Ligase A: Thermostable 5’ App DNA/RNA ligase | NEB | M0319S | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Ligase B: T4 RNA ligase 1 | NEB | M0204 | Not used in this protocol, but tested in optimization process with results described in the discussion. |
Ligase C: CircLigase | Epicentre | CL4111K | Not used in this protocol, but tested in optimization process with results described in the discussion. |