Nous décrivons une méthode efficace, robuste et rentable pour extraire l'acide nucléique à partir des prélèvements pour la caractérisation des communautés bactériennes en utilisant ARNr 16S séquençage de l'amplicon du gène. La méthode permet une approche de traitement commun pour les types d'échantillons multiples et peut accueillir un certain nombre de processus d'analyse en aval.
Il y a une prise de conscience croissante du rôle des communautés microbiennes en tant que modulateurs critiques de la santé humaine et la maladie. technologies de séquençage à haut débit ont permis la caractérisation rapide et efficace des populations bactériennes en utilisant le séquençage de l'ARNr 16S des gènes à partir d'une variété de sources. Bien que les outils facilement disponibles pour l'analyse de séquence ARNr 16S ont des flux de travail de calcul normalisées, le traitement des échantillons d'extraction d'ADN reste une source continue de la variabilité entre les études. Nous décrivons ici une méthode efficace, robuste et rentable pour extraire l'acide nucléique à partir des prélèvements. Nous délimiter également des procédés en aval pour le séquençage du gène 16S ARNr, y compris la génération de bibliothèques de séquençage, le contrôle de la qualité des données et l'analyse des séquences. Le flux de travail peut accueillir des échantillons multiples types, y compris les selles et les écouvillons collectés à partir d'une variété d'emplacements anatomiques et les espèces hôtes. En outre, récupéré ADN et l'ARN peut être séparé et utilisépour d'autres applications, y compris le séquençage du génome entier ou de l'ARN-seq. La méthode décrite permet une approche de traitement commun pour les types d'échantillons multiples et accueille l'analyse en aval de l'information génomique, métagénomique et de la transcription.
Le tube humain faible reproduction, système gastro – intestinal, les voies respiratoires et la peau sont colonisées par des communautés bactériennes complexes qui sont essentielles pour le maintien de l' homéostasie tissulaire et en soutenant la santé de l'hôte 1. Par exemple, certains lactobacilles créer un environnement inhospitalier pour les agents pathogènes , en acidifiant la voûte vaginale, produisant effecteurs antimicrobiens et la modulation de l' immunité d'hôte local 2-4. L'appréciation croissante de l'importance du microbiome bactérien a également accru l'intérêt pour la caractérisation des communautés bactériennes dans de nombreux contextes cliniques. Nous décrivons ici une méthode pour déterminer la composition du microbiome bactérienne des frottis génitaux. Le protocole peut être facilement modifié pour les échantillons de selles et des prélèvements provenant d'autres emplacements anatomiques et d'autres espèces hôtes.
En raison des limites inhérentes au nombre d'échantillons qui peuvent être collectées et stockées à partir d'un plot donnéy participant, ce protocole a été conçu pour extraire l' ADN, l' ARN, et peut -être même protéine à partir d' un tampon en utilisant une adaptation du phénol-chloroforme bourrelet raclée méthode basée sur 5,6. La combinaison de la perturbation physique des parois des cellules bactériennes avec un bourrelet de battage et de perturbation chimique avec des détergents permet la lyse rapide des bactéries Gram-positives, Gram-négatives, et acidorésistants sans étapes supplémentaires de digestion enzymatique. Afin d'obtenir l'ARN de haute qualité, il est recommandé d'utiliser des tampons secs qui ont été conservés au niveau ou en dessous de 4 ° C immédiatement après le prélèvement et pendant le transport au laboratoire (le cas échéant), et à long terme conservés à -80 ° C.
Pour déterminer le microbiome bactérien dans un échantillon donné, cette procédure utilise ARNr 16S séquençage de l'amplicon du gène, qui est actuellement le moyen le plus rentable pour affecter globalement la taxonomie bactérienne et effectuer une quantification relative. Les méthodes alternatives incluent qPCR 7 ciblés, microarr personnaliséays 8, et l' ensemble du séquençage du génome 9. Le gène ARNr 16S contient neuf régions hypervariables, et il n'y a pas de consensus sur la région optimale de V à la séquence pour les études sur le microbiome vaginal. Ici , nous utilisons l'ensemble d' amorces 515F / 806R et de construire sur le pipeline conçu par Caporaso et al. , 10-12. Caporaso et al 's. 515F / 806R ensemble d' amorces permet le multiplexage de centaines d'échantillons sur un seul passage de séquençage en raison de la disponibilité de milliers d'amorces validées code – barres et la compatibilité avec les plates – formes de séquençage Illumina. Contrairement à 27F / 338R l'amorce du projet microbiome humain défini 13, 515F / 806R amplifie aussi efficacement Bifidobacteriaceae et capture ainsi précisément Gardnerella vaginalis, un membre important de la communauté microbienne vaginale chez certaines femmes. En variante, une paire d'amorces 338F / 806R est utilisé avec succès pour pyroséquençage des échantillons vaginaux 14 et une paire d'amorces 515F / 926R a recently deviennent disponibles pour le séquençage de prochaine génération 12.
Enfin, ce protocole donne des instructions de base pour effectuer une analyse de 16S amplicon utilisant les Insights quantitatives en écologie microbienne (QIIME) progiciel 15. la mise en œuvre réussie des commandes QIIME décrites ici donne un tableau contenant les abondances taxonomiques bactériens pour chaque échantillon. De nombreuses mesures supplémentaires de contrôle de la qualité, les méthodes de classification taxonomique, et les étapes d'analyse peuvent être incorporés dans l'analyse, comme décrit en détail sur le site QIIME (http://qiime.org/index.html). Si l'analyse sera effectuée sur un ordinateur Apple, le paquet MacQIIME 16 permet une installation facile de QIIME et ses dépendances. Logiciels alternatifs pour 16S ARNr analyse de la séquence du gène comprennent mothur 17 et UPARSE 18.
Nous décrivons ici un protocole pour l'identification et la caractérisation des abondances bactériennes relatives dans un prélèvement vaginal humain. Ce protocole peut facilement être adapté à d'autres types d'échantillons, tels que des selles et des tampons d'autres sites du corps, et pour les échantillons prélevés à partir d'une grande variété de sources. L'extraction de l'acide nucléique par billes raclée dans une solution tamponnée de phénol et de chloroforme, permet d'isoler de l'ADN et l'ARN, ce qui est particulièrement important lorsque l'on travaille avec des échantillons prélevés précieux au moyen d'études cliniques. L'ADN bactérien isolé est excellent pour l'identification taxonomique bactérienne et l'assemblage génomique, tandis que la collecte simultanée de l'ARN offre la possibilité de déterminer bactérienne fonctionnelle, l'hôte et les contributions virales par l'ARN-seq. Le protocole décrit utilise une seule étape primaire ensemble validé qui a été déployé avec succès sur un large éventail de types d'échantillons, y compris humain, canin, et des échantillons environnementaux 10 </sup>. La disponibilité de milliers d'amorces permet le multiplexage à code-barres d'échantillons et d'énormes économies sur les coûts de séquence. Le coût complet (y compris tous les réactifs, un seul cycle de séquençage, et des amorces mais pas l'équipement) est d'environ 20 $ par échantillon lorsque 200 échantillons sont multiplexés. En outre, il est très grande reproductibilité lorsque plusieurs tampons à partir du même site d'échantillonnage sont traitées indépendamment par l'ensemble du pipeline. Dans l'ensemble, le protocole est rentable, flexible, fiable et reproductible.
La partie d'extraction d'acide nucléique de ce protocole est limitée par les mesures de sécurité nécessaires lorsque l'on travaille avec du phénol et du chloroforme, et les défis de l'automatisation de la conduite à un haut-débit, le format de plaque à 96 puits. En outre, la perle battre vigoureuse utilisé pour des cisailles de lyse mécanique l'ADN bactérien à environ 6 fragments de kilobases; si des fragments d'ADN plus longs sont nécessaires pour les applications en aval, la durée du bourrelet battant should être raccourci. Les limites de la partie d'identification bactérienne de ce protocole sont inhérentes à toute méthode qui repose sur le séquençage des gènes ARNr 16S. Le séquençage de l'ARNr 16S est idéal pour l'identification bactérienne au niveau du genre et de même espèce, mais fournit rarement identification de niveau de tension. Alors que la région variable V4 du gène ARNr 16S fournit la discrimination robuste chez la plupart des espèces bactériennes 11, les méthodes de calcul supplémentaires tels que oligotypage 31 peuvent devoir être utilisés pour identifier précisément certaines espèces, telles que Lactobacillus crispatus. Enfin, des informations sur les capacités fonctionnelles bactériennes précises au sein d'un échantillon particulier ne peut pas être déterminée par ARNr 16S séquençage du gène seul, bien que ce protocole permet l'extraction de l'ADN du génome entier et de l'ARN qui peut être utilisé à cette fin.
L'étape la plus essentielle pour assurer le succès de ce protocole prend grand soin pour éviter la contamination durment le prélèvement d'échantillons, l'extraction d'acide nucléique, et une amplification par PCR. Assurer la stérilité au moment de la collecte d'échantillons en portant des gants propres et en utilisant des écouvillons stériles, tubes, et des ciseaux. Pour évaluer la contamination des matériaux de collecte, de recueillir des tampons de contrôle négatif en plaçant des tampons inutilisés supplémentaires directement dans des tubes de transport au moment de l'échantillonnage. Dans le laboratoire, effectuer toutes les étapes de pré-amplification dans une hotte stérile contenant des fournitures ne décontaminés et en utilisant uniquement la biologie moléculaire, des réactifs exempts d'ADN. Au cours de l'extraction d'acide nucléique, d'empêcher la contamination croisée à l'aide d'une pince stérile et de nouveaux gants frais à chaque échantillon, et en gardant l'ensemble des tubes fermés sauf lors de l'utilisation. Traitement des tampons inutilisés en parallèle assure la stérilité à la fois du prélèvement de l'échantillon et l'extraction d'acide nucléique; les tampons inutilisés ne devraient pas donner une pastille après précipitation de l'isopropanol et le lavage à l'éthanol. Si une pastille ne semble, effectuer des ARNr 16S amplification génique pour déterminer une source possible dela contamination (par exemple, la présence de Streptococcus ou Staphylococcus indiquerait une contamination de la peau). En outre, effectuer des amplifications par PCR avec aucune réaction de commande de modèle en parallèle pour garantir que les réactifs et les réactions PCR sont pas contaminés. Si un groupe apparaît dans une commande pas de modèle, jeter des réactifs et répéter l'amplification avec des réactifs frais. Compte tenu de ces précautions permettra d'assurer le séquençage réussie des bactéries d'intérêt.
L'étape d'amplification PCR a tendance à exiger le plus dépannage. Amplifier dans des ensembles de douze échantillons fournit un équilibre entre l'efficacité et la cohérence. L'absence totale de bandes dans tous les échantillons dans un ensemble d'amplification donnée indique une défaillance systématique, par exemple, en oubliant d'ajouter un réactif ou de programmation de façon incorrecte le thermocycleur. L'absence d'une bande de quelques échantillons est généralement dû à une erreur humaine, et les amplifications doivent être re-rnon avec le même appariement de l'échantillon et l'amorce inverse. Dans le cas d'une absence continue d'une bande, l'échantillon peut être ré-amplifié en utilisant une amorce inverse avec un code à barres différent. échecs répétés d'amplification avec plusieurs amorces inverses peuvent indiquer un inhibiteur présent dans l'échantillon. Dans ce cas, le nettoyage de l'ADN avec une colonne souvent éliminer les inhibiteurs sans altérer de manière significative les abondances bactériennes relatives. Si plusieurs bandes résultent après amplification, re-amplifier l'échantillon avec un autre code à barres amorce inverse.
En plus de prévenir la contamination de l'environnement et de veiller à l'amplification d'un produit spécifique unique, le séquençage succès repose sur les soins lors de la préparation de la piscine de la bibliothèque. L'objectif est de combiner des quantités équimolaires des amplicons de chaque échantillon pour assurer approximativement le même nombre de lectures par séquençage de l'échantillon. Si les concentrations d'acide nucléique avant amplification sont comparables, en ajoutant simplement des volumes égaux de chacun saLes amplicons de Mple est suffisante lors de la création de la piscine de la bibliothèque. Cependant, si les concentrations d'acides nucléiques sont très différentes et ajoutée en volume égal de l'échantillon avec la concentration d'acide nucléique faible sera mal représentée avec un faible nombre de lectures. Dans ce cas, il est possible d'ajouter un plus grand volume des amplicons de l'échantillon à faible concentration en fonction de l'intensité relative de la bande de gel. En variante, il est possible d'éliminer de manière plus rigoureuse à partir amplicons amorces individuelles, de quantifier la concentration de l'amplicon de l'échantillon individuel à l'aide d'un kit de quantification fluorométrique ADNdb, et précisément combiner des quantités équimolaires de chaque échantillon.
Une fois une piscine amplicon bien équilibré est généré, il devient essentiel de mesurer soigneusement la concentration de la piscine. dilution soigneuse ultérieure et spike-in avec PhiX pour augmenter la complexité de lecture est essentielle pour obtenir des résultats optimaux de séquençage. séquenceurs à haut débit qui utilisent séquenCing par synthèse sont très sensibles à la densité de la grappe sur la cellule d'écoulement. Chargement d' une piscine bibliothèque qui est trop concentré se traduira par Redondance, avec des scores de qualité inférieure, la sortie de données inférieure, et démultiplexage inexactes 32. Chargement d'une piscine bibliothèque qui est trop diluée se traduira également par la production de données à faible. Soigneusement quantifier la piscine de la bibliothèque avant le séquençage permettra d'assurer des résultats optimaux.
séquençage du gène ARNr 16S fournit une évaluation complète des bactéries présentes dans un échantillon donné et est une première étape absolument essentiel dans la production d'hypothèse. La présence d'un riche ensemble de métadonnées permet en outre aux chercheurs de tester les associations entre certaines espèces bactériennes et les facteurs biologiques importants. En outre, les mêmes informations 16S peut être utilisée pour déduire les fonctions bactériennes en utilisant des outils tels que PICRUSt 33. Le but ultime est d'utiliser la caractérisation 16S pour identifier des associations nouvelles qui peuvent êtreen outre testé et validé dans des systèmes modèles, en ajoutant à notre compréhension croissante de l'impact du microbiome bactérien sur la santé humaine et de la maladie.
The authors have nothing to disclose.
Nous tenons à remercier Elizabeth Byrne, David Gootenberg, et Christina Gosmann pour des commentaires critiques sur le protocole; Megan Baldridge, Scott Handley, Cindy Monaco, et Jason Norman pour la préparation des échantillons d'orientation et démonstrations; Wendy Garrett, Curtis Huttenhower, Skip Virgin, et Bruce Walker pour obtenir des conseils de protocole et des discussions fructueuses; et Jessica Hoisington-Lopez pour le soutien de séquençage. Ce travail a été soutenue par la Fondation Bill et Melinda Gates, et le NIAID (1R01AI111918). DSK a reçu un soutien supplémentaire du Fonds Burroughs Wellcome. MNA a été soutenu par plusieurs prix T32GM007753 du NIGMS, et Paul et Daisy Soros Fellowship. Le contenu est exclusivement la responsabilité des auteurs et ne représentent pas nécessairement les vues officielles de l'NIGMS ou le NIH.
Equipment: | |||
Mini-Beadbeater-16 | BioSpec | 607 | |
PCR workstation | Any PCR hood can be used, e.g., the AirClean 600. | ||
Thermocycler | Any thermal cycler with a heated lid can be used, e.g., MJ Research PTC-200. | ||
Electrophoresis system | Any electrophoresis system can be used, e.g. the Thermo Scientific Owl EasyCast B1 Mini Gel Electrophoresis system. | ||
Nanodrop | Thermo Scientific | 2000C | Any other DNA quantification method will be sufficient |
Bioanalyzer | Agilent | 2100 | An alternative is the Agilent 2200 TapeStation Instrument. Not absolutely necessary but very helpful. |
MiSeq or HiSeq | Illumina | ||
Name | Company | Catalog Number | Comments |
Materials: | |||
Catch-All Sample Collection swab | Epibio | QEC89100 | Other swabs can be used but the Catch-All swab is recommended by the Human Microbiome Project. |
ELIMINase | Fisher | 04-355-31 | |
SteriFlip 50 mL filtration device (0.22 µm) | EMD Millipore | SCGP00525 | |
0.1 mm glass beads | BioSpec | 11079101 | |
2 mL screw-cap tubes | Sarstedt | 72.694.006 | For bead beating |
UltraPure 5M NaCl | Life Technologies | 24740-011 | Molecular Biology Grade |
1 M Tris-HCl | Ambion (Invitrogen) | AM9856 | Molecular Biology Grade |
0.5 M EDTA | Ambion (Invitrogen) | AM9260G | Molecular Biology Grade |
Sodium Dodecyl Sulfate, 20% Solution | Fisher | BP1311-200 | Molecular Biology Grade |
UltraPure DNase/RNase-free distilled water | Ambion | 10977-015 | Molecular Biology Grade, for buffer preparation |
2-Propanol BioReagent, for molecular biology, ≥99.5% | Sigma | I9516-500ML | Molecular Biology Grade |
Phenol:Chloroform:IAA, 25:24:1 | Invitrogen | AM9730 | Warning: Toxic |
3 M Sodium Acetate, pH 5.5 | Life Technologies | AM9740 | Molecular Biology Grade |
Disposable sterile polystyrene forceps, PS | Cole Parmer | EW-06443-20 | |
1.5 mL, clear, PCR clean tubes | Eppendorf | 22364120 | |
PCR grade water | MoBio | 17000-11 | For PCR |
Phusion High-Fidelity DNA Polymerase | New England Biolabs | M0530S | |
dNTP mix | Sigma | D7295-0.5mL | |
0.2 ml PCR 8-tube with attached clear flat caps, natural | USA Scientific | 1492-3900 | Any 8-tube strips that are DNase, RNase, DNA, and PCR inhibitor free will work |
Agarose | BioExpress | E-3121-25 | |
50X TAE buffer | Lonza | 51216 | |
DNA gel stain | Invitrogen | S33102 | |
6X DNA Loading Dye | Thermo (Fisher) | R0611 | |
50bp GeneRuler Ladder | Thermo (Fisher) | SM0373 | |
AllPrep DNA/RNA kit | Qiagen | 80284 | |
UltraClean PCR Clean-up Kit | MoBio | 12500-100 | |
Quant-iT PicoGreen dsDNA Assay Kit | Thermo Fisher Scientific | P11496 | An alternative is Qubit Fluorometric Quantification (Life Technologies) |
Name | Company | Catalog Number | Comments |
Primers: | |||
515F (forward primer) 5'-AATGATACGGCGACCACCGAG ATCTACACTATGGTAATTGT GTGCCAGCMGCCGCGGTAA-3' |
Order at 100 nmole; Purification: Standard Desalting. Resuspend at 100 µM. **Critical: primers must be resuspended with MoBio PCR Grade Water (see above) in a hood to avoid contamination.** | ||
Reverse primers, see the Supplemental Code File and: ftp://ftp.metagenomics.anl.gov/data/misc/EMP/SupplementaryFile1_barcoded _primers_515F_806R.txt |
IDT is recommended | If ordering large sets of primers, order as a 96-well plate at the 100 nmole scale. Resuspend at 100 μM. Full directions for primer ordering and resuspension at http://www.earthmicrobiome.org/files/2013/04/EMP_primer_ordering_and _resuspension.doc. **Critical: primers must be resuspended with MoBio PCR Grade Water (see above) in a hood to avoid contamination.** |
|
Read 1 Sequencing Primer 5'-TAT GGT AAT TGT GTG CCA GCM GCC GCG GTA A-3' | 25 nmole; Purification: Standard Desalting. Resuspend at 100 µM. | ||
Read 2 Sequencing Primer 5'-AGT CAG TCA GCC GGA CTA CHV GGG TWT CTA AT-3' | 26 nmole; Purification: Standard Desalting. Resuspend at 100 µM. | ||
Index Sequencing Primer 5'-ATT AGA WAC CCB DGT AGT CCG GCT GAC TGA CT-3' | 27 nmole; Purification: Standard Desalting. Resuspend at 100 µM. | ||
PhiX Control v3 | Illumina | FC-110-3001 | Required if performing the sequencing in-house. If the sequencing will be performed by a third-party sequencing center, they will already have PhiX. |