Characterizing microbial community has been a longstanding goal in environmental microbiology. Next-generation sequencing methods now allow for the characterization of microbial communities at an unprecedented depth with minimal cost and labor. We detail here our approach to sequence bacterial 16S ribosomal RNA genes using a benchtop sequencer.
L'une des grandes questions de l'écologie microbienne est "qui est là?" Cette question peut être répondue en utilisant divers outils, mais l'une des règles d'or de longue durée est de séquencer amplicons 16S ARN ribosomique (ARNr) de gènes générées par PCR au niveau du domaine Les réactions d'amplification de l'ADN génomique. Traditionnellement, cela a été réalisé par clonage et Sanger (électrophorèse capillaire) séquençage des amplicons PCR. L'avènement de séquençage de nouvelle génération a énormément simplifié et une augmentation de la profondeur de séquençage pour le séquençage du gène de l'ARNr 16S. L'introduction de séquenceurs de paillasse permet maintenant de petits laboratoires à effectuer leur séquençage 16S de l'ARNr en interne dans une affaire de jours. Ici, une approche pour l'ARNr 16S séquençage de l'amplicon du gène en utilisant une paillasse de séquenceur de nouvelle génération est détaillé. L'ADN de l'environnement est d'abord amplifié par PCR en utilisant des amorces qui contiennent des adaptateurs de séquençage et des codes barres. Ils sont ensuite couplés à des particules sphériques émulsion via PCR. Les particules sont de loaded sur une puce jetable et la puce est insérée dans la machine de mise en séquence, après quoi le séquençage est effectué. Les séquences sont récupérés sous forme fastq, filtrées et les codes à barres sont utilisés pour déterminer la composition des échantillons du lit. Le filtré et mis en cellule lectures sont ensuite analysées en outre l'utilisation des outils accessibles au public. Une analyse de l'exemple où lectures ont été classés avec un algorithme de taxonomie trouver dans le logiciel mothur est donnée. La méthode décrite ici est simple, peu coûteux et simple et devrait aider les petits laboratoires de profiter de la révolution génomique en cours.
Séquençage métagénomique est une technologie très puissante car il vise l'ensemble de l'information génétique contenue dans un échantillon environnemental. Il ya différentes saveurs de séquençage métagénomique, y compris le séquençage de fusil de chasse, les bibliothèques de grande insertion et le séquençage de l'amplicon. le séquençage de l'amplicon offre l'avantage d'être relativement peu coûteux, rapide et capable de produire des lectures d'une région génomique unique qui peut être généralement alignée. En outre, le flux de données pour l'analyse de séquençage de l'amplicon a été normalisé. Cependant, puisqu'il est basé sur la PCR, il a tous les biais liés à la spécificité incomplète, couverture incomplète et amorce sollicite 1,2, ce qui rend cette approche semi-quantitative au mieux. Plusieurs régions génomiques peuvent être ciblés pour le séquençage de l'amplicon y compris les gènes fonctionnels, mais les options les plus populaires sont d'utiliser des gènes marqueurs tels que le gène de l'ARNr 16S pour générer un profil de communauté. Traditionnellement, l'ARNr 16S gène amplicon Sequencing a été réalisée en utilisant des techniques à forte intensité de main-d'œuvre qui comprenait le clonage dans E. coli, la cueillette et l'extraction des colonies de plasmide suivie d'un séquençage Sanger sur les plasmides isolés, et, par conséquent, la plupart des études analysé moins de 100 clones par échantillon. Séquençage de nouvelle génération a apporté deux avancées majeures: la parallélisation massive des réactions de séquençage et, surtout, la séparation clonale des modèles sans avoir besoin d'insérer des fragments de gènes dans un hôte. Cela a simplifié considérablement le séquençage d'amplicons du gène ADNr 16S, qui est maintenant de retour en tant que caractéristique courante de nombreuses études de microbiologie de l'environnement, résultant en une «renaissance» pour l'ARNr 16S amplicon du gène séquençage 3.
Depuis l'avènement de Roche 454 séquençage en 2005 4, plusieurs autres technologies de séquençage de nouvelle génération sont apparus sur le marché (par exemple, Illumina, solide, PacBio). Plus récemment, l'introduction de la séquence de paillassers portées à petits laboratoires de la capacité de séquençage fois exclusif de grands centres de séquençage. Cinq machines stationnaires sont actuellement disponibles: la 454 GS Junior Ion Torrent Personal Genome automatique (PGM) et Proton, et l'Illumina MiSeq et NextSeq 500 Bien que toutes ces séquenceurs offrent moins de lectures par cycle et moins de bases pour chaque dollar que la plupart à temps plein séquenceurs d'échelle, ils sont plus souples, rapides, et leurs coûts d'acquisition et d'exploitation à basse rend abordable pour les petits laboratoires universitaires. Séquenceurs de paillasse sont particulièrement bien adaptés pour amplicon, petit génome et à faible complexité séquençage du métagénome dans les études de microbiologie de l'environnement, parce que ce type d'études ne nécessite généralement pas la profondeur extrême de séquençage. Par exemple, il est généralement admis que pour le séquençage du gène 16S ARNr étudie le nombre de lectures par échantillon n'est pas primordiale, comme ~ 1000 la lecture peut générer les mêmes schémas que plusieurs millions de lectures ensembles de données 5. Cela dit, paillasse prochaine generatio n séquenceurs génèrent encore de grandes quantités de données de séquence, avec des rendements maximaux de ~ 35 Mbp (454 GS Junior), ~ 2 Gbp (Ion Torrent PGM), ~ 10-15 Gbp (Ion Torrent Proton), ~ 10 Gbp (Illumina MiSeq) et ~ 100 GBP (Illumina Suivant Seq 500), ce qui est plus que suffisant pour la plupart des études de microbiologie de l'environnement.
Séquençage de nouvelle génération d'amplicons d'ARNr 16S à l'aide de séquenceurs de paillasse a été récemment appliquée à une grande variété d'environnements. Par exemple, la Ion Torrent PGM a été utilisé pour la communauté des analyses de résidus des mines d'uranium qui avaient particulièrement un pH élevé et une faible perméabilité 6, de systèmes de recirculation de l'aquaculture 7, de sols arctiques contaminés par des hydrocarbures 8,9, de sables bitumineux miniers sédiments touchés et biofilms de la rivière Athabasca 10,11, de la rhizosphère de saules plantés dans des sols contaminés 12, des corps humains et animaux 13-16 et de 17 des digesteurs anaérobies.
jove_content "> Dans cette contribution, nous détaillons notre approche de séquençage de l'ARNr 16S amplicons de gènes en interne à l'aide d'une paillasse séquenceur de nouvelle génération (la Ion Torrent PGM). Après extraction de l'ADN, les gènes ARNr 16S sont amplifiés en utilisant des amorces bactériennes au niveau du domaine qui contiennent adaptateurs de séquençage et des séquences uniques, spécifiques à l'échantillon (codes à barres). Les amplicons sont purifiés, quantifiées et regroupées dans un rapport équimolaire. Les échantillons mis en commun puis clonage amplifiés dans une émulsion PCR et séquencés. séquences qui en résultent sont analysés en utilisant la disposition du public des outils de bioinformatique ( par exemple, mothur).La méthode présentée ici est simple et peu coûteux, et devrait permettre à de nombreux laboratoires d'accéder à la puissance de séquençage métagénomique. Bien qu'il varie en fonction de la plate-forme de séquençage utilisée, une fois que les bibliothèques sont construites sont nécessaires très peu de mains sur le temps, avec la plupart des processus étant automatisés. Pour la plate-forme de séquençage utilisée ici (Ion Torrent PGM), la procédure complète peut être effectuée dans les deux jours de travail. Au moment de l'écriture (Septembre 2013), les coûts des réactifs liés à l'exemple détaillé ci-dessus ont été les suivantes: amplification par PCR de 36 échantillons: 25 $, la purification sur gel et PicoGreen ADN quantification de 36 échantillons: 125 $, émulsion PCR pour un échantillon d'amplicon groupé : 150 $ et réactifs de séquençage: 250 $, pour un total de 550 $ ou 15 $ par échantillon ou $ 0,0015 par lecture de qualité filtré. Ce prix ne comprend pas de contrat instrument de service, l'amortissement de l'instrument, technicien salaire et utilisation de l'espace de laboratoire.
tente "> Une des étapes les plus importantes est de mettre en commun tous les produits dans un rapport équimolaire, afin de récupérer le même nombre de lectures pour chacun des échantillons. PicoGreen quantification a été utilisé ici, mais d'autres méthodes pourrait être approprié, bien que moins précise (par exemple, la quantification UV, la quantification à base de gel). Même en faisant la quantification plus précise et la mise en commun, il ya une certaine variabilité dans le nombre de lectures par exemple, et à l'approche typique détaillées au tableau 2, il varie de 4380 à 32750 lit, avec une moyenne de 10 338 lit. Si le traitement grand nombre d'échantillons (plus de 40-50), la purification de gel unique de la colonne peut être remplacée par une purification sur gel en plaque ou de purification en utilisant des billes avec une coupure de taille strictes (par exemple, des perles AMPure) .À ce jour, la technologie de séquençage le plus utilisé de la prochaine génération pour le gène de l'ARNr 16S est 454. Le Ion Torrent technologie de séquençage utilisée dans ce protocole est conceptuellement très similaireà 454 et les deux techniques sont sujettes à la même type d'erreurs de séquençage. Sans surprise, il a été montré que le séquençage Ion Torrent a abouti à des résultats de séquençage très similaires à 454 séquençage 10. Récemment, de nombreux chercheurs ont exploré l'utilisation de la technologie Illumina pour l'ARNr 16S amplicon du gène séquençage 18,19. En tout cas, il serait facile d'adapter le protocole en vigueur pour d'autres séquenceurs de paillasse comme le Illumina MiSeq ou la 454 GS junior en changeant les séquences de fusion des amorces de faire correspondre les cartes et les codes à barres nécessaires à ces technologies de séquençage, comme dans le procédé décrit récemment pour la Illumina MiSeq 19. Alternativement, les chercheurs ont pu suivre les étapes 1 et 2 du protocole détaillé ici et envoyer les amplicons communs à un centre de séquençage où l'émulsion PCR et séquençage seraient effectuées.
Le gène de l'ARNr 16S lectures ont été coupé et classé à l'aide mothur, mais beaucoup d'autres analyses peuvent être effectuées surAmplicons du gène ADNr 16S. Par exemple, la diversité bêta peut être évaluée en calculant les distances entre chaque paire Unifrac de l'échantillon à l'aide de la procédure décrite à http://unifrac.colorado.edu/ 20. Alpha indices de diversité et le nombre d'unités taxonomiques opérationnelles de chaque échantillon peuvent être calculées à l'aide des outils dans QIIME comme AmpliconNoise 21 ou en utilisant la procédure décrite par Huse et al. 22 et disponible dans mothur.
Les amorces utilisées ici amplifiés les régions variables 3 et 4 du gène de l'ARNr 16S, mais beaucoup d'autres régions pourraient être ciblés. Dans cette étude, les gènes de l'ARNr 16S ont été amplifiés à partir de la matière végétale et le choix de l'amorce ont été faits pour éviter l'amplification du gène de l'ARNr 16S du chloroplaste 23,24. Il existe une grande variété d'autres amorces disponibles qui varient selon la durée de la longueur du produit, la puissance et l'utilité taxonomique 25,26. Cependant, dans tous les cas 200-400 pb lit du gène ARNr 16S ne peut pas être fiable classés au niveau de l'espèce, et les analyses sont limitées au genre et les niveaux taxonomiques plus élevés. D'autres gènes pourraient être plus approprié si l'information au niveau des espèces est nécessaire, comme les cpn60 et rpoB gènes 27,28. Une chute brutale à venir dans le coût du séquençage et l'augmentation de la puissance des outils d'analyse pourrait rendre possible de remplacer le séquençage du gène 16S ARNr par métagénomique fusil de chasse, mais en attendant, le séquençage du gène 16S ARNr reste la norme de microbiologie environnementale de l'or.
The authors have nothing to disclose.
Development of the method presented here has been carried out with various sources of funding, including Genome Canada and Genome Quebec, Environment Canada STAGE program and internal NRC funds.
Reagent | Company | Catalog Number |
Ion 314 Chip Kit v2 | Life Technologies | 4482261 |
Ion PGM Sequencing 200 Kit v2 | Life Technologies | 4482006 |
Ion PGM Template OT2 200 Kit | Life Technologies | 4480974 |
HotStarTaq Plus Master Mix Kit | Qiagen | 203646 |
Primers and probes | IDT | NA |
Qiaquick Gel Extraction Kit | Qiagen | 28704 |
BSA 20 mg/ml | Roche | 10,711,454,001 |
Dynabeads MyOne Streptavidin C1 | Life Technologies | 65001 |