Summary

Métagénomique Analyse des Ensilage

Published: January 13, 2017
doi:

Summary

Metagenomics was used to investigate the microbiome of silage cattle feed. Analysis was performed by shotgun sequencing. This approach was used to characterize the composition of the microbial community within the cattle feed.

Abstract

Metagenomics is defined as the direct analysis of deoxyribonucleic acid (DNA) purified from environmental samples and enables taxonomic identification of the microbial communities present within them. Two main metagenomic approaches exist; sequencing the 16S rRNA gene coding region, which exhibits sufficient variation between taxa for identification, and shotgun sequencing, in which genomes of the organisms that are present in the sample are analyzed and ascribed to “operational taxonomic units”; species, genera or families depending on the extent of sequencing coverage.

In this study, shotgun sequencing was used to analyze the microbial community present in cattle silage and, coupled with a range of bioinformatics tools to quality check and filter the DNA sequence reads, perform taxonomic classification of the microbial populations present within the sampled silage, and achieve functional annotation of the sequences. These methods were employed to identify potentially harmful bacteria that existed within the silage, an indication of silage spoilage. If spoiled silage is not remediated, then upon ingestion it could be potentially fatal to the livestock.

Introduction

Métagénomique est l'analyse directe de l' ADN purifié à partir des communautés biologiques trouvés dans les échantillons environnementaux 1 et a été initialement utilisé pour détecter les bactéries non cultivables trouvés dans les sédiments 2. Metagénomique a été largement utilisée depuis un certain nombre d'applications, telles que l' identification du microbiome humain 3, classer les populations microbiennes au sein de l'océan 4 et même pour l'analyse des populations bactériennes qui se développent sur des machines à café 5. L'introduction des technologies de séquençage de prochaine génération a donné lieu à un plus grand débit de séquençage et de sortie. Par conséquent, le séquençage de l' ADN est devenu plus économique 6 et la profondeur de séquençage qui peut être effectuée a considérablement augmenté, ce qui permet la métagénomique de devenir un puissant outil analytique.

Améliorations "Front-end" dans l'aspect pratique, moléculaire de séquençage métagénomique ont stimulé la croissance de l'enoutils silico bioinformatiques disponibles pour la classification taxonomique 7-9, annotation fonctionnelle 10,11 et 12,13 représentation visuelle des données de séquence d'ADN. Le nombre croissant de disponibles, séquencée procaryotes et eucaryotes 14 génomes permet encore la précision de la classification des communautés microbiennes, qui sont invariablement réalisées contre une base de données de référence "back-end" de génomes séquencés 15. Deux approches principales peuvent être adoptées pour l'analyse métagénomique.

La méthode la plus classique est l'analyse du gène de l'ARNr 16S région du génome bactérien codant. Le ARNr 16S est hautement conservée entre les espèces procaryotes mais présente neuf régions hyper-variable (V1 – V9) qui peut être exploitée pour l' identification des espèces 16. L'introduction de plus le séquençage (≤ 300 pb d'extrémité appariées) a permis l'analyse de séquences d'ADN couvrant deux zones hyper-variables, et en particulierV3 – V4 région 17. Les progrès réalisés dans d' autres technologies de séquençage, telles que Oxford Nanopore 18 et PacBio 19, ne permettent la totalité du gène ARNr 16S à séquencer contigue.

Alors que les bibliothèques à base d'ADNr 16S fournissent une approche ciblée pour l'identification des espèces et permettent la détection de l'ADN du faible nombre de copies qui se produit naturellement dans les échantillons purifiés, les bibliothèques de séquençage shotgun permettent la détection d'espèces qui peuvent contenir des régions d'ADN qui sont soit non amplifiable par les 16S ARNr séquences marqueur d'amorces utilisées, ou parce que les différences entre la séquence de matrice et la séquence d' amplification de l' amorce sont trop grands 20,21. En outre, bien que les ADN polymérases ont une haute fidélité de la réplication de l' ADN, des erreurs de base peuvent néanmoins se produire lors de l' amplification PCR et ces erreurs incorporés peuvent aboutir à une classification incorrecte des espèces originaires 22. Biais dans l'amplification par PCR de modèle suivantsuences peuvent également se produire; des séquences d'ADN ayant une teneur élevée en GC peuvent être sous – représentés dans le pool d'amplicon finale 23 et de même des modifications de bases non naturelles, telles que la thymine glycol, peut mettre fin à des ADN polymérases provoquant des défaillances dans l'amplification de séquences d' ADN 24. En revanche, une banque d'ADN de séquençage shotgun est une banque d'ADN qui a été préparé en utilisant tout l'ADN purifié qui a été extrait d'un échantillon et ensuite fragmenté en des longueurs de chaîne d'ADN plus court avant la préparation pour le séquençage. Classification taxonomique des séquences d'ADN générées par séquençage aléatoire est plus précis par rapport à l' ARNr 16S amplicon séquençage 25, bien que le coût financier nécessaire pour atteindre une profondeur de séquençage fiable est supérieure à celle du amplicon séquençage 26. Le principal avantage de séquençage aléatoire métagénomique est que les régions séquencées des différents génomes de l'échantillon sont disponibles pour la prospection génétique une fois qu'ils ont étéa été classé 27 taxonomiquement.

les données de séquence métagénomique est analysée par une gamme de plus en plus d'outils bioinformatiques. Ces outils sont en mesure d'effectuer une grande variété d'applications, par exemple, l' analyse de contrôle de la qualité des données de séquences brutes 28, chevauchant la fin appariés lit 29, assemblage de novo de la séquence se lit à contigs et échafauds 30,31, la classification taxonomique et de visualisation la séquence de lecture et des séquences assemblé 7,12,32,33 et l'annotation fonctionnelle des séquences assemblées 34,35.

Ensilage, produites par les agriculteurs dans le monde entier à partir de céréales fermentées telles que le maïs (Zea mays), est principalement utilisé comme aliment pour le bétail. Ensilage est traitée avec la bactérie Lactobacillus sp. pour faciliter la fermentation 36 mais à ce jour, il y a une connaissance limitée des autres populations microbiennes trouvées dans l' ensilage. Le fermentsn processus peut conduire à des micro-organismes indésirables et potentiellement dangereux devenant répandue au sein de l'ensilage 37. En plus des levures et moisissures, les bactéries sont particulièrement adaptés à l'environnement anaérobie dans la fermentation de l' ensilage et sont plus fréquemment associés à des maladies du bétail , plutôt que la dégradation de l'ensilage 38. Les bactéries butyriques peuvent être ajoutés , par inadvertance , à partir du sol reste lors du remplissage des silos d'ensilage et sont capables de convertir l'acide lactique, un produit de digestion anaérobie, en acide butyrique, en augmentant ainsi le pH de 39 l'ensilage. Cette augmentation du pH peut conduire à une recrudescence des bactéries d' altération qui serait normalement incapable de soutenir la croissance dans l' ensilage des conditions optimales de fermentation 38. Clostridium spp. , Listeria spp. et Bacillus spp. sont particulièrement préoccupants, en particulier dans l'ensilage pour l'alimentation des bovins laitiers, sous forme de spores bactériennes qui ont survécu à la gastrtractus ointestinal 40 peut entrer dans la chaîne alimentaire, conduire à la détérioration des aliments et, dans de rares cas, à l' animal et des décès humains 37,39,41-44. De plus, alors qu'il est difficile d'estimer l'impact économique exact du traitement vétérinaire et la perte de bétail causée par l'ensilage détérioration, il est susceptible d'être préjudiciable à une ferme si une épidémie devait se produire.

On suppose que, en utilisant une approche métagénomique nous pouvons classer les populations microbiennes qui sont présents dans des échantillons d'ensilage et en outre d'identifier les communautés microbiennes associées à l'ensilage détérioration qui, à son tour, ont potentiellement un effet néfaste sur le bétail, ce qui permet des mesures correctives pour être prise avant l'ensilage doit être utilisé en tant que source de nourriture.

Protocol

1. Emplacement du site Recueillir l'échantillon d'ensilage à partir d'un site approprié, comme une ferme. Ici, la ferme était située dans Ballydulea, Co. Cork, Irlande (51 ° 51'58.4 "N 8 ° 16'48.7" W). 2. Extraction de l'ADN REMARQUE: L'extraction d'ADN a été réalisée à l'aide d'un kit commercial en suivant les instructions du fabricant. Un contrôle négatif, qui ne contient pas l'échantillon, a été utilisé dans le procédé de préparation de la bibliothèque. Ajouter 1-400 mg d'échantillon de 978 ul de tampon phosphate de sodium et le tampon de lyse du sol 122 pi dans des tubes de lyse fournis. Homogénéiser les échantillons en plaçant les tubes de lyse dans l'homogénéiseur pendant 40 s à une vitesse de 6,0 m / s. lysats Centrifugeuse à 14.000 xg pendant 15 minutes et transférer le surnageant dans un tube de micro-centrifugeuse propre contenant 250 pi de protéine Précipité Solution (PPS). Mélanger la solution en retournant de 10 fois et centrifugerà 14.000 xg pendant 5 min. Ajouter le surnageant à 1 matrice de liaison d'ADN mL dans un ml tube de centrifugeuse propre 15. Mélanger la solution en retournant le tube en permanence pendant 3 min. Laisser le mélange reposer pendant 3 min, puis défaussez 500 pi de surnageant. Mélanger le surnageant restant. Transférer 600 ul de la suspension à un filtre et centrifuger à 14000 xg pendant 1 min. Jeter le filtrat et répétez le processus avec la suspension restante. Ajouter 500 pi de tampon de lavage à la matrice de liaison d'ADN dans le filtre de spin, mélanger par pipetage, puis centrifuger à 14 000 xg pendant 1 min. Jeter le filtrat et centrifuger à nouveau le filtre centrifuge à 14.000 xg pendant 2 min pour assurer tout le tampon de lavage est éliminé. Sécher le filtre rotatif à 23 ° C pendant 5 min. Pré-chaud (70 ° C) l'eau DNase (DES) et re-suspendre la matrice de liaison d'ADN dans 100 ul du DES dans le filtre de spin. Transférer le filtre rotatif à un nettoyage de 1,5 ml de micro-centrifugeuse tuêtre et centrifuger à 14 000 xg pendant 1 min à éluer l'ADN. Conserver l'ADN purifié à -20 ° C jusqu'à nouvel analyse est effectuée. 3. Purification d'ADN Perles de purification utilisant de l'ADN REMARQUE: Avant la préparation de la bibliothèque metagénomique On a purifié l'ADN extrait en utilisant des billes de purification pour obtenir un échantillon d'ADN pur a été obtenu. Incuber les billes à 23 ° C pendant 30 min avant utilisation. Ajouter 2 volumes de perles de l'échantillon d'ADN et faire incuber la solution à 23 ° C pendant 5 min. Placer les échantillons sur un aimant de séparation pendant 5 min, puis jeter le surnageant. Laver les billes deux fois avec 200 ul d'éthanol frais à 80% (EtOH). Sécher à l'air les perles pendant 10 minutes. Retirer les échantillons de l'aimant de séparation et ajouter 50 pi de tampon d'élution (EB), mélanger par pipetage. Incuber la suspension à 23 ° C pendant 5 min, après quoi placer les échantillons en arrière sur l'aimant de séparation pendant 3 min. Transfert le surnageant, qui contient l'ADN dans un tube propre. Jeter les perles. Quantifier l'ADN purifié conformément à la section quatre. 4. Quantification de l'ADN purifié NOTE: L'ADN purifié a été quantifiée en utilisant un fluorimètre et double brin (ADNdb) haute sensibilité (HS) kit de dosage suivant les instructions du fabricant. Préparer une solution de travail à l'aide de 199: 1 d'un tampon de réactif. Ajouter 10 pi de chaque norme d'ADN à 190 pi de solution de travail. Ajouter 10 ul d'ADN purifié à 190 ul de la solution de travail. Le volume final doit être de 200 pi. Incuber échantillons standards et d'ADN à 23 ° C pendant 2 min. Analyser les normes avant que les échantillons d'ADN sur le fluorimètre en utilisant les instructions à l'écran. 5. Shotgun Sequencing Bibliothèque Préparation REMARQUE: La bibliothèque de séquençage aléatoire a été préparé à l'aide d'unKit de préparation de la bibliothèque commerciale en utilisant les instructions du fabricant. Diluer les échantillons d'ADN à 0,2 ng / ul utilisant EB. Tout échantillon qui est déjà en dessous de cette concentration, à savoir le contrôle négatif, est laissé à sa concentration actuelle. Mélanger 5 pi de l'ADN purifié avec 10 pi de tampon et 5 pi mélange enzymatique. Incuber les échantillons à 55 ° C pendant 5 min. Ajouter 5 pi de tampon de neutralisation et incuber la solution à 23 ° C pendant 5 min. Ajouter 5 ul de chacun des indices des échantillons de séquençage spécifiques et 15 ul de mélange maître de PCR. Dans un thermocycleur, incuber les échantillons à 72 ° C pendant 3 min, 95 ° C pendant 30 s, avant 12 cycles de 95 ° C pendant 10 s, 55 ° C pendant 30 s et 72 ° C pendant 30 s. Incuber échantillons enfin à 72 ° C pendant 5 min. Purifier l'ADN préparé à l'aide de la purification de perles comme avant, mais avec une élution finale de 30 pi de EB. 6. LQuantité ibrary et Contrôle de la qualité NOTE: La quantité et la qualité des bibliothèques préparées ont été évaluées à l'aide d'un kit commercial et de l'instrumentation. Incuber les composants du kit à 23 ° C pendant 30 minutes avant utilisation. Ajouter 2 ul d'ADN à 2 ul de tampon et vortex pendant 1 min à 2000 tours par minute. Centrifuger l'échantillon pour assurer qu'il se trouve au fond du tube. Insérez les tubes d'échantillons, la bande d'analyse et des conseils dans l'instrument, et effectuer des analyses selon les instructions du logiciel. 7. séquençage de l' ADN Transférer les bibliothèques de séquençage d'ADN des échantillons préparés et quantifiés à un service et la séquence en utilisant le séquençage de 300 pb fin jumelé séquençage 45. 8. Analyse des premières données de séquence NOTE: Les commandes pour chaque programme en utilisant un système d'exploitation Linux sont présentés ci-dessous l'étape du protocole. Le pipeline utilisé pour sl' analyse des données equence est représenté sur la figure 1. Les programmes doivent être installés par l'utilisateur avant l'analyse. Ce processus doit être effectué individuellement pour chaque échantillon. Analyser et visualiser les données de séquence d'ADN en utilisant FastQC 46 en tapant la ligne de commande / path-to-file / fastqc, suivie par la marche avant et arrière lectures brutes raw_read2.fastq raw_read1.fastq. Spécifiez un dossier de sortie en tapant output_fastqc -o et le format de fichier des fichiers lus premières par fastq -f. Voir le fichier de sortie (Figure 2). path-to-file / fastqc raw_read1.fastq raw_read2.fastq -o output_directory -f fastq. 9. Contrôle de la qualité Parage et filtrage de données de séquence Exécutez le programme de détourage, Trimmomatic 28 en tapant dans la ligne de commande java -jar / path-to-file / trimmomatic-0.35.jar. Spécifiez les fichiers sont jumelés fichiers finaux en tapant «PE». Etat 16 pr centraleunités ocessing (CPU) doivent être utilisés par le programme en tapant -threads 16. Lister les deux fichiers au QC chèque en tapant les noms de la première avant et arrière se lit. Le préfixe des fichiers de sortie est déterminée en saisissant l'ensilage -baseout. Définir les options pour le programme en tapant ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 LEADING: 3 TRAILING: 3 SLIDINGWINDOW: 4: 20 CULTURE: 200 HEADCROP: 15 minlen: 36. Une fois terminée, l'analyse des séquences à l'aide FastQC parés comme précédemment et comparer la sortie des premières données de séquence afin d'assurer la coupe a été réalisée avec succès. REMARQUE: L'outil logiciel, Trimmomatic, rognée lit encore en enlevant menant faible qualité ou N bases (ci-dessous la qualité 3), la suppression de fuite de faible qualité ou N bases (ci-dessous la qualité 3) et la numérisation chaque lecture avec une fenêtre coulissante large 4-base. Les paramètres ont été définis pour la coupe lorsque la qualité moyenne par base tombe en dessous de 20, puis de laisser tomber tout se lit en dessous de 36 bases de long. Enfin, 15 bases ont été recadrées from la tête de chaque lecture et lectures ont été coupés pour maintenir 200 bases depuis le début de la lecture. Cette dernière étape a été réalisée pour surmonter certains problèmes de qualité lorsque le séquençage à long (> 200 pb) lit. Ceux – ci peuvent être ajustés pour des échantillons spécifiques 28. java -jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq ensilage -baseout ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 LEADING: 3 TRAILING: 3 SLIDINGWINDOW: 4 : 20 CULTURE: 200 HEADCROP: 15 minlen: 36 10. Assemblée Metagénome Fusionner le apparié, rognée lit en tapant cat suivi par le apparié lit; silage_read1_unpaired.fastq silage_read2_unpaired.fastq. Écrivez les fichiers dans un nouveau fichier en tapant> silage_merged_unpaired.fastq cat silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq Pour de novo assembler l'ADN séquencé, utilisez Spades (Saint – Pétersbourg génome assembleur) 30 en tapant / path-to-file / spades.py. Précisent que les 16 processeurs doivent être utilisés en tapant -t 16 et que le paramètre doit metagénomique appliqué en tapant –meta. Identifier les rognée avant lit en utilisant -1 silage_read1_paired.fastq et l'inverse se lit par -2 silage_read2_paired.fastq. La apparié fusionnée lit sont spécifiés par silage_merged_unpaired.fastq -s. Définir le dossier de sortie en tapant -o silage_spades. path-to-file / spades.py -t 16 –meta -1 silage_read1_paired.fastq -2 silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades 11. Couplé-end Lire Overlap Fusionner paires de séquence d'ADN lectures en utilisant FLASH (Fast Réglage de la longueur du court Lit) 29 en tapant dans la ligne de commande / path-to-file / flash. Préciser que 16 processeurs devraient être utilisés en utilisant -t 16 et le préfixe de sortie en tapant -o ensilage. Identifier TRIMMED lit en tapant silage_trimmed_R1.fastq silage_trimmed_R2.fastq path-to-file / flash -t 16 -o FLASHED silage_read2_paired.fastq silage_read1_paired.fastq 12. Classification taxonomique Type / chemin vers un fichier / kraken et spécifiez la base de données en tapant –db / path-to-file / standard. Définir que 16 processeurs devraient être utilisés en tapant –threads 16 et identifier un dossier de sortie en utilisant –output FLASHed_silage_extendedFrags_kraken.txt. Tapez le nom du fichier d'entrée; FLASHed_silage.extendedFrags.fastq path-to-file / standard –db kraken –thread 16 –output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq NOTE: Classification des échafauds de séquences d'ADN assemblés à l' aide de Kraken 7 a été achevée contre la plus récente base de données, Kraken standard qui contenait toutes les séquences du génome Prokaryote disponibles. colonnes de transfert 2 et 3 à partir du fichier de sortie et à un nouveau fichier en tapant cut -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int <li> Ouvrez le fichier de sortie dans le navigateur Web. couper -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int Importez le nouveau fichier dans Krona 12 en tapant ktImportTaxonomy. Spécifiez le fichier d'entrée en tapant FLASHed_silage_extendedFrags_kraken.int. Identifier le fichier de sortie en tapant -o FLASHed_silage_extendedFrags_kraken.out.html. path-to-file / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html 13. Annotation fonctionnelle Accédez au site 47 MG-RAST, http://metagenomics.anl.gov/. Inscrivez-vous comme nouvel utilisateur si nécessaire. Une fois connecté, cliquez sur le bouton "Ajouter". Téléchargez les échafauds assemblés à partir de l'étape 10. Une fois les fichiers téléchargés, cliquez sur «Soumettre» et suivez les instructions et attendre la fin de l'analyse. Une fois l'analyse terminée, affichez le lien envoyé via emtous de MG-RAST, ou encore, cliquez sur "Progress". Il y a une liste des travaux terminés. Cliquez sur l'identifiant de l'emploi correspondante puis sur le lien vers la "page de téléchargement". Sur la page de téléchargement, sous la rubrique «Protein Clustering 90%", cliquez sur le bouton de protéines pour télécharger le fichier de protéine prédite, 550.cluster.aa90.faa. Pour classer les protéines appartenant comme putative à une classe particulière d'enzyme CAZy, comparez les protéines téléchargées dans la base de données CAZy 48. Télécharger la base de données Enzymes Glucides-actifs (CAZy) à partir de fichiers sont: AA.zip, CE.zip, GH.zip, GT.zip et PL.zip. Ces fichiers représentent les classes d'enzymes suivantes respectivement: Activités auxiliaires (liste AA), Glucides Esterases (CE), glycoside hydrolases (GH), glycosyle Transférases (GT) et Polysaccharide lyases (PL). Décompressez les fichiers de base de données et d'annoter les protéines en déterminant la similitude des protéines aux protéines de base de données en utilisant le cazy algor USEARCH UBLASTIthm 49. Pour utiliser une boucle de bash (for i in * .txt) pour parcourir la base de données de type 5 fichiers .txt "for i in * .txt; faire». Exécutez USEARCH en tapant / path-to-file / usearch8 avec le paramètre -ublast afin d'utiliser l'algorithme de ublast. Ensuite, tapez le nom du fichier de séquence protéique téléchargé à partir de MG-RAST, "mgmXXXXXX.3.550.cluster.aa90.faa". Pour indiquer le fichier de base de données à utiliser le type "-db $ i" et de préciser le seuil E-valeur à 1E -5, tapez "-evalue 1E-5". Mettre fin à la recherche après la découverte d'une séquence cible et classer par conséquent que la séquence de la protéine comme appartenant à la classe cible de l' enzyme, par exemple , la GH, de type "-masaccepts 1". Pour définir que 16 processeurs doivent être utilisés de type "-threads 16" et pour spécifier le format du fichier de sortie comme atab séparés texte de type "-blast6out". Pour identifier le type de fichier de sortie "$ de i.ublast". Pour mettre fin à la boucle de bash, type "; fait" for i in * .txt; faire / path-to-file / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ i -evalue 1e-5 -maxaccepts 1 -threads 16 -blast6out i.ublast $; terminé 14. Visualizing CAZy Annotation Pour visualiser la sortie de l'annotation CAZy comme un diagramme de Venn, générer des listes de protéines d'identité pour chaque classe d'enzyme en utilisant une boucle de bash. Tapez "for i in * .ublast; faire». Pour transférer la colonne 1 du fichier de sortie et à un nouveau fichier, tapez "cat $ i | coupé -f 1> $ i.list". Termine la boucle et le type "; done". Ouvrez les fichiers .LIST dans un éditeur de texte. Allez sur le site, sélectionnez le nombre de jeux que 5 et collez le contenu de chaque fichier de liste dans une boîte séparée. Télécharger le diagramme résultant en tant que fichier .SVG. for i in * .ublast; faire cat $ i | cut -f 1> $ i.list; terminé

Representative Results

Avant le traitement bioinformatique, séquence brute lectures ont été coupé et les adaptateurs ont été enlevés en utilisant le logiciel Trimmomatic 28. Après l'étape de coupe et le filtrage, le nombre de lectures a été ramené à 50% de la séquence se lit comme suit ( voir le tableau 1). Le score moyen de phred de base était> 30 après contrôle de la qualité (Figure 2). Des paires de séquences d' ADN qui avaient des régions qui se chevauchent ont été fusionnées en utilisant le logiciel FLASH 29 pour générer plus simple lit, non-chevauchement lectures ont été conservés dans un fichier séparé. 45,47% lit (105343) combiné avec succès. Après le chevauchement de lit en utilisant FLASH de lit, les fragments étendus résultant ont subi la classification taxonomique des bactéries en utilisant le logiciel Kraken 7 et ont ensuite été visualisés avec le logiciel Krona (Figure 3). <p class="jove_content" fo:keep-together.dans les pages = "1"> La majorité des espèces bactériennes présentes dans le métagénome de l'ensilage se trouvent à moins de 4 embranchements procaryote: Firmicutes (34%), Actinobactéries (28%), Proteobacteria (27%) et Bacteroidetes (7%) . La répartition des classes présentes dans ces phylums peut être vu sur la figure 4. Les espèces les plus abondantes dans le métagénome étaient Lactobacillus spp. (24%; Firmicutes), Corynebacterium spp. (8%; Actinobactéries), Propionibacterium spp. (3%; Actinobactéries) et Prevotella spp. (3%; Bacteroidetes). Les espèces importantes pour la santé des animaux et impliqués dans la maladie ont également été observées; Clostridium spp. (1%) Bacillus spp. (0,6%), Listeria spp. (0,2%) a été prévu pour être présent dans l'échantillon d'ensilage. Annotation fonctionnelle a été réalisée sur assemblé lit. Le métagénome a été assemblé en utilisant l'assembleur Spades 30 en utilisant la rognée et filtréejumelé-end et apparié lectures générant 92,284 échafauds. Afin d'identifier les cellulases, les protéines ont été estimées à l'aide MG-RAST et annotées en utilisant la base de données Enzymes Glucides-actifs (CAZy). Des protéines prédites 97,562, 6357 ont été annotés comme un hydrate de carbone actif enzyme putative dans l' une des cinq classes d'enzymes qui composent la base de données CAZy (figure 5). Les résultats ont été visualisées sous forme de diagramme de Venn en utilisant le logiciel InteractiVenn 50 montrant la répartition des annotations de protéines , y compris ceux contenant plus d'une CAZy classe enzyme annotation. Parmi ceux-ci, 3861 ont été prédit pour avoir une activité hydrolase glycoside et sera caractérisé en outre en laboratoire pour confirmer la fonction. Figure 1: Bioinformatic métagénomique Pipeline pour l'analyse de Ensilage. Deux approches principales ont étéutilisé pour étudier le microbiome de l'ensilage, la classification taxonomique et annotation fonctionnelle. S'il vous plaît cliquer ici pour voir une version plus grande de cette figure. Figure 2: Qualité de séquence par-base avant et après la coupe et de l' adaptateur enlèvement. La séquence graphique de FASTQC par base de qualité montre le score phred moyenne sur toute la longueur de la séquence lit de contrôle avant et après la qualité. S'il vous plaît cliquer ici pour voir une version plus grande de cette figure. Figure 3: Classifica taxonomiquetion du microbiome bactérien du Ensilage solide. Classification de la séquence garni et le chevauchement se lit de FLASH a été réalisée en utilisant Kraken 7 et ensuite visualisé avec couronne. S'il vous plaît cliquer ici pour voir une version plus grande de cette figure. Figure 4: Répartition de classe taxonomique du 4 Phyla plus abondant dans le microbiome bactérien du Ensilage solide. Le pourcentage de chaque catégorie de bactéries dans les quatre embranchements le plus abondant. Firmicutes: Clostridia (rouge) et les bacilles (bleu foncé); Proteobacteria: delta / epsilon (rose), alpha (bleu pâle), gamma (orange) et bêta (turquoise); Bacteroidetes: Flavobacteriia (bleu foncé) et Bacteroidia(Vert pâle); Actinobactéries: Coriobacteriia (violet foncé) et d' autres Actinobactéries (vert foncé). S'il vous plaît cliquer ici pour voir une version plus grande de cette figure. Figure 5: CAZy Annotation du Proteome prédites dans le massif Ensilage microbiome. diagramme de Venn montrant la répartition des cinq classes d'enzymes d'annotations cazy dans le protéome prédit d'ensilage solide microbiome. S'il vous plaît cliquer ici pour voir une version plus grande de cette figure. # Raw lit # Filtré lit (apparié) </td> # Filtré lit # FLASHED lit (Apparié) (Apparié) 2.374.949 x2 231679 x2 1892534 105343 Tableau 1: Tableau récapitulatif des Séquençage Reads.

Discussion

Alors qu'une l'analyse silico peut donner un excellent aperçu des communautés microbiennes qui sont présentes dans les échantillons environnementaux, il est essentiel que les classifications taxonomiques ont démontré être effectué en association avec des contrôles appropriés et qu'une profondeur appropriée de séquençage a été réalisé pour capter la totalité population actuelle 51.

Avec une analyse de calcul, il y a beaucoup de routes pour atteindre un objectif similaire. Les méthodes que nous avons utilisées dans cette étude sont des exemples de méthodes appropriées et simples, qui ont été réunis pour réaliser une série d'analyses sur le microbiome d'ensilage. Une variété et un nombre toujours croissant d'outils et de techniques bioinformatiques sont disponibles pour analyser les données métagénomique, par exemple Phylosift 8 et MetaPhlAn2 52, et ceux – ci doivent être évalués avant l'enquête de leur pertinence pour l'échantillon et l'analyse required 53. Les méthodes d'analyse metagénomiques sont limitées par les bases de données disponibles pour la classification, la profondeur de mise en séquence et la qualité du séquençage.

Le traitement bioinformatique démontré ici a été réalisée sur une machine de haute puissance locale; Cependant les systèmes basés sur le cloud sont également disponibles. Ces services de cloud computing permettent pour la location de la puissance de calcul nécessaire sans avoir l'investissement à coût élevé d'un puissant poste de travail local approprié. Une application potentielle de cette méthode serait d'évaluer l'ensilage avant son utilisation dans l'agriculture pour veiller à ce qu'aucun des bactéries potentiellement nuisibles sont présents donc les empêcher d'entrer dans la chaîne alimentaire.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Authors would like to thank Andrew Bird for the silage samples and Audrey Farbos of the Exeter Sequencing Service for her assistance in preparing DNA sequencing libraries. Exeter Sequencing Service and Computational core facilities at the University of Exeter. Medical Research Council Clinical Infrastructure award (MR/M008924/1). Wellcome Trust Institutional Strategic Support Fund (WT097835MF), Wellcome Trust Multi User Equipment Award (WT101650MA) and BBSRC LOLA award (BB/K003240/1).

Materials

FastDNA SPIN Kit for Soil MP Bio 116560200 DNA Extraction
DNA FastPrep MP Bio 116004500 DNA Extraction
Agencourt AMPure XP beads Beckman Coulter A63880 DNA Purification
Elution Buffer Qiagen 19806 DNA Purification
Qubit Fluorometer Thermo Fisher Q33216 DNA Quantification
Qubit dsDNA HS Assay Kit Thermo Fisher Q32854 DNA Quantification
Nextera XT DNA Library Prep Kit Illumina FC-131-1024 Library Preparation
Nextera XT Index Kit Illumina FC-131-1001 Library Preparation
TapeStation 2200 Agilent G2964AA DNA Quantification
HS D100 ScreenTape Agilent 5067-5584 DNA Quantification
HS D100 ScreenTape Reagents Agilent 5067-5585 DNA Quantification
TapeStation Tips Agilent 5067-5153 DNA Quantification
TapeStation Tubes Agilent 401428 and 401425 DNA Quantification
HiSeq 2500 Illumina DNA Sequencing – provided by a sequencing service
High Power Analysis Workstation Various Local or cloud based, user preferred system

References

  1. Riesenfeld, C. S., Schloss, P. D., Handelsman, J. Metagenomics: genomic analysis of microbial communities. Annu. Rev. Genet. 38 (1), 525-552 (2004).
  2. Amann, R. I., Ludwig, W., Schleifer, K. H. Phylogenetic identification and in situ detection of individual microbial cells without cultivation. Microbiol. Rev. 59 (1), 143-169 (1995).
  3. Human Microbiome Project Consortium. Structure, function and diversity of the healthy human microbiome. Nature. 486 (7402), 207-214 (2012).
  4. Venter, J. C., et al. Environmental genome shotgun sequencing of the Sargasso Sea. Science. 304 (5667), 66-74 (2004).
  5. Vilanova, C., Iglesias, A., Porcar, M. The coffee-machine bacteriome: biodiversity and colonisation of the wasted coffee tray leach. Sci. Rep. 5, 17163 (2015).
  6. Hayden, E. C. Technology: The $1,000 genome. Nature. 507 (7492), 294-295 (2014).
  7. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Gen. Biol. 15 (3), 46 (2014).
  8. Darling, A. E., et al. PhyloSift: phylogenetic analysis of genomes and metagenomes. PeerJ. 2 (12), 243 (2014).
  9. Buchfink, B., Xie, C., Huson, D. H. Fast and sensitive protein alignment using DIAMOND. Nat. Meth. 12 (1), 59-60 (2015).
  10. Moreno-Hagelsieb, G., Hudy-Yuffa, B. Estimating overannotation across prokaryotic genomes using BLAST+, UBLAST, LAST and BLAT. BMC Res Notes. 7 (1), 651 (2014).
  11. Hauser, M., Steinegger, M., Söding, J. MMseqs software suite for fast and deep clustering and searching of large protein sequence sets. Bioinf. 32 (9), 1323-1330 (2016).
  12. Ondov, B. D., Bergman, N. H., Phillippy, A. M. Interactive metagenomic visualization in a Web browser. BMC Bioinf. 12, (2011).
  13. Kolde, R., Vilo, J. GOsummaries: an R Package for Visual Functional Annotation of Experimental Data. F1000Res. 4, 574 (2015).
  14. Reddy, T. B. K., et al. The Genomes OnLine Database (GOLD) v.5: a metadata management system based on a four level (meta)genome project classification. Nuc. Aci. Res. 43 (1), 1099-1106 (2015).
  15. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinf. 10 (1), 421 (2009).
  16. Chakravorty, S., Helb, D., Burday, M., Connell, N., Alland, D. A detailed analysis of 16S ribosomal RNA gene segments for the diagnosis of pathogenic bacteria. J. Micro. Met. 69 (2), 330-339 (2007).
  17. Fadrosh, D. W., et al. An improved dual-indexing approach for multiplexed 16S rRNA gene sequencing on the Illumina MiSeq platform. Microbiome. 2 (1), 6 (2014).
  18. Mikheyev, A. S., Tin, M. M. Y. A first look at the Oxford Nanopore MinION sequencer. Molecular Ecology Resources. 14 (6), 1097-1102 (2014).
  19. Schadt, E. E., Turner, S., Kasarskis, A. A window into third generation sequencing. Hum. Mol. Genet. 20 (4), 853-853 (2011).
  20. Shapiro, B., Hofreiter, M. A Paleogenomic Perspective on Evolution and Gene Function: New Insights from Ancient DNA. Science. 343 (6169), 1236573 (2014).
  21. Der Sarkissian, C., et al. Ancient genomics. Phil. Trans. R. Soc. B. 370 (1660), (2015).
  22. Patin, N. V., Kunin, V., Lidström, U., Ashby, M. N. Effects of OTU Clustering and PCR Artifacts on Microbial Diversity Estimates. Microb Ecol. 65 (3), 709-719 (2013).
  23. McInroy, G. R., Raiber, E. -. A., Balasubramanian, S. Chemical biology of genomic DNA: minimizing PCR bias. Chem. Commun. 50 (81), 12047-12049 (2014).
  24. Aller, P., Rould, M. A., Hogg, M., Wallace, S. S., Doublié, S. A structural rationale for stalling of a replicative DNA polymerase at the most common oxidative thymine lesion, thymine glycol. Proc. Natl. Acad. Sci. U.S.A. 104 (3), 814-818 (2007).
  25. Ranjan, R., Rani, A., Metwally, A., McGee, H. S., Perkins, D. L. Analysis of the microbiome: Advantages of whole genome shotgun versus 16S amplicon sequencing. Biochem. Biophys. Res. Commun. 469 (4), 967-977 (2016).
  26. Sims, D., Sudbery, I., Ilott, N. E., Heger, A., Ponting, C. P. Sequencing depth and coverage: key considerations in genomic analyses. Nat Rev Genet. 15 (2), 121-132 (2014).
  27. Li, X., Rao, S., Wang, Y., Gong, B. Gene mining: a novel and powerful ensemble decision approach to hunting for disease genes using microarray expression profiling. Nuc. Aci. Res. 32 (9), 2685-2694 (2004).
  28. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinf. 30 (15), 2114-2120 (2014).
  29. Magoc, T., Salzberg, S. L. FLASH: fast length adjustment of short reads to improve genome assemblies. Bioinf. 27 (21), 2957-2963 (2011).
  30. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. J. Comput. Biol. 19 (5), 455-477 (2012).
  31. Nurk, S., Meleshko, D., Korobeynikov, A. . metaSPAdes: a new versatile de novo metagenomics assembler. , (2016).
  32. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215 (3), 403-410 (1990).
  33. Tanaseichuk, O., Borneman, J., Jiang, T. Phylogeny-based classification of microbial communities. Bioinf. 30 (4), 449-456 (2014).
  34. Bose, T., Haque, M. M., Reddy, C., Mande, S. S. COGNIZER: A Framework for Functional Annotation of Metagenomic Datasets. PLoS ONE. 10 (11), 0142102 (2015).
  35. Sharma, A. K., Gupta, A., Kumar, S., Dhakan, D. B., Sharma, V. K. Woods: A fast and accurate functional annotator and classifier of genomic and metagenomic sequences. Genomics. 106 (1), 1-6 (2015).
  36. Eikmeyer, F. G., et al. Metagenome analyses reveal the influence of the inoculant Lactobacillus buchneri CD034 on the microbial community involved in grass ensiling. J. Biotech. 167 (3), 334-343 (2013).
  37. Driehuis, F., Elferink, S. J. W. H. O. The impact of the quality of silage on animal health and food safety: A review. Vet. Quart. 22 (4), 212-216 (2000).
  38. Dunière, L., Sindou, J., Chaucheyras-Durand, F., Chevallier, I., Thévenot-Sergentet, D. Silage processing and strategies to prevent persistence of undesirable microorganisms. Anim Feed Sci Technol. 182 (1-4), 1-15 (2013).
  39. Vissers, M. M. M., et al. Minimizing the Level of Butyric Acid Bacteria Spores in Farm Tank Milk. J. of Dairy Sci. 90 (7), 3278-3285 (2007).
  40. Te Giffel, M. C., Wagendorp, A., Herrewegh, A. Bacterial spores in silage and raw milk. Antonie van. , (2002).
  41. Wiedmann, M. ADSA Foundation Scholar Award-An Integrated Science-Based Approach to Dairy Food Safety: Listeria monocytogenes as a Model System. J. of Dairy Sci. 86 (6), 1865-1875 (2003).
  42. Low, J. C., Donachie, W. A review of Listeria monocytogenes and listeriosis. Vet J. 153 (1), 9-29 (1997).
  43. Schoder, D., Melzner, D., Schmalwieser, A. Important vectors for Listeria monocytogenes transmission at farm dairies manufacturing fresh sheep and goat cheese from raw. J.Food. , (2011).
  44. Lindström, M., Myllykoski, J., Sivelä, S., Korkeala, H. Clostridium botulinumin Cattle and Dairy Products. Crit. Rev. Food Sci. Nutr. 50 (4), 281-304 (2010).
  45. Bentley, D. R., et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 456 (7218), 53-59 (2008).
  46. Andrews, S. . Babraham Bioinformatic- FastQC: A Quality Control tool for High Throughput Sequence Data. , (2015).
  47. Keegan, K. P., Glass, E. M., Meyer, F. FMG-RAST, a Metagenomics Service for Analysis of Microbial Community Structure and Function. Methods Mol. Biol. 1399, 207-233 (2016).
  48. Cantarel, B. L., et al. The Carbohydrate-Active EnZymes database (CAZy): an expert resource for Glycogenomics. Nuc. Aci. Res. 37, 233-238 (2009).
  49. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinf. 26 (19), 2460-2461 (2010).
  50. Heberle, H., et al. InteractiVenn: a web-based tool for the analysis of sets through Venn diagrams. BMC Bioinf. 16 (1), 213 (2015).
  51. Ni, J., Yan, Q., Yu, Y. How much metagenomic sequencing is enough to achieve a given goal. Sci. Rep. 3, 1968 (2013).
  52. Truong, D. T., et al. MetaPhlAn2 for enhanced metagenomic taxonomic profiling. Nat. Meth. 12 (10), 902-903 (2015).
  53. Oulas, A., et al. Metagenomics: tools and insights for analyzing next-generation sequencing data derived from biodiversity studies. Bioinform Biol Insights. 9 (9), 75-88 (2015).

Play Video

Cite This Article
Tennant, R. K., Sambles, C. M., Diffey, G. E., Moore, K. A., Love, J. Metagenomic Analysis of Silage. J. Vis. Exp. (119), e54936, doi:10.3791/54936 (2017).

View Video