Metagenomic Analysis of Silage

Richard K. Tennant; Christine M. Sambles; Georgina E. Diffey; Karen A. Moore; John Love

doi:10.3791/54936

JoVE Journal > Genetics

Please note that all translations are automatically generated. Click here for the English version.

Genetics

Metagenomic Analyse van kuilvoer

Published: January 13, 2017

doi:

10.3791/54936

Richard K. Tennant¹, Christine M. Sambles¹, Georgina E. Diffey¹, Karen A. Moore¹, John Love¹

¹Biosciences,University of Exeter

Summary

Metagenomics was used to investigate the microbiome of silage cattle feed. Analysis was performed by shotgun sequencing. This approach was used to characterize the composition of the microbial community within the cattle feed.

Abstract

Metagenomics is defined as the direct analysis of deoxyribonucleic acid (DNA) purified from environmental samples and enables taxonomic identification of the microbial communities present within them. Two main metagenomic approaches exist; sequencing the 16S rRNA gene coding region, which exhibits sufficient variation between taxa for identification, and shotgun sequencing, in which genomes of the organisms that are present in the sample are analyzed and ascribed to “operational taxonomic units”; species, genera or families depending on the extent of sequencing coverage.

In this study, shotgun sequencing was used to analyze the microbial community present in cattle silage and, coupled with a range of bioinformatics tools to quality check and filter the DNA sequence reads, perform taxonomic classification of the microbial populations present within the sampled silage, and achieve functional annotation of the sequences. These methods were employed to identify potentially harmful bacteria that existed within the silage, an indication of silage spoilage. If spoiled silage is not remediated, then upon ingestion it could be potentially fatal to the livestock.

Introduction

Metagenomics is de directe analyse van DNA gezuiverd uit biologische gemeenschappen binnen het milieu monsters ¹ en werd oorspronkelijk gebruikt om cultiveerbare bacteriën gevonden in sedimenten ² te detecteren. Metagenomics is op grote schaal gebruikt voor diverse toepassingen, zoals identificatie van de menselijke microbiome ^3, rangschikken microbiële populaties in de oceaan ⁴ en zelfs voor de analyse van de bacteriële gemeenschappen die ontwikkelen koffiemachines ^5. De introductie van de volgende generatie sequencing technologie geleid tot een grotere sequencing doorvoer en uitvoer. Bijgevolg heeft DNA sequentiebepaling zuiniger ⁶ worden en de diepte van de sequentie die kan worden uitgevoerd is sterk toegenomen, waardoor metagenomica een krachtig analytisch hulpmiddel geworden.

"Front-end" verbeteringen in de praktische, moleculaire aspecten van metagenomic sequencing hebben de groei van de in geredensilico bioinformatica instrumenten beschikbaar zijn voor de taxonomische classificatie ^7-9, functionele annotatie ^10,11 en ^12,13 visuele weergave van DNA-sequentie gegevens. Het toenemende aantal beschikbare, gesequenced prokaryotische en eukaryotische ¹⁴ genomen maakt verdere nauwkeurigheid bij de indeling van microbiële gemeenschappen, die steevast worden uitgevoerd tegen een "back-end" referentie-database van opeenvolgende genomen ^15. Twee belangrijke benaderingen voor metagenomic analyse worden vastgesteld.

De meer conventionele methode is de analyse van het 16S rRNA-gen coderende regio bacteriële genoom. De 16S rRNA is sterk geconserveerd tussen prokaryote species maar vertoont negen hyper-variabele gebieden (V1 – V9), die kan worden benut voor soortidentificatie ^16. De invoering van langere sequentie (≤ 300 bp gepaarde einde) toegestaan voor de analyse van DNA-sequenties verspreid over twee hypervariabele gebieden, met namede V3 – V4 regio ^17. Vooruitgang in andere sequencing technologieën, zoals Oxford Nanopore ¹⁸ en PacBIO ^19, niet toestaan het volledige 16S rRNA-gen aansluitend worden gesequenced.

Terwijl 16S rDNA gebaseerde bibliotheken een gerichte aanpak soortenidentificatie en maken de detectie van een klein aantal kopieën DNA dat van nature voorkomt in gezuiverde monsters, shotgun sequencing bibliotheken zijn voor de detectie van soorten die DNA-gebieden die ofwel niet amplificeerbaar de 16S kan bevatten rRNA marker primersequenties gebruikt, of omdat de verschillen tussen de matrijs en de sequentie amplificeren primersequentie te groot ^20,21. Bovendien, hoewel de DNA-polymerasen hebben een hoge betrouwbaarheid van DNA-replicatie, basis fouten kunnen toch optreden tijdens PCR-amplificatie en deze verwerkt fouten kunnen leiden tot een onjuiste indeling van oorsprong soorten ^22. Systematische fouten in de PCR amplificatie van SEQ templateinvloeden kan zich ook voordoen; DNA-sequenties met een hoog GC-gehalte kunnen zijn ondervertegenwoordigd in het uiteindelijke amplicon pool ²³ en evenzo onnatuurlijke base modificaties, zoals thymine glycol, kan stoppen DNA polymerasen waardoor fouten in de amplificatie van DNA-sequenties ^24. Daarentegen een shotgun sequencing DNA bibliotheek DNA-bibliotheek die is bereid onder toepassing van alle gezuiverde DNA die uit een monster geëxtraheerd en vervolgens in DNA kortere ketenlengten vóór voorbereiding sequentiebepaling versnipperd. Taxonomische classificatie van DNA-sequenties gegenereerd door shotgun sequentiebepaling nauwkeuriger vergelijking met 16S rRNA sequentie amplicon ^25, hoewel de financiële kosten vereist bereikt een betrouwbare sequencing diepte groter dan ²⁶ amplicon sequencing. Het grote voordeel van shotgun sequencing metagenomica dat opeenvolgende delen van de verschillende genomen in het monster beschikbaar zijn voor gen- opsporing nadat zij zijnis taxonomisch ingedeeld ^27.

Metagenomic sequentie gegevens worden geanalyseerd door een steeds groeiend aantal bioinformatica instrumenten. Deze tools zijn in staat om een breed scala van toepassingen uit te voeren, bijvoorbeeld, kwaliteitscontrole analyse van het ruwe sequence data ^28, samenloop van gepaarde einde leest ^29, de novo assemblage van sequentie leest contigs en steigers ^30,31, taxonomische indeling en visualisatie sequentie leest en geassembleerd sequenties ^7,12,32,33 en de functionele annotatie van geassembleerde sequenties ^34,35.

Kuilvoer, geproduceerd door de boeren over de hele wereld van gefermenteerde granen zoals maïs (Zea mays), wordt voornamelijk gebruikt als veevoer. Silage wordt behandeld met de bacterie Lactobacillus sp. vergisting steun ³⁶ maar tot op heden is er beperkte kennis van de andere microbiële populaties in silage. de Fermentation proces kan leiden tot ongewenste en potentieel schadelijke micro-organismen steeds overwegend in de kuil ^37. Naast gisten en schimmels, bacteriën bijzonder aangepast aan de anaërobe omgeving fermenteren kuilvoer en worden vaker geassocieerd met ziektes in de plaats van de afbraak van de kuil ^38. Boterzuur bacteriën kunnen onbedoeld worden toegevoegd bodem blijft bij het vullen van het kuilvoer silo en kunnen melkzuur, een product van anaerobe vergisting omzetten naar boterzuur, waardoor de pH van de kuil ³⁹ verhogen. Deze toename in pH kan leiden tot een toename van bederf bacteriën die meestal geen groei onder optimale kuilvoer fermentatieomstandigheden ³⁸ houden zou. Clostridium spp. Listeria spp. en Bacillus spp. zijn van bijzonder belang, vooral in kuilvoer voor melkvee-feed, zoals bacteriële sporen die de Gastr hebben overleefdointestinal darmkanaal ⁴⁰ kan de voedselketen in te voeren, leiden tot voedselbederf en, in zeldzame gevallen, dierlijke en menselijke slachtoffers ^37,39,41-44. Bovendien, terwijl het moeilijk nauwkeurig economische impact van veterinaire behandeling en vee schade door bederf van kuilvoer te schatten, is het waarschijnlijk schadelijk voor een boerderij om als een uitbraak plaatsvinden.

Er wordt verondersteld dat door een metagenomic benadering zijn de de microbiële populatie die aanwezig zijn in silage monsters classificeren en bovendien microbiële gemeenschappen geassocieerd met kuilvoer bederf die zouden op hun beurt mogelijk een nadelig effect op de dieren te identificeren, zodat corrigerende actie te vóór het kuilvoer wordt gebruikt als een voedselbron.

Protocol

1. Site Location Verzamel het kuilvoer monster uit een geschikte plaats, zoals een boerderij. Hier, de boerderij is gelegen in Ballydulea, Co. Cork, Ierland (51 ° 51'58.4 "N 8 ° 16'48.7" W). 2. DNA Extraction OPMERKING: DNA-extractie werd uitgevoerd met een commerciële kit volgens de instructies van de fabrikant. Een negatieve controle, waarin geen monster bevatte, werd gebruikt in de bibliotheek bereidingswijze. Voeg 100-400 mg monster 978 pl natriumfosfaat buffer en 122 uL bodem lysisbuffer in de geleverde lysebuizen. Homogeniseer monsters Door de lysis buizen in de homogenisator gedurende 40 s met een snelheid van 6,0 m / s. Centrifugeer lysaten bij 14.000 xg gedurende 15 min en breng het supernatans naar een schone micro-centrifugebuis bevattende 250 ui eiwitprecipitaat Solution (PPS). Meng de oplossing door het omkeren 10 keer en centrifugebij 14.000 xg gedurende 5 minuten. Voeg de supernatant aan 1 ml DNA bindende matrix in een schone 15 ml centrifugebuis. Meng de oplossing door het buisje voortdurend gedurende 3 min. Laat het mengsel gedurende 3 min, gooi 500 pl supernatant. Meng de resterende supernatant. Transfer 600 pi van de suspensie op een spin filter en centrifugeer bij 14.000 xg gedurende 1 min. Werp het filtraat en herhaalt het proces met de resterende suspensie. Voeg 500 ul wasbuffer aan de DNA bindende matrix in de spin filter, mengen door pipetteren en centrifugeer bij 14.000 xg gedurende 1 min. Gooi het filtraat en centrifuge de spin filter opnieuw bij 14.000 xg gedurende 2 minuten om ervoor te zorgen alle wasbuffer wordt verwijderd. Droog het rotatiefilter bij 23 ° C gedurende 5 min. Pre-warm (70 ° C) de DNase-vrij water (DES) en opnieuw op te schorten van de DNA-bindende matrix in 100 pi van DES in de spin-filter. Breng de spin-filter om een schone 1,5 ml micro-centrifuge tuen centrifugeer bij 14.000 xg gedurende 1 min om DNA te elueren. Bewaar het gezuiverde DNA bij -20 ° C tot verdere analyse wordt uitgevoerd. 3. DNA Purification gebruiken DNA Purification Beads NB: Voorafgaand aan metagenomic bibliotheek voorbereiding het gewonnen DNA werd gezuiverd met behulp van zuivering kralen om een zuiver DNA-monster te verzekeren werd verkregen. Incubeer de kralen bij 23 C gedurende 30 min vóór gebruik. Voeg 2 volumes korrels aan het DNA monster en incubeer de oplossing bij 23 ° C gedurende 5 min. Plaats de monsters op een scheiding magneet voor 5 minuten en dan gooi het supernatant. Was de kralen tweemaal met 200 pl vers 80% ethanol (EtOH). Lucht droog de korrels gedurende 10 min. Verwijder de monsters uit de scheiding magneet en voeg 50 ul elutiebuffer (EB), meng door pipetteren. Incubeer de suspensie bij 23 ° C gedurende 5 minuten, waarna de monsters plaats terug op de scheiding magneet voor 3 minuten. Transfer de supernatant, die het DNA bevat, een schone buis. Gooi de kralen. Kwantificeren van de gezuiverde DNA als per deel vier. 4. Kwantificering van gezuiverde DNA OPMERKING: Gezuiverd DNA werd gekwantificeerd onder toepassing van een fluorometer en dubbelstrengs (dsDNA) High Sensitivity (HS) assay kit volgens de instructies van de fabrikant. Bereid een werkoplossing via 199: 1 verhouding van buffer tot reagens. Voeg 10 ul van elk DNA standaard 190 uL werkoplossing. Voeg 10 ul van gezuiverd DNA 190 ul werkoplossing. Het eindvolume moet 200 pi. Incubeer en standaard DNA monsters bij 23 ° C gedurende 2 min. Analyseer normen vóór de DNA-monsters op de fluorometer met behulp van de instructies op het scherm. 5. Shotgun Sequencing Bibliotheek Voorbereiding OPMERKING: De shotgun sequencing bibliotheek werd bereid met eencommerciële bibliotheek bereiding kit volgens de instructies van de fabrikant. Verdun het DNA monsters 0,2 ng / ul gebruikt EB. Elk monster dat is al onder deze concentratie, dat wil zeggen de negatieve controle, wordt overgelaten aan de huidige concentratie. Meng 5 pi van het gezuiverde DNA met 10 pi buffer en 5 pi enzymmengsel. Incubeer monsters bij 55 ° C gedurende 5 min. Voeg 5 ul van neutraliserende buffer en incubeer de oplossing bij 23 ° C gedurende 5 min. Voeg 5 ul van elk monster van de specifieke sequentie indexen en 15 pi PCR Master Mix. In een thermocycler, incubeer de monsters bij 72 ° C gedurende 3 min, 95 ° C voor 30 s, voor 12 cycli van 95 ° C gedurende 10 s, 55 C gedurende 30 s en 72 C gedurende 30 s. Incubeer monsters tenslotte bij 72 C gedurende 5 min. Zuiver het bereide DNA met de kraal zuivering als voorheen maar met een laatste elutie van 30 pi van EB. 6. Library Kwantiteit en kwaliteit controleren OPMERKING: De hoeveelheid en kwaliteit van de bereide bibliotheken werden beoordeeld onder toepassing van een commerciële kit en instrumentatie. Incubeer de kit componenten bij 23 ° C gedurende 30 minuten voor gebruik. Voeg 2 ul van DNA 2 pl buffer en vortex gedurende 1 min bij 2000 rpm. Spin down het monster teneinde verzekerd te zijn aan de bodem van de buis. Plaats de monsterbuizen, analyse tape en tips in het instrument, en het uitvoeren van analyses zoals aangegeven door de software. 7. DNA Sequencing Breng de voorbereide en gekwantificeerde DNA-sequencing bibliotheken monsters naar een sequencing dienst en de volgorde met behulp van 300 bp gepaarde end sequencing 45. 8. Analyse van Raw Sequence gegevens LET OP: De commando's voor elk programma met een Linux-besturingssysteem onder het protocol stap getoond. De leiding voor sequence gegevensanalyse figuur 1. De programma's moeten worden geïnstalleerd door de gebruiker voorafgaand aan analyse. Dit proces moet individueel worden uitgevoerd voor elk monster. Analyseren en visualiseren van DNA-sequentie gegevens met behulp van FastQC 46 door te typen in de command line / path-to-file / fastqc, gevolgd door de vooruit en achteruit ruwe leest raw_read1.fastq raw_read2.fastq. Geef een output map door te typen -o output_fastqc en het bestandsformaat van het ruwe lezen bestanden -f fastq. Bekijk de output file (figuur 2). path-to-file / fastqc raw_read1.fastq raw_read2.fastq -o uitvoer_directory -f fastq. 9. Quality Control trimmen en filtering Sequence data Voer het in orde maken programma, Trimmomatic 28 door te typen in de command line java -jar / path-to-file / trimmomatic-0.35.jar. Geef de bestanden worden gekoppeld eind bestanden door te typen 'PE'. Staat dat 16 centrale prHOUTBEWERKINGS units (CPU's) dient te worden gebruikt door het programma door te typen -threads 16. Een lijst van de twee bestanden naar QC controle door het intypen van de namen van de ruwe vooruit en achteruit leest. Het voorvoegsel van de output bestanden wordt bepaald door het intypen -baseout kuilvoer. Definieer de opties voor het programma door te typen ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 LEIDEN: 3 TRAILING: 3 SLIDINGWINDOW: 4: 20 CROP: 200 HEADCROP: 15 MINLEN: 36. Eenmaal voltooid, analyseert de getrimde sequenties onder FastQC als hiervoor en vergelijkt de output om de ruwe sequentiegegevens te waarborgen trimmen is met succes uitgevoerd. LET OP: De software tool, Trimmomatic, getrimd leest verder door het verwijderen van toonaangevende lage kwaliteit of N basen (hieronder kwaliteit 3), het verwijderen van het slepen van lage kwaliteit of N basen (hieronder kwaliteit 3) en scannen elk gelezen met een 4-base breed schuifraam. De parameters zijn ingesteld voor het snijden wanneer de gemiddelde kwaliteit per base lager is dan 20 en vervolgens te laten vallen elke leest hieronder 36 basen lang. Tenslotte werden 15 basen fr bijgesnedenOM het hoofd van iedere lezen en leest werden bijgesneden tot 200 bases te houden vanaf het begin van het lezen. Deze laatste stap werd uitgevoerd om een aantal aspecten van kwaliteit te overwinnen wanneer lang het sequencen (> 200 bp) leest. Deze kunnen worden aangepast voor specifieke monsters 28. java-jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq -baseout kuilvoer ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 LEIDEN: 3 TRAILING: 3 SLIDINGWINDOW: 4 : 20 CROP: 200 HEADCROP: 15 MINLEN: 36 10. metagenoom Assembly Voeg de ongepaarde, getrimd leest door het intikken van cat gevolgd door de ongepaarde leest; silage_read1_unpaired.fastq silage_read2_unpaired.fastq. Schrijf de bestanden naar een nieuw bestand door te typen> silage_merged_unpaired.fastq cat silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq Om de novo monteren van de gesequenced DNA, gebruik SPADES (Sint-Petersburg genoom assembler) 30 door te typen / path-to-File / spades.py. Aangeven dat CPU 16 worden gebruikt door het typen -t 16 en de metagenomic parameter moet aangebracht door typen –meta. Identificeer de bijgesneden naar voren leest met behulp van -1 silage_read1_paired.fastq en omgekeerd leest met -2 silage_read2_paired.fastq. De gefuseerde ongepaarde leest worden gespecificeerd door -s silage_merged_unpaired.fastq. Definieer de output map door te typen -o silage_spades. path-to-file / spades.py -t 16 –meta -1 silage_read1_paired.fastq -2 silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades 11. Gekoppelde-end lezen Overlap Samenvoegen paren van DNA-sequentie leest met behulp van Flash (Fast Lengte aanpassing van de Short Leest) 29 door te typen in de command line / path-to-file / flash. Geef aan dat 16 CPU's moeten worden gebruikt door het gebruik van -t 16 en de output prefix door te typen -o kuilvoer. Identificeer bijgesneden leest door het intikken van silage_trimmed_R1.fastq silage_trimmed_R2.fastq path-to-file / flash -t 16 -o flitste silage_read1_paired.fastq silage_read2_paired.fastq 12. taxonomische classificatie Type / path-to-file / kraken en geef de database door te typen –db / path-to-file / standaard. Definieer dat 16 CPU's moeten worden gebruikt door het intikken van –threads 16 en identificeren van een uitgang van de map met behulp van –output FLASHed_silage_extendedFrags_kraken.txt. Typ de naam input-file; FLASHed_silage.extendedFrags.fastq path-to-file / kraken –db standaard –thread 16 –output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq LET OP: De indeling van de verzamelde DNA-sequentie met behulp van steigers Kraken 7 gebeurt tegen de meest recente, standaard Kraken database die alle beschikbare Prokaryote genoomsequenties bevatten. Transfer kolommen 2 en 3 van de output bestand en een nieuw bestand door te typen cut -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int <li> Open het output bestand in de web browser. cut -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int Importeer het nieuwe bestand in Krona 12 door te typen ktImportTaxonomy. Geef de input bestand door te typen FLASHed_silage_extendedFrags_kraken.int. Identificeer de output bestand door te typen -o FLASHed_silage_extendedFrags_kraken.out.html. path-to-file / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html 13. functionele annotatie Ga naar de MG-RAST 47 website, http://metagenomics.anl.gov/. Registreer u als een nieuwe gebruiker indien nodig. Na het inloggen, klik op de knop "Uploaden". Upload de verzamelde steigers van Stap 10. Nadat de bestanden zijn geüpload, klikt u op 'Verzenden' en volg de instructies en wachten op de voltooiing van de analyse. Na de analyse is voltooid, zien de link verstuurd via email van MG-RAST, of als alternatief, klik op "Progress". Er is een lijst van voltooide taken. Klik op de betreffende baan id en vervolgens op de link om de "download pagina". Op de download pagina, onder het kopje "Protein Clustering 90%", klikt u op het eiwit-knop om de voorspelde eiwit-bestand te downloaden, 550.cluster.aa90.faa. De eiwitten vermoedelijk tot een specifieke Cazy enzymklasse classificeren, vergelijk gedownloade eiwitten aan de Cazy gegevensbank 48. Download de Carbohydrate-actieve enzymen Database (Cazy) uit bestanden zijn: AA.zip, CE.zip, GH.zip, GT.zip en PL.zip. Deze bestanden vertegenwoordigen de volgende enzym klassen respectievelijk: Auxiliary Activiteiten (AA), Carbohydrate Esterases (CE), glycosidehydrolasen (GH), glycosyltransferases (GT) en Polysaccharide Lyasen (PL). Pak de databasebestanden en annoteren de eiwitten door het bepalen van het eiwit gelijkenis met de Cazy databank eiwitten met behulp van de USEARCH UBLAST Algorithm 49. Om een bash lus (for i in * .txt) te doorlopen de 5 databank .txt-bestanden type "for i in * .txt, doe". Run USEARCH door te typen / path-to-file / usearch8 met de parameter -ublast om de ublast algoritme. typ dan de naam van de eiwitsequentie bestand gedownload van MG-RAST, "mgmXXXXXX.3.550.cluster.aa90.faa". Om het databasebestand te geven om te worden gebruikt type "-db $ i" en de E-waarde drempel 1e -5 opgeeft, type "-evalue 1e-5". Om het zoeken na de ontdekking van een doelsequentie te beëindigen en daarmee het classificeren van dat eiwit sequentie als behorend tot de doelgroep enzym klasse, bijvoorbeeld GH, type "-masaccepts 1". Om te bepalen dat 16 CPU's te gebruiken type "-threads 16" en het formaat van de output bestand als-ATAB gescheiden tekst type "-blast6out" opgeven. Om de output file type "$ i.ublast" te identificeren. Om de bash lus te beëindigen, tYpe "; gedaan" for i in * .txt; do / path-to-file / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ i -evalue 1e-5 -maxaccepts 1 -threads 16 -blast6out $ i.ublast; gedaan 14. Visualiseren Cazy annotatie Om de uitvoer van de Cazy annotatie als een Venn-diagram te visualiseren, het genereren van eiwit ID-lijsten voor elk enzym klas met behulp van een bash lus. Type "for i in * .ublast, doe". Om kolom 1 brengen van de output bestand en een nieuw bestand, type "cat $ i | cut -f 1> $ i.list". Sluit de lus en type ", done". Open de .Lijst bestanden in een teksteditor. Ga naar de website, selecteer het aantal sets als 5 en plak de inhoud van elke lijst bestand in een aparte doos. Download het resulterende diagram als een .SVG bestand. for i in * .ublast; do cat $ i | cut -f 1> $ i.list; gedaan

Representative Results

Voorafgaand aan bioinformatica verwerking, leest ruwe opeenvolging werden schoongemaakt en adapters werden verwijderd met behulp van software Trimmomatic 28. Na het trimmen en filtratiestap, het aantal leest werd verminderd tot 50% van de sequentie leest (tabel 1). De gemiddelde basis phred score was> 30 na kwaliteitscontrole (figuur 2). Paren van DNA-sequenties die hadden overlappende gebieden werden samengevoegd met behulp van Flash-software 29 tot enkele langer leest genereren, leest niet-overlappende in een apart bestand werden gehouden. 45,47% leest (105.343) met succes gecombineerd. Naar aanleiding van de overlapping van luidt het gebruik van FLASH leest, de resulterende verlengde fragmenten onderging bacteriële taxonomische classificatie op basis van Kraken software 7 en werden vervolgens gevisualiseerd met Krona software (figuur 3). <p class="jove_content" fo:keep-together.Binnen-page = "1"> De meeste bacteriële soorten in het kuilvoer metagenoom worden binnen 4 prokaryotische phyla: Firmicutes (34%), Actinobacteria (28%), Proteobacteria (27%) en Bacteroidetes (7%) . De verdeling van de klassen aanwezig binnen deze phyla te zien in figuur 4. De meest voorkomende soorten in de metagenoom waren Lactobacillus spp. (24%, Firmicutes), Corynebacterium spp. (8%; Actinobacteria), Propionibacterium spp. (3%, Actinobacteria) en Prevotella spp. (3%; Bacteroidetes). Species belangrijk voor de gezondheid van dieren en betrokken bij de ziekte werden ook waargenomen; Clostridium spp. (1%) Bacillus spp. (0,6%), Listeria spp. (0,2%) werden voorspeld aanwezig in het kuilvoer monster zijn. Functionele annotatie werd uitgevoerd op geassembleerde leest. De metagenoom werd samengesteld met behulp van The Spades assembler 30 met behulp van de bijgesneden en gefilterdgepaarde-end en ongepaarde leest het genereren van 92.284 steigers. Om cellulases identificeren werden eiwitten voorspeld met behulp van MG-RAST en geannoteerd met behulp van het Carbohydrate-actieve enzymen Database (Cazy). Van de 97.562 voorspelde eiwitten, 6357 werden geannoteerd als een vermeend koolhydraat-actief enzym in één van de vijf enzymen klassen die deel uitmaken van de Cazy database (figuur 5). Resultaten werden gevisualiseerd als een Venn-diagram gebruikt InteractiVenn software 50 die de verdeling van eiwitten annotaties inbegrip van die welke meer dan één Cazy enzymklasse annotatie. Hiervan 3861 werden voorspeld glycoside hydrolase activiteit en wordt verder gekarakteriseerd in het laboratorium om functie te bevestigen. Figuur 1: Bioinformatica Metagenomics strategie voor de analyse van kuilvoer. Twee belangrijke benaderingen warengebruikt om de microbiome van kuilvoer, taxonomische classificatie en functioneel annotatie te onderzoeken. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 2: Sequence Quality Per-base voor en na bijsnijden en Adapter verwijderen. De per-basesequentie kwaliteit plot van FASTQC toont de gemiddelde phred score over de lengte van de sequentie leest pre- en post-kwaliteitscontrole. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 3: Taxonomische Classificatie van de bacteriële Microbiome van Solid Silage. Classificatie van bijgesneden en overlappende volgorde leest van FLASH werd uitgevoerd met behulp van Kraken 7 en vervolgens gevisualiseerd met kroon. Klik hier om een grotere versie van deze figuur te bekijken. Figuur 4: Taxonomische Class Verspreiding van de 4 meest voorkomende Phyla in de Bacteriële Microbiome van Solid Silage. Het percentage van elke klasse van bacteriën in de vier meest voorkomende phyla. Firmicutes: Clostridia (rood) en Bacilli (donkerblauw); Proteobacteria: delta / epsilon (roze), alfa (lichtblauw), gamma (oranje) en beta (turquoise); Bacteroidetes: Flavobacteriia (donkerblauw) en Bacteroidia(lichtgroen); Actinobacteria: Coriobacteriia (donker paars) en andere Actinobacteria (donkergroen). Klik hier om een grotere versie van deze figuur te bekijken. Figuur 5: Cazy annotatie van het voorspelde Proteome in de Solid Silage Microbiome. Venn diagram dat de verdeling van de vijf klassen van enzym Cazy aantekeningen in het voorspelde proteoom vaste kuilvoer microbiome. Klik hier om een grotere versie van deze figuur te bekijken. # Raw leest # Gefilterd leest (gekoppelde) </td> # Gefilterd leest # Flitste leest (Gekoppelde) (Ongepaard) 2.374.949 x2 231.679 x2 1.892.534 105.343 Tabel 1: Overzicht van Sequencing Leest.

Discussion

Terwijl een in silico analyse een uitstekend inzicht in de microbiële gemeenschappen die aanwezig zijn in milieumonsters zijn kunnen geven, is het essentieel dat de taxonomische indeling aangetoond worden uitgevoerd samen met relevante controles en dat een geschikte diepte van sequencing is bereikt om het gehele vangen populatie aanwezig ^51.

Met een geautomatiseerde analyse, zijn er vele routes naar eenzelfde doel te bereiken. De methoden die we hebben gebruikt in deze studie zijn voorbeelden van geschikte en eenvoudige werkwijzen, die met elkaar zijn gebracht om een reeks analyses van de kuil microbiome bereiken. Een verscheidenheid en een steeds toenemend aantal bioinformatica tools en technieken beschikbaar om metagenomic gegevens te analyseren, bijvoorbeeld Phylosift ⁸ en MetaPhlAn2 ^52, en deze moeten voorafgaand aan het onderzoek voor hun relevantie voor het monster en de analyse req worden geëvalueerduired ^53. Metagenomic analysemethoden worden beperkt door de beschikbare databases voor indeling, sequencing diepte en kwaliteit van sequencing.

De bio-informatica verwerking hier gedemonstreerd werd uitgevoerd op een lokale, hoog aangedreven machine; Maar cloud-gebaseerde systemen zijn ook beschikbaar. Deze cloud-gebaseerde diensten mogelijk te maken voor de verhuur van de benodigde rekenkracht, zonder de hoge kosten investering van een geschikte krachtige lokale werkstation. Een mogelijke toepassing van deze methode zou zijn om kuilvoer beoordelen vóór het gebruik in de landbouw te voorkomen dat potentieel schadelijke bacteriën aanwezig zijn daarom voorkomen dat ze in de voedselketen.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Authors would like to thank Andrew Bird for the silage samples and Audrey Farbos of the Exeter Sequencing Service for her assistance in preparing DNA sequencing libraries. Exeter Sequencing Service and Computational core facilities at the University of Exeter. Medical Research Council Clinical Infrastructure award (MR/M008924/1). Wellcome Trust Institutional Strategic Support Fund (WT097835MF), Wellcome Trust Multi User Equipment Award (WT101650MA) and BBSRC LOLA award (BB/K003240/1).

Materials

FastDNA SPIN Kit for Soil	MP Bio	116560200	DNA Extraction
DNA FastPrep	MP Bio	116004500	DNA Extraction
Agencourt AMPure XP beads	Beckman Coulter	A63880	DNA Purification
Elution Buffer	Qiagen	19806	DNA Purification
Qubit Fluorometer	Thermo Fisher	Q33216	DNA Quantification
Qubit dsDNA HS Assay Kit	Thermo Fisher	Q32854	DNA Quantification
Nextera XT DNA Library Prep Kit	Illumina	FC-131-1024	Library Preparation
Nextera XT Index Kit	Illumina	FC-131-1001	Library Preparation
TapeStation 2200	Agilent	G2964AA	DNA Quantification
HS D100 ScreenTape	Agilent	5067-5584	DNA Quantification
HS D100 ScreenTape Reagents	Agilent	5067-5585	DNA Quantification
TapeStation Tips	Agilent	5067-5153	DNA Quantification
TapeStation Tubes	Agilent	401428 and 401425	DNA Quantification
HiSeq 2500	Illumina		DNA Sequencing – provided by a sequencing service
High Power Analysis Workstation	Various		Local or cloud based, user preferred system

References

Riesenfeld, C. S., Schloss, P. D., Handelsman, J. Metagenomics: genomic analysis of microbial communities. Annu. Rev. Genet. 38 (1), 525-552 (2004).
Amann, R. I., Ludwig, W., Schleifer, K. H. Phylogenetic identification and in situ detection of individual microbial cells without cultivation. Microbiol. Rev. 59 (1), 143-169 (1995).
Human Microbiome Project Consortium. Structure, function and diversity of the healthy human microbiome. Nature. 486 (7402), 207-214 (2012).
Venter, J. C., et al. Environmental genome shotgun sequencing of the Sargasso Sea. Science. 304 (5667), 66-74 (2004).
Vilanova, C., Iglesias, A., Porcar, M. The coffee-machine bacteriome: biodiversity and colonisation of the wasted coffee tray leach. Sci. Rep. 5, 17163 (2015).
Hayden, E. C. Technology: The $1,000 genome. Nature. 507 (7492), 294-295 (2014).
Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Gen. Biol. 15 (3), 46 (2014).
Darling, A. E., et al. PhyloSift: phylogenetic analysis of genomes and metagenomes. PeerJ. 2 (12), 243 (2014).
Buchfink, B., Xie, C., Huson, D. H. Fast and sensitive protein alignment using DIAMOND. Nat. Meth. 12 (1), 59-60 (2015).
Moreno-Hagelsieb, G., Hudy-Yuffa, B. Estimating overannotation across prokaryotic genomes using BLAST+, UBLAST, LAST and BLAT. BMC Res Notes. 7 (1), 651 (2014).
Hauser, M., Steinegger, M., Söding, J. MMseqs software suite for fast and deep clustering and searching of large protein sequence sets. Bioinf. 32 (9), 1323-1330 (2016).
Ondov, B. D., Bergman, N. H., Phillippy, A. M. Interactive metagenomic visualization in a Web browser. BMC Bioinf. 12, (2011).
Kolde, R., Vilo, J. GOsummaries: an R Package for Visual Functional Annotation of Experimental Data. F1000Res. 4, 574 (2015).
Reddy, T. B. K., et al. The Genomes OnLine Database (GOLD) v.5: a metadata management system based on a four level (meta)genome project classification. Nuc. Aci. Res. 43 (1), 1099-1106 (2015).
Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinf. 10 (1), 421 (2009).
Chakravorty, S., Helb, D., Burday, M., Connell, N., Alland, D. A detailed analysis of 16S ribosomal RNA gene segments for the diagnosis of pathogenic bacteria. J. Micro. Met. 69 (2), 330-339 (2007).
Fadrosh, D. W., et al. An improved dual-indexing approach for multiplexed 16S rRNA gene sequencing on the Illumina MiSeq platform. Microbiome. 2 (1), 6 (2014).
Mikheyev, A. S., Tin, M. M. Y. A first look at the Oxford Nanopore MinION sequencer. Molecular Ecology Resources. 14 (6), 1097-1102 (2014).
Schadt, E. E., Turner, S., Kasarskis, A. A window into third generation sequencing. Hum. Mol. Genet. 20 (4), 853-853 (2011).
Shapiro, B., Hofreiter, M. A Paleogenomic Perspective on Evolution and Gene Function: New Insights from Ancient DNA. Science. 343 (6169), 1236573 (2014).
Der Sarkissian, C., et al. Ancient genomics. Phil. Trans. R. Soc. B. 370 (1660), (2015).
Patin, N. V., Kunin, V., Lidström, U., Ashby, M. N. Effects of OTU Clustering and PCR Artifacts on Microbial Diversity Estimates. Microb Ecol. 65 (3), 709-719 (2013).
McInroy, G. R., Raiber, E. -. A., Balasubramanian, S. Chemical biology of genomic DNA: minimizing PCR bias. Chem. Commun. 50 (81), 12047-12049 (2014).
Aller, P., Rould, M. A., Hogg, M., Wallace, S. S., Doublié, S. A structural rationale for stalling of a replicative DNA polymerase at the most common oxidative thymine lesion, thymine glycol. Proc. Natl. Acad. Sci. U.S.A. 104 (3), 814-818 (2007).
Ranjan, R., Rani, A., Metwally, A., McGee, H. S., Perkins, D. L. Analysis of the microbiome: Advantages of whole genome shotgun versus 16S amplicon sequencing. Biochem. Biophys. Res. Commun. 469 (4), 967-977 (2016).
Sims, D., Sudbery, I., Ilott, N. E., Heger, A., Ponting, C. P. Sequencing depth and coverage: key considerations in genomic analyses. Nat Rev Genet. 15 (2), 121-132 (2014).
Li, X., Rao, S., Wang, Y., Gong, B. Gene mining: a novel and powerful ensemble decision approach to hunting for disease genes using microarray expression profiling. Nuc. Aci. Res. 32 (9), 2685-2694 (2004).
Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinf. 30 (15), 2114-2120 (2014).
Magoc, T., Salzberg, S. L. FLASH: fast length adjustment of short reads to improve genome assemblies. Bioinf. 27 (21), 2957-2963 (2011).
Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. J. Comput. Biol. 19 (5), 455-477 (2012).
Nurk, S., Meleshko, D., Korobeynikov, A. . metaSPAdes: a new versatile de novo metagenomics assembler. , (2016).
Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215 (3), 403-410 (1990).
Tanaseichuk, O., Borneman, J., Jiang, T. Phylogeny-based classification of microbial communities. Bioinf. 30 (4), 449-456 (2014).
Bose, T., Haque, M. M., Reddy, C., Mande, S. S. COGNIZER: A Framework for Functional Annotation of Metagenomic Datasets. PLoS ONE. 10 (11), 0142102 (2015).
Sharma, A. K., Gupta, A., Kumar, S., Dhakan, D. B., Sharma, V. K. Woods: A fast and accurate functional annotator and classifier of genomic and metagenomic sequences. Genomics. 106 (1), 1-6 (2015).
Eikmeyer, F. G., et al. Metagenome analyses reveal the influence of the inoculant Lactobacillus buchneri CD034 on the microbial community involved in grass ensiling. J. Biotech. 167 (3), 334-343 (2013).
Driehuis, F., Elferink, S. J. W. H. O. The impact of the quality of silage on animal health and food safety: A review. Vet. Quart. 22 (4), 212-216 (2000).
Dunière, L., Sindou, J., Chaucheyras-Durand, F., Chevallier, I., Thévenot-Sergentet, D. Silage processing and strategies to prevent persistence of undesirable microorganisms. Anim Feed Sci Technol. 182 (1-4), 1-15 (2013).
Vissers, M. M. M., et al. Minimizing the Level of Butyric Acid Bacteria Spores in Farm Tank Milk. J. of Dairy Sci. 90 (7), 3278-3285 (2007).
Te Giffel, M. C., Wagendorp, A., Herrewegh, A. Bacterial spores in silage and raw milk. Antonie van. , (2002).
Wiedmann, M. ADSA Foundation Scholar Award-An Integrated Science-Based Approach to Dairy Food Safety: Listeria monocytogenes as a Model System. J. of Dairy Sci. 86 (6), 1865-1875 (2003).
Low, J. C., Donachie, W. A review of Listeria monocytogenes and listeriosis. Vet J. 153 (1), 9-29 (1997).
Schoder, D., Melzner, D., Schmalwieser, A. Important vectors for Listeria monocytogenes transmission at farm dairies manufacturing fresh sheep and goat cheese from raw. J.Food. , (2011).
Lindström, M., Myllykoski, J., Sivelä, S., Korkeala, H. Clostridium botulinumin Cattle and Dairy Products. Crit. Rev. Food Sci. Nutr. 50 (4), 281-304 (2010).
Bentley, D. R., et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 456 (7218), 53-59 (2008).
Andrews, S. . Babraham Bioinformatic- FastQC: A Quality Control tool for High Throughput Sequence Data. , (2015).
Keegan, K. P., Glass, E. M., Meyer, F. FMG-RAST, a Metagenomics Service for Analysis of Microbial Community Structure and Function. Methods Mol. Biol. 1399, 207-233 (2016).
Cantarel, B. L., et al. The Carbohydrate-Active EnZymes database (CAZy): an expert resource for Glycogenomics. Nuc. Aci. Res. 37, 233-238 (2009).
Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinf. 26 (19), 2460-2461 (2010).
Heberle, H., et al. InteractiVenn: a web-based tool for the analysis of sets through Venn diagrams. BMC Bioinf. 16 (1), 213 (2015).
Ni, J., Yan, Q., Yu, Y. How much metagenomic sequencing is enough to achieve a given goal. Sci. Rep. 3, 1968 (2013).
Truong, D. T., et al. MetaPhlAn2 for enhanced metagenomic taxonomic profiling. Nat. Meth. 12 (10), 902-903 (2015).
Oulas, A., et al. Metagenomics: tools and insights for analyzing next-generation sequencing data derived from biodiversity studies. Bioinform Biol Insights. 9 (9), 75-88 (2015).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Tennant, R. K., Sambles, C. M., Diffey, G. E., Moore, K. A., Love, J. Metagenomic Analysis of Silage. J. Vis. Exp. (119), e54936, doi:10.3791/54936 (2017).

Automatically Generated

Metagenomic Analyse van kuilvoer

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Automatically Generated

Metagenomic Analyse van kuilvoer

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below