Summary

Análise metagenômica de Silagem

Published: January 13, 2017
doi:

Summary

Metagenomics was used to investigate the microbiome of silage cattle feed. Analysis was performed by shotgun sequencing. This approach was used to characterize the composition of the microbial community within the cattle feed.

Abstract

Metagenomics is defined as the direct analysis of deoxyribonucleic acid (DNA) purified from environmental samples and enables taxonomic identification of the microbial communities present within them. Two main metagenomic approaches exist; sequencing the 16S rRNA gene coding region, which exhibits sufficient variation between taxa for identification, and shotgun sequencing, in which genomes of the organisms that are present in the sample are analyzed and ascribed to “operational taxonomic units”; species, genera or families depending on the extent of sequencing coverage.

In this study, shotgun sequencing was used to analyze the microbial community present in cattle silage and, coupled with a range of bioinformatics tools to quality check and filter the DNA sequence reads, perform taxonomic classification of the microbial populations present within the sampled silage, and achieve functional annotation of the sequences. These methods were employed to identify potentially harmful bacteria that existed within the silage, an indication of silage spoilage. If spoiled silage is not remediated, then upon ingestion it could be potentially fatal to the livestock.

Introduction

Metagenomics é a análise directa de ADN purificado a partir de comunidades biológicos encontrados nas amostras ambientais 1 e foi originalmente usado para detectar bactérias unculturable encontrados em sedimentos 2. Metagenomics tem sido amplamente utilizada para um número de aplicações, tais como a identificação da microbiota humano 3, classificando as populações microbianas dentro do oceano 4 e até mesmo para a análise das comunidades de bactérias que se desenvolvem em máquinas de café 5. A introdução de tecnologias de sequenciamento de próxima geração resultou em maior rendimento de sequenciação e de saída. Consequentemente, sequenciamento de DNA tornou-se mais económica 6 e a profundidade de sequenciação que pode ser executada aumentou consideravelmente, permitindo metagenômica para se tornar uma poderosa ferramenta analítica.

Melhorias "Front-end" no aspecto prático, molecular de sequenciamento metagenomic têm impulsionado o crescimento do noferramentas de bioinformática silico disponíveis para a classificação taxonómica 7-9, anotação funcional 10,11 e representação visual 12,13 de dados de sequência de DNA. O crescente número de disponíveis, sequenciado procariotas e eucariotas 14 genomas permite ainda mais a precisão na classificação de comunidades microbianas, que são invariavelmente realizadas contra um "back-end" de banco de dados de referência de genomas seqüenciados 15. Duas abordagens principais podem ser adotados para análise metagenômica.

O método mais convencional é a análise do gene 16S rRNA região de codificação do genoma bacteriano. O ARNr 16S é altamente conservada entre espécies procariotas mas apresenta nove regiões hiper-variáveis (V1 – V9), o que pode ser explorado na identificação de espécies 16. A introdução de mais sequenciação (≤ 300 pb final emparelhado) permitiu a análise de sequências de ADN que abrangem duas regiões hiper-variáveis, nomeadamenteo V3 – V4 região 17. Avanços em outras tecnologias de seqüenciamento, tais como Oxford Nanopore 18 e PacBIO 19, que permitem que todo o gene 16S rRNA a ser sequenciado de forma contígua.

Enquanto as bibliotecas baseadas 16S rDNA proporcionar uma abordagem orientada para a identificação de espécies e permitir a detecção de ADN de baixo número de cópias que ocorre naturalmente dentro de amostras purificadas, bibliotecas shotgun de sequenciação permitir a detecção de espécies que podem conter regiões de DNA que sejam ou não amplificável por 16S sequências de iniciadores de ARNr marcador utilizado, ou porque as diferenças entre a sequência do molde e a sequência de amplificação do iniciador são muito grandes 20,21. Além disso, apesar de as polimerases de ADN tem uma alta fidelidade da replicação de ADN, no entanto, os erros de base pode ocorrer durante a amplificação por PCR e estes erros incorporados pode resultar na classificação errada das espécies originárias 22. Desvios na amplificação por PCR do modelo SEQuencia também pode ocorrer; sequências de ADN com um elevado teor de GC pode ser representada sob a piscina em amplicão finais 23 e similarmente modificações de bases não naturais, tais como a timina glicol, pode interromper as polimerases de ADN causando falhas na amplificação de sequências de ADN 24. Em contraste, uma biblioteca de ADN shotgun de sequenciação é uma biblioteca de DNA que foi preparado usando todo o DNA purificado que foi extraída a partir de uma amostra e, subsequentemente, fragmentadas em comprimentos de cadeia de DNA mais curtos antes da preparação para a sequenciação. A classificação taxonómica das sequências de ADN gerados pela sequenciação espingarda é mais exacto quando comparado com o rRNA 16S amplicão sequenciação 25, embora o custo financeiro necessário para atingir uma profundidade de sequenciação de confiança é maior do que a do fragmento amplificado de sequenciação 26. O principal benefício de espingarda sequenciamento metagenômica é que as regiões sequenciadas dos vários genomas na amostra estão disponíveis para a prospecção de genes depois de terem sidofoi taxonomicamente classificada 27.

dados de seqüência metagenômica é analisado por uma gama cada vez maior de ferramentas de bioinformática. Essas ferramentas são capazes de executar uma ampla variedade de aplicações, por exemplo, análises de controle de qualidade dos dados de sequência de matérias-28, a sobreposição de final emparelhado lê 29, de novo montagem de sequência lê para contigs e scaffolds 30,31, classificação taxonômica e visualização da sequência lê e montados sequências 7,12,32,33 e a anotação funcional das sequências montados 34,35.

Silagem, produzido por agricultores em todo o mundo a partir de cereais fermentados, como o milho (Zea mays), é predominantemente utilizado como alimento para o gado. A silagem é tratada com a bactéria Lactobacillus sp. para ajudar a fermentação 36 mas até à data, não há conhecimento limitado das outras populações microbianas encontradas em silagem. o fermentadosprocesso n pode levar a microrganismos indesejáveis e potencialmente prejudiciais se tornando predominantes dentro da silagem 37. Além de bolores e leveduras, bactérias são particularmente adaptáveis ao ambiente anaeróbio em fermentação de silagem e são mais frequentemente associados com doenças no gado, em vez do que a degradação da silagem 38. Bactérias ácido butírico pode ser adicionado inadvertidamente a partir do solo permanece durante o enchimento do silo de silagem e é capaz de converter o ácido láctico, um produto de digestão anaeróbica, para o ácido butírico, aumentando, assim, o pH da silagem 39. Este aumento no pH pode levar a um surto de bactérias de deterioração que, normalmente, seria incapaz de sustentar o crescimento em condições de fermentação óptima silagem 38. Clostridium spp. , Listeria spp. e Bacillus spp. são particularmente preocupantes, especialmente em silagem para alimentação de gado leiteiro, como esporos de bactérias que sobreviveram desatrato ointestinal 40 podem entrar na cadeia alimentar, levar à deterioração dos alimentos e, em casos raros, à sanidade animal e mortes humanas 37,39,41-44. Além disso, embora seja difícil estimar o impacto econômico exata de tratamento veterinário e perda de gado causado pela deterioração de silagem, é provável que seja prejudicial para uma fazenda, se um surto estava a ocorrer.

Supõe-se que ao utilizar uma abordagem metagenômica podemos classificar as populações microbianas que estão presentes em amostras de silagem e, além disso, identificar as comunidades microbianas associadas com a deterioração da silagem que, por sua vez, potencialmente, ter um efeito negativo sobre os animais domésticos, permitindo medidas correctivas a ser tomadas antes da silagem é para ser usado como uma fonte de alimento.

Protocol

1. Site Location Coletar a amostra de silagem de um local apropriado, como uma fazenda. Aqui, a fazenda foi localizado em Ballydulea, Co. Cork, Irlanda (51 ° 51'58.4 "N 8 ° 16'48.7" W). 2. Extração de DNA NOTA: extracção de ADN foi realizada utilizando um kit comercial, seguindo as instruções do fabricante. Um controlo negativo, que não continha qualquer amostra, foi usado em todo o processo de preparação da biblioteca. Adicionar 100-400 mg de amostra a 978 ul de tampão de fosfato de sódio e 122 uL de tampão de lise do solo no interior dos tubos de lise fornecidos. Homogeneizar amostras colocando os tubos de lise para o homogeneizador durante 40 segundos a uma velocidade de 6,0 m / s. Os lisados ​​de centrifugar a 14000 xg durante 15 minutos e transferir o sobrenadante para um tubo de micro-centrífuga limpo contendo 250 uL de proteína Precipitado Solução (PPS). Misture a solução por inversão 10 vezes e centrifugara 14000 xg durante 5 min. Adicionar ao sobrenadante para uma matriz de ligação ao ADN ml num tubo de 15 ml de centrífuga limpo. Misture a solução por inversão do tubo constantemente durante 3 min. Deixar a mistura assentar durante 3 min, depois descartá-se 500 pL de sobrenadante. Misturar-se o sobrenadante restante. Transferir 600 ul da suspensão para um filtro de centrifugação e centrifugar a 14000 xg durante 1 min. Descartar o filtrado e repetir o processo com a suspensão remanescente. Adicionar 500 ul de tampão de lavagem para a matriz de ligação ao ADN no interior do filtro de rotação, mistura por pipetagem, depois centrifugar a 14000 xg durante 1 min. Descartar o filtrado e centrifugar novamente o filtro de centrifugação a 14000 xg durante 2 minutos para garantir que todo o tampão de lavagem é removida. Seca-se o filtro de rotação a 23 ° C durante 5 min. Pré-quente (70 ° C) a água livre de DNase (DES) e re-suspender a matriz de ligação ao DNA em 100 mL de DES dentro do filtro de rotação. Transferir o filtro de rotação para um ambiente limpo 1,5 mL micro-centrífuga tuser e centrifugar a 14000 xg durante 1 min para eluir o DNA. Armazenar o ADN purificado a -20 ° C até análise posterior é executada. 3. Purificação de DNA Beads purificação usando DNA NOTA: Antes da preparação da biblioteca metagenômico o DNA extraído foi purificado utilizando esferas de purificação para garantir uma amostra de ADN puro foi obtido. Incubar os grânulos a 23 ° C durante 30 min antes da utilização. Adicionar 2 volumes de grânulos para a amostra de ADN e incubar a solução a 23 C durante 5 min. Coloque as amostras em um íman separação durante 5 min e, em seguida, desprezar o sobrenadante. Lavam-se as esferas duas vezes com 200 mL de etanol fresco a 80% (EtOH). Ar secar os grânulos durante 10 min. Retirar as amostras de separação do magneto e adicionar 50 ul de tampão de eluição (EB), misturar por pipetagem. Incubar a suspensão a 23 ° C durante 5 min, após o que coloca as amostras de volta para o íman de separação durante 3 min. Transfer o sobrenadante, que contém o DNA, para um tubo limpo. Descarte as contas. Quantificar o DNA purificado conforme a secção quatro. 4. Quantificação do ADN purificado NOTA: O ADN purificado foi quantificado usando um fluorómetro e kit de ensaio de cadeia dupla (dsDNA) de alta sensibilidade (HS) seguindo as instruções do fabricante. Preparar uma solução de trabalho usando 199: 1 de tampão de reagente. Adicionam-se 10 ul de cada padrão de ADN a 190 uL de solução de trabalho. Adiciona-se 10 uL de ADN purificado a 190 uL de solução de trabalho. O volume final deverá ser de 200 uL. Incubar as amostras normais e de ADN a 23 C durante 2 min. Analisar os padrões antes de as amostras de DNA no fluorímetro usando as instruções na tela. 5. Shotgun Sequencing Biblioteca Preparação NOTA: A biblioteca shotgun de sequenciação foi preparado usando umkit de preparação biblioteca comercial utilizando as instruções do fabricante. Diluir as amostras de DNA de 0,2 ng / mL usando EB. Qualquer amostra que já está abaixo desta concentração, isto é, o controlo negativo, é deixado na sua concentração actual. Dissolvem-se 5 uL do ADN purificado com 10 ul de tampão e 5 ul mistura de enzima. Incubar as amostras a 55 C durante 5 min. Adicionar 5 uL de tampão de neutralização e incubar a solução a 23 C durante 5 min. Adicionar 5 uL de cada um dos índices de sequenciação específicos de amostra e 15 ul de PCR Master Mix. Num termociclador, incubar as amostras a 72 ° C durante 3 min, 95 C durante 30 s, antes de 12 ciclos de 95 C durante 10 s, 55 C durante 30 s e 72 C durante 30 s. Incubar as amostras a 72 finalmente C durante 5 min. Purifica-se o ADN preparado utilizando o talão de purificação como antes, mas com uma eluição final de 30 mL de EB. 6. Library Quantidade e Verificação da Qualidade NOTA: A quantidade e qualidade das bibliotecas preparadas foram avaliadas utilizando um kit comercial e instrumentação. Incubar os componentes do kit a 23 ° C durante 30 min antes da utilização. Adicionar 2 mL de ADN de 2 mL de tampão e vortex durante 1 min a 2000 rpm. Girar a amostra para assegurar que está na parte inferior do tubo. Insira os tubos de amostra, fita de análise e dicas para o instrumento, e realizar análises conforme indicado pelo software. Sequencing 7. DNA Transferir as amostras bibliotecas de sequenciamento de DNA preparados e quantificáveis para um serviço de sequenciação e sequência usando 300 pb final emparelhado sequenciamento 45. 8. Análise de Dados de Sequência bruto NOTA: Os comandos para cada programa usando um sistema operacional Linux são mostrados abaixo do salto de protocolo. A tubagem utilizada para sanálise de dados equence é mostrado na Figura 1. Os programas devem ser instalados pelo usuário antes da análise. Este processo deve ser realizado separadamente para cada amostra. Analisar e visualizar dados de sequência de DNA usando FastQC 46, digitando na linha de comando / path-to-file / fastqc, seguido pela frente e verso, cru lê raw_read2.fastq raw_read1.fastq. Especifique uma pasta de saída, digitando output_fastqc -o eo formato de arquivo dos arquivos de leitura em bruto por fastq -f. Ver o arquivo de saída (Figura 2). path-to-file / fastqc raw_read1.fastq raw_read2.fastq -o output_directory -f fastq. 9. Controle de Qualidade aparamento e Dados Sequence Filtering Execute o programa de corte, Trimmomatic 28 digitando na linha de comando java -jar / path-to-file / trimmomatic-0.35.jar. Especificar os arquivos estão emparelhados arquivos finais, digitando "PE". Estado que 16 pr Centralunidades ocessing (CPUs) deve ser utilizado pelo programa escrevendo -threads 16. Liste os dois arquivos para verificar QC, digitando os nomes da frente cru e reverter lê. O prefixo dos arquivos de saída é determinado digitando silagem -baseout. Definir as opções para o programa digitando ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 principais: 3 TRAILING: 3 SLIDINGWINDOW: 4: 20 CROP: 200 HEADCROP: 15 minLen: 36. Uma vez completo, analisar as sequências aparadas usando FastQC como antes e comparar a saída para os dados de sequência de matérias para garantir o corte foi realizado com sucesso. NOTA: A ferramenta de software, Trimmomatic, aparado lê mais, removendo líder baixa qualidade ou bases N (abaixo qualidade 3), a remoção de fuga de baixa qualidade ou bases N (abaixo qualidade 3) e analisando cada lido com um 4-base da janela ampla deslizante. Os parâmetros foram ajustados para o corte quando a qualidade média por base de cair abaixo de 20 e depois para soltar qualquer lê abaixo de 36 bases de comprimento. Finalmente, 15 bases foram cortadas from a cabeça de cada ler e lê foram cortadas para manter 200 bases a partir do início da leitura. Esta etapa final foi realizada para superar alguns problemas de qualidade quando sequenciar longo (> 200 pb) lê. Estes podem ser ajustadas para amostras específicas 28. java -jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq -baseout silagem ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 principais: 3 TRAILING: 3 SLIDINGWINDOW: 4 : 20 CROP: 200 HEADCROP: 15 minLen: 36 Assembléia metagenoma 10. Mesclar a não pareado, aparado lê digitando cat seguido pelo não emparelhado lê; silage_read1_unpaired.fastq silage_read2_unpaired.fastq. Escrever os arquivos para um novo arquivo digitando> silage_merged_unpaired.fastq cat silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq Para de novo montar o DNA sequenciado, usar Espadas (St. Petersburg genoma assembler) 30 digitando / path-to-file / spades.py. Especificar que CPUs 16 estão a ser utilizados, digitando -t 16 e que o parâmetro metagenômico deve aplicada escrevendo –meta. Identificar os aparado frente lê usando -1 silage_read1_paired.fastq eo reverso lê por -2 silage_read2_paired.fastq. A não pareado mesclada lê são especificados por silage_merged_unpaired.fastq -s. Definir a pasta de saída, digitando -o silage_spades. path-to-file / spades.py -t 16 –meta -1 silage_read1_paired.fastq -2 silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades 11.-end Emparelhado Leia Sobreposição Mesclar pares de sequência de DNA lê usando FLASH (Ajuste Rápido comprimento de curto Lê) 29 digitando na linha de comando / path-to-file / flash. Especificar que CPUs 16 deve ser usado usando -t 16 e o ​​prefixo saída digitando -o silagem. Identificar aparado lê digitando silage_trimmed_R1.fastq silage_trimmed_R2.fastq caminho para arquivo / flash -t 16 -o brilhou silage_read2_paired.fastq silage_read1_paired.fastq 12. taxonômica Classificação Tipo / path-to-file / kraken e especifique o banco de dados digitando –db / caminho-para-arquivo / standard. Definir que 16 CPUs deve ser usado digitando –threads 16 e identificar uma pasta de saída usando –output FLASHed_silage_extendedFrags_kraken.txt. Digite o nome do arquivo de entrada; FLASHed_silage.extendedFrags.fastq path-to-file / padrão –db kraken –thread 16 –output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq NOTA: A classificação dos andaimes de sequência de ADN montados usando Kraken 7 foi completado contra o mais recente banco de dados, padrão Kraken que continha todas as sequências do genoma Prokaryote disponíveis. colunas de transferência de 2 e 3 do arquivo de saída e para um novo arquivo digitando corte -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int <li> Abra o arquivo de saída no navegador web. cortar -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int Importar o novo arquivo para Krona 12 digitando ktImportTaxonomy. Especifique o arquivo de entrada, digitando FLASHed_silage_extendedFrags_kraken.int. Identificar o arquivo de saída, digitando -o FLASHed_silage_extendedFrags_kraken.out.html. path-to-file / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html 13. anotação funcional Ir para 47 site da MG-RAST, http://metagenomics.anl.gov/. Registre-se como um novo usuário, se necessário. Após o login, clique no botão "Upload". Faça o upload dos andaimes montados a partir do Passo 10. Uma vez que os arquivos foram enviados, clique em "Enviar" e siga as instruções e aguardar a conclusão da análise. Após a análise for concluída, consulte o link enviado via email da MG-RAST, ou, em alternativa, clique em "Progress". Há uma lista de trabalhos concluídos. Clique na ID de trabalho relevante e, em seguida, o link para a "página de download". Na página de download, sob o título "Clustering Protein 90%", clique no botão de proteína para baixar o arquivo de proteína prevista, 550.cluster.aa90.faa. Para classificar as proteínas como supostamente pertencentes a uma determinada classe de enzimas cazy, comparar as proteínas transferidas para o banco de dados cazy 48. Baixar as enzimas Carboidratos-ativos banco de dados (cazy) de arquivos são: AA.zip, CE.zip, GH.zip, GT.zip e PL.zip. Esses arquivos representam as seguintes classes de enzimas, respectivamente: Actividades Auxiliares (AA), hidrato de carbono Esterases (CE), glicosídeo hidrolases (GH), glicosil transferases (GT) e polissacarídeo Liases (PL). Descompacte os arquivos de bancos de dados e anotar as proteínas determinando a similaridade de proteína para as proteínas de banco de dados cazy usando o algor USEARCH UBLASTithm 49. Para usar um loop bash (for i in * .txt) para percorrer a 5 de banco de dados tipo de arquivos .txt "for i in * .txt; fazer". Execute USEARCH digitando / path para arquivo / usearch8 com o -ublast parâmetro, a fim de usar o algoritmo ublast. Em seguida, digite o nome do arquivo de sequência de proteína baixado MG-RAST ", mgmXXXXXX.3.550.cluster.aa90.faa". Para indicar o arquivo de banco de dados para ser utilizado tipo "-db $ i" e especificar o limite de E-valor em 1e -5, digite "-evalue 1e-5". Para terminar a pesquisa após a descoberta de uma sequência alvo e, por conseguinte, a classificação da referida sequência de proteína como pertencendo à classe das enzimas-alvo, por exemplo, GH, tipo "-masaccepts 1". Para definir que 16 CPUs deve ser utilizado tipo "-threads 16" e especificar o formato do arquivo de saída como tipo de texto "-blast6out" separados por ATAB. Para identificar o tipo de arquivo "$ i.ublast". Para terminar o loop festança, tipo "; feito" for i in * .txt; fazer / caminho-para-arquivo / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ i -evalue 1e-5 -maxaccepts 1 -threads 16 -blast6out $ i.ublast; feito 14. A visualização cazy Anotação Para visualizar a saída a partir da anotação cazy como um diagrama de Venn, gerar listas ID proteína para cada classe de enzimas utilizando uma ansa festa. Tipo "for i in * .ublast; fazer". Para transferir coluna 1 do arquivo de saída e para um novo arquivo, digite "cat $ i | cut -f 1> $ i.list". Terminar o loop e tipo "; done". Abra os arquivos .list em um editor de texto. Ir para o site, selecione o número de conjuntos como 5 e colar o conteúdo de cada arquivo de lista em uma caixa separada. Baixe o diagrama resultante como um arquivo .SVG. for i in * .ublast; fazer cat $ i | cortar -f 1> $ i.list; feito

Representative Results

Antes do processamento de bioinformática, sequência cru lê foram aparadas e adaptadores foram removidos usando software Trimmomatic 28. Depois do passo de limpeza e filtração, o número de leituras foi reduzida para 50% da sequência lê-se (Tabela 1). A pontuação média de base Phred era> 30 depois de controle de qualidade (Figura 2). Pares de sequências de DNA que tinham regiões sobrepostas foram fundidas usando o software Flash 29 para gerar única já não lê, não sobreposta lê foram mantidos em um arquivo separado. 45.47% lê (105.343), combinada com sucesso. Após a sobreposição de leituras usando FLASH de leituras, as resultantes fragmentos estendidos foram submetidos a classificação taxonômica bacteriana usando software Kraken 7 e foram posteriormente visualizados com software Krona (Figura 3). <p class="jove_content" fo:keep-together.within-page = "1"> A maioria das espécies de bactérias presentes na metagenome silagem são encontrados dentro de 4 filos procariótica: Firmicutes (34%), Actinobactérias (28%), Proteobacteria (27%) e Bacteroides (7%) . A distribuição de classes presentes dentro destes filos pode ser visto na Figura 4. As espécies mais abundantes no metagenome foram Lactobacillus spp. (24%; Firmicutes), Corynebacterium spp. (8%; Actinobactérias), Propionibacterium spp. (3%; Actinobactérias) e Prevotella spp. (3%; Bacteroides). Espécies importantes para a saúde animal e implicados na doença também foram observados; Clostridium spp. (1%) de Bacillus spp. (0,6%), Listeria spp. (0,2%) foram previstos para estar presente na amostra de ensilagem. anotação funcional foi realizado em montado lê. O metagenome foi montado utilizando o montador pás 30 usando o aparadas e filtradaemparelhado-end e não emparelhado lê gerando 92,284 andaimes. A fim de identificar as celulases, as proteínas foram preditos usando MG-RAST e anotado usando as enzimas de carboidratos-ativos banco de dados (cazy). Dos 97,562 proteínas preditas, 6357 foram anotados como uma enzima de hidrato de carbono-activo putativo em uma das cinco classes de enzimas que compõem a base de dados cazy (Figura 5). Os resultados foram visualizados como um diagrama de Venn usando software InteractiVenn 50 que mostra a distribuição de notas de proteínas, incluindo aqueles que contêm mais do que uma classe de enzimas cazy anotação. Destes, 3861 foram previstos como tendo actividade beta-glicosidases e vai ainda ser caracterizado no laboratório para confirmar a função. Figura 1: Bioinformatic Metagenomics Pipeline para Análise de Silagem. Duas abordagens principais foramusado para investigar o microbioma da silagem, classificação taxonômica e anotação funcional. Por favor clique aqui para ver uma versão maior desta figura. Figura 2: Qualidade Sequence Per-base antes e após o corte e remoção do adaptador. A trama de qualidade per-base de sequência de FASTQC mostra a pontuação média Phred em todo o comprimento da sequência lê controle pré e pós-qualidade. Por favor clique aqui para ver uma versão maior desta figura. Figura 3: taxonômica Classificação do bacteriana Microbiome de Silagem Sólido. Classificação da sequência aparado e sobreposição lê a partir FLASH foi realizada utilizando Kraken 7 e posteriormente visualizados com coroa. Por favor clique aqui para ver uma versão maior desta figura. Figura 4: Classe taxonômica Distribuição do 4 Filos mais abundante no bacteriana Microbiome de Silagem Sólido. A percentagem de cada classe de bactérias dentro das quatro filos mais abundante. Firmicutes: Clostridia (vermelho) e bacilos (azul escuro); Proteobactérias: delta / epsilon (rosa), alfa (azul-claro), gama (laranja) e beta (turquesa); Bacteroidetes: Flavobacteriia (azul escuro) e Bacteroidia(verde pálido); Actinobacteria: Coriobacteriia (roxo escuro) e outros actinobactérias (verde escuro). Por favor clique aqui para ver uma versão maior desta figura. Figura 5: cazy anotação do Proteome prevista no sólido Silagem Microbiome. diagrama de Venn mostra a distribuição das cinco classes de enzimas de anotações cazy no proteoma previsto de microbioma silagem sólido. Por favor clique aqui para ver uma versão maior desta figura. # Raw lê # Filtrada lê (emparelhado) </td> # Filtrada lê # Brilhou lê (Emparelhado) (Não pareado) 2.374.949 x2 231.679 x2 1.892.534 105343 Tabela 1: Resumo da tabela de Sequenciamento Lê.

Discussion

Embora uma análise in silico pode dar uma excelente visão para as comunidades microbianas que estão presentes nas amostras ambientais, é crítico que as classificações taxonómicos demonstrou ser realizada em associação com os controlos relevantes e que uma profundidade adequada de sequenciação foi obtida para capturar a totalidade população presente 51.

Com qualquer análise computacional, existem muitos caminhos para atingir um objetivo similar. Os métodos que usamos neste estudo são exemplos de métodos adequados e direta, que foram trazidos em conjunto para alcançar uma gama de análises sobre o microbioma silagem. A variedade e um número cada vez maior de ferramentas e técnicas de bioinformática estão disponíveis para analisar os dados metagenomic, por exemplo Phylosift 8 e MetaPhlAn2 52, e estes devem ser avaliados antes da investigação por sua relevância para a amostra ea análise required 53. métodos de análise metagenomic são limitados pelos bancos de dados para disponíveis para a classificação, a profundidade de sequenciação e a qualidade do sequenciamento.

O processamento de bioinformática demonstrado aqui foi realizada num aparelho mecânico local, um elevado; no entanto sistemas baseados em nuvem também estão disponíveis. Estes serviços baseados em nuvem permitem o aluguer do poder computacional necessário sem ter o investimento de alto custo de uma estação de trabalho local poderosa adequado. Uma aplicação potencial deste método seria para avaliar a silagem antes da sua utilização na agricultura para garantir que não há bactérias potencialmente nocivas estão presentes, portanto, impedindo-os de entrar na cadeia alimentar.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Authors would like to thank Andrew Bird for the silage samples and Audrey Farbos of the Exeter Sequencing Service for her assistance in preparing DNA sequencing libraries. Exeter Sequencing Service and Computational core facilities at the University of Exeter. Medical Research Council Clinical Infrastructure award (MR/M008924/1). Wellcome Trust Institutional Strategic Support Fund (WT097835MF), Wellcome Trust Multi User Equipment Award (WT101650MA) and BBSRC LOLA award (BB/K003240/1).

Materials

FastDNA SPIN Kit for Soil MP Bio 116560200 DNA Extraction
DNA FastPrep MP Bio 116004500 DNA Extraction
Agencourt AMPure XP beads Beckman Coulter A63880 DNA Purification
Elution Buffer Qiagen 19806 DNA Purification
Qubit Fluorometer Thermo Fisher Q33216 DNA Quantification
Qubit dsDNA HS Assay Kit Thermo Fisher Q32854 DNA Quantification
Nextera XT DNA Library Prep Kit Illumina FC-131-1024 Library Preparation
Nextera XT Index Kit Illumina FC-131-1001 Library Preparation
TapeStation 2200 Agilent G2964AA DNA Quantification
HS D100 ScreenTape Agilent 5067-5584 DNA Quantification
HS D100 ScreenTape Reagents Agilent 5067-5585 DNA Quantification
TapeStation Tips Agilent 5067-5153 DNA Quantification
TapeStation Tubes Agilent 401428 and 401425 DNA Quantification
HiSeq 2500 Illumina DNA Sequencing – provided by a sequencing service
High Power Analysis Workstation Various Local or cloud based, user preferred system

References

  1. Riesenfeld, C. S., Schloss, P. D., Handelsman, J. Metagenomics: genomic analysis of microbial communities. Annu. Rev. Genet. 38 (1), 525-552 (2004).
  2. Amann, R. I., Ludwig, W., Schleifer, K. H. Phylogenetic identification and in situ detection of individual microbial cells without cultivation. Microbiol. Rev. 59 (1), 143-169 (1995).
  3. Human Microbiome Project Consortium. Structure, function and diversity of the healthy human microbiome. Nature. 486 (7402), 207-214 (2012).
  4. Venter, J. C., et al. Environmental genome shotgun sequencing of the Sargasso Sea. Science. 304 (5667), 66-74 (2004).
  5. Vilanova, C., Iglesias, A., Porcar, M. The coffee-machine bacteriome: biodiversity and colonisation of the wasted coffee tray leach. Sci. Rep. 5, 17163 (2015).
  6. Hayden, E. C. Technology: The $1,000 genome. Nature. 507 (7492), 294-295 (2014).
  7. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Gen. Biol. 15 (3), 46 (2014).
  8. Darling, A. E., et al. PhyloSift: phylogenetic analysis of genomes and metagenomes. PeerJ. 2 (12), 243 (2014).
  9. Buchfink, B., Xie, C., Huson, D. H. Fast and sensitive protein alignment using DIAMOND. Nat. Meth. 12 (1), 59-60 (2015).
  10. Moreno-Hagelsieb, G., Hudy-Yuffa, B. Estimating overannotation across prokaryotic genomes using BLAST+, UBLAST, LAST and BLAT. BMC Res Notes. 7 (1), 651 (2014).
  11. Hauser, M., Steinegger, M., Söding, J. MMseqs software suite for fast and deep clustering and searching of large protein sequence sets. Bioinf. 32 (9), 1323-1330 (2016).
  12. Ondov, B. D., Bergman, N. H., Phillippy, A. M. Interactive metagenomic visualization in a Web browser. BMC Bioinf. 12, (2011).
  13. Kolde, R., Vilo, J. GOsummaries: an R Package for Visual Functional Annotation of Experimental Data. F1000Res. 4, 574 (2015).
  14. Reddy, T. B. K., et al. The Genomes OnLine Database (GOLD) v.5: a metadata management system based on a four level (meta)genome project classification. Nuc. Aci. Res. 43 (1), 1099-1106 (2015).
  15. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinf. 10 (1), 421 (2009).
  16. Chakravorty, S., Helb, D., Burday, M., Connell, N., Alland, D. A detailed analysis of 16S ribosomal RNA gene segments for the diagnosis of pathogenic bacteria. J. Micro. Met. 69 (2), 330-339 (2007).
  17. Fadrosh, D. W., et al. An improved dual-indexing approach for multiplexed 16S rRNA gene sequencing on the Illumina MiSeq platform. Microbiome. 2 (1), 6 (2014).
  18. Mikheyev, A. S., Tin, M. M. Y. A first look at the Oxford Nanopore MinION sequencer. Molecular Ecology Resources. 14 (6), 1097-1102 (2014).
  19. Schadt, E. E., Turner, S., Kasarskis, A. A window into third generation sequencing. Hum. Mol. Genet. 20 (4), 853-853 (2011).
  20. Shapiro, B., Hofreiter, M. A Paleogenomic Perspective on Evolution and Gene Function: New Insights from Ancient DNA. Science. 343 (6169), 1236573 (2014).
  21. Der Sarkissian, C., et al. Ancient genomics. Phil. Trans. R. Soc. B. 370 (1660), (2015).
  22. Patin, N. V., Kunin, V., Lidström, U., Ashby, M. N. Effects of OTU Clustering and PCR Artifacts on Microbial Diversity Estimates. Microb Ecol. 65 (3), 709-719 (2013).
  23. McInroy, G. R., Raiber, E. -. A., Balasubramanian, S. Chemical biology of genomic DNA: minimizing PCR bias. Chem. Commun. 50 (81), 12047-12049 (2014).
  24. Aller, P., Rould, M. A., Hogg, M., Wallace, S. S., Doublié, S. A structural rationale for stalling of a replicative DNA polymerase at the most common oxidative thymine lesion, thymine glycol. Proc. Natl. Acad. Sci. U.S.A. 104 (3), 814-818 (2007).
  25. Ranjan, R., Rani, A., Metwally, A., McGee, H. S., Perkins, D. L. Analysis of the microbiome: Advantages of whole genome shotgun versus 16S amplicon sequencing. Biochem. Biophys. Res. Commun. 469 (4), 967-977 (2016).
  26. Sims, D., Sudbery, I., Ilott, N. E., Heger, A., Ponting, C. P. Sequencing depth and coverage: key considerations in genomic analyses. Nat Rev Genet. 15 (2), 121-132 (2014).
  27. Li, X., Rao, S., Wang, Y., Gong, B. Gene mining: a novel and powerful ensemble decision approach to hunting for disease genes using microarray expression profiling. Nuc. Aci. Res. 32 (9), 2685-2694 (2004).
  28. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinf. 30 (15), 2114-2120 (2014).
  29. Magoc, T., Salzberg, S. L. FLASH: fast length adjustment of short reads to improve genome assemblies. Bioinf. 27 (21), 2957-2963 (2011).
  30. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. J. Comput. Biol. 19 (5), 455-477 (2012).
  31. Nurk, S., Meleshko, D., Korobeynikov, A. . metaSPAdes: a new versatile de novo metagenomics assembler. , (2016).
  32. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215 (3), 403-410 (1990).
  33. Tanaseichuk, O., Borneman, J., Jiang, T. Phylogeny-based classification of microbial communities. Bioinf. 30 (4), 449-456 (2014).
  34. Bose, T., Haque, M. M., Reddy, C., Mande, S. S. COGNIZER: A Framework for Functional Annotation of Metagenomic Datasets. PLoS ONE. 10 (11), 0142102 (2015).
  35. Sharma, A. K., Gupta, A., Kumar, S., Dhakan, D. B., Sharma, V. K. Woods: A fast and accurate functional annotator and classifier of genomic and metagenomic sequences. Genomics. 106 (1), 1-6 (2015).
  36. Eikmeyer, F. G., et al. Metagenome analyses reveal the influence of the inoculant Lactobacillus buchneri CD034 on the microbial community involved in grass ensiling. J. Biotech. 167 (3), 334-343 (2013).
  37. Driehuis, F., Elferink, S. J. W. H. O. The impact of the quality of silage on animal health and food safety: A review. Vet. Quart. 22 (4), 212-216 (2000).
  38. Dunière, L., Sindou, J., Chaucheyras-Durand, F., Chevallier, I., Thévenot-Sergentet, D. Silage processing and strategies to prevent persistence of undesirable microorganisms. Anim Feed Sci Technol. 182 (1-4), 1-15 (2013).
  39. Vissers, M. M. M., et al. Minimizing the Level of Butyric Acid Bacteria Spores in Farm Tank Milk. J. of Dairy Sci. 90 (7), 3278-3285 (2007).
  40. Te Giffel, M. C., Wagendorp, A., Herrewegh, A. Bacterial spores in silage and raw milk. Antonie van. , (2002).
  41. Wiedmann, M. ADSA Foundation Scholar Award-An Integrated Science-Based Approach to Dairy Food Safety: Listeria monocytogenes as a Model System. J. of Dairy Sci. 86 (6), 1865-1875 (2003).
  42. Low, J. C., Donachie, W. A review of Listeria monocytogenes and listeriosis. Vet J. 153 (1), 9-29 (1997).
  43. Schoder, D., Melzner, D., Schmalwieser, A. Important vectors for Listeria monocytogenes transmission at farm dairies manufacturing fresh sheep and goat cheese from raw. J.Food. , (2011).
  44. Lindström, M., Myllykoski, J., Sivelä, S., Korkeala, H. Clostridium botulinumin Cattle and Dairy Products. Crit. Rev. Food Sci. Nutr. 50 (4), 281-304 (2010).
  45. Bentley, D. R., et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 456 (7218), 53-59 (2008).
  46. Andrews, S. . Babraham Bioinformatic- FastQC: A Quality Control tool for High Throughput Sequence Data. , (2015).
  47. Keegan, K. P., Glass, E. M., Meyer, F. FMG-RAST, a Metagenomics Service for Analysis of Microbial Community Structure and Function. Methods Mol. Biol. 1399, 207-233 (2016).
  48. Cantarel, B. L., et al. The Carbohydrate-Active EnZymes database (CAZy): an expert resource for Glycogenomics. Nuc. Aci. Res. 37, 233-238 (2009).
  49. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinf. 26 (19), 2460-2461 (2010).
  50. Heberle, H., et al. InteractiVenn: a web-based tool for the analysis of sets through Venn diagrams. BMC Bioinf. 16 (1), 213 (2015).
  51. Ni, J., Yan, Q., Yu, Y. How much metagenomic sequencing is enough to achieve a given goal. Sci. Rep. 3, 1968 (2013).
  52. Truong, D. T., et al. MetaPhlAn2 for enhanced metagenomic taxonomic profiling. Nat. Meth. 12 (10), 902-903 (2015).
  53. Oulas, A., et al. Metagenomics: tools and insights for analyzing next-generation sequencing data derived from biodiversity studies. Bioinform Biol Insights. 9 (9), 75-88 (2015).

Play Video

Cite This Article
Tennant, R. K., Sambles, C. M., Diffey, G. E., Moore, K. A., Love, J. Metagenomic Analysis of Silage. J. Vis. Exp. (119), e54936, doi:10.3791/54936 (2017).

View Video