Summary

Метагеномной Анализ силос

Published: January 13, 2017
doi:

Summary

Metagenomics was used to investigate the microbiome of silage cattle feed. Analysis was performed by shotgun sequencing. This approach was used to characterize the composition of the microbial community within the cattle feed.

Abstract

Metagenomics is defined as the direct analysis of deoxyribonucleic acid (DNA) purified from environmental samples and enables taxonomic identification of the microbial communities present within them. Two main metagenomic approaches exist; sequencing the 16S rRNA gene coding region, which exhibits sufficient variation between taxa for identification, and shotgun sequencing, in which genomes of the organisms that are present in the sample are analyzed and ascribed to “operational taxonomic units”; species, genera or families depending on the extent of sequencing coverage.

In this study, shotgun sequencing was used to analyze the microbial community present in cattle silage and, coupled with a range of bioinformatics tools to quality check and filter the DNA sequence reads, perform taxonomic classification of the microbial populations present within the sampled silage, and achieve functional annotation of the sequences. These methods were employed to identify potentially harmful bacteria that existed within the silage, an indication of silage spoilage. If spoiled silage is not remediated, then upon ingestion it could be potentially fatal to the livestock.

Introduction

Метагеномика является прямой анализ ДНК очищают от биологических сообществ , обнаруженных в пробах окружающей среды 1 и первоначально был использован для обнаружения unculturable бактерий , найденных в отложениях 2. Метагеномика широко используется для ряда применений, таких как идентификация человеческого микробиомом 3, классифицируя микробных популяций в океане 4 и даже для анализа бактериальных сообществ , которые развиваются на кофеварок 5. Внедрение технологий секвенирования следующего поколения привело к увеличению пропускной способности и выхода секвенирования. Следовательно, секвенирование ДНК становится более экономичным 6 и глубина последовательности , которые могут быть выполнены значительно увеличилось, что позволяет метагеномика стать мощным, аналитическим инструментом.

"Front-End" усовершенствований в практическом, молекулярном аспекте метагеномной секвенирования наехали рост ининструменты силикомарганца биоинформатики , доступные для таксономической классификации 7-9, функциональная аннотаций 10,11 и визуальное представление 12,13 данных последовательности ДНК. Увеличение числа доступных, секвенировали прокариотических и эукариотических геномов 14 позволяет дополнительную точность классификации микробных сообществ, которые неизменно выполняются против "фоновым" справочную базу данных секвенсированными геномов 15. Два основных подхода могут быть приняты для метагеномной анализа.

Более обычный метод анализа гена 16S рРНК кодирующей области бактериального генома. 16S рРНК высоко консервативен между прокариотических видов , но имеет девять гиперабстрактных вариабельных участков (V1 – В9) , которые могут быть использованы для идентификации видов 16. Введение более секвенирования (≤ 300 пар оснований в паре конец), разрешенных для анализа последовательностей ДНК, охватывающих два гипер-вариабельных областей, в частности,устройство V3 – V4 область 17. Достижения в области других технологий секвенирования, таких как Оксфорд нанопор 18 и PacBIO 19, позволяют сделать весь ген 16S рРНК быть секвенировали смежно.

В то время как библиотеки на основе 16S рДНК обеспечивают целевой подход к идентификации видов и позволяют обнаруживать количество ДНК низкой копии, которые естественным образом происходит в очищенных образцов, метод дробовика библиотеки позволяют для обнаружения видов, которые могут содержать участки ДНК, которые либо не амплифицируемая по 16S последовательности праймеров маркеров рРНК использовали, или из – за различия между матричной последовательности и последовательности усилительной праймера слишком велики 20,21. Кроме того, несмотря на то ДНК – полимераз , имеют высокую точность репликации ДНК, базовые ошибки могут , тем не менее произойти во время ПЦР – амплификации и эти объединенные ошибки могут привести к неправильной классификации происходящий видов 22. Погрешности в ПЦР-амплификации матричной SEQuences также может произойти; Последовательности ДНК с высоким содержанием GC может быть недостаточно представлены в окончательном ампликона бассейне 23 и аналогично неестественные базовые модификации, такие как тимин гликоль, может остановить ДНК – полимеразы , вызывая сбои в амплификации ДНК последовательностей 24. В отличие от этого, ДНК-библиотеки дробовика секвенирование ДНК-библиотеки, которая была подготовлена ​​с использованием всех очищенной ДНК, которая была извлечена из образца, а затем разбитой на длинах короче цепь ДНК перед подготовкой к последовательности. Таксономической классификации ДНК – последовательностей , порожденных дробовика секвенирования является более точным по сравнению с 16S рРНК ампликонов секвенирования 25, хотя финансовые затраты , необходимые для достижения надежной глубины секвенирования больше , чем у ампликона секвенирования 26. Основное преимущество дробовика секвенирования метагеномика является то, что секвенировали области различных геномов в образце доступны для генной разведки, когда они былибыл таксономически классифицированы 27.

Метагеномной данные последовательности анализируют с помощью постоянно расширяющегося диапазона биоинформатики инструментов. Эти инструменты способны выполнять широкий спектр приложений, например, анализ качества контроль исходных данных последовательности 28, перекрывая парного конца читает 29, De Novo сборка последовательности читает конти- и подмостей 30,31, таксономической классификации и визуализации последовательности операций чтения и собраны последовательности 7,12,32,33 и функциональную аннотацию собранных последовательностей 34,35.

Силос, производится фермерами по всему миру из ферментированных злаков , таких как кукуруза (Zea Мейс – ), является преимущественно используется в качестве корма для крупного рогатого скота. Силос обрабатывают бактерии Lactobacillus зр. чтобы помочь брожение 36 , но на сегодняшний день, существует ограниченное знание других микробных популяций , найденных в силосе. fermentatioп процесс может привести к нежелательным и потенциально вредных микроорганизмов становятся распространенными в силос 37. Кроме дрожжей и плесневых грибов, бактерий , особенно приспособлены к анаэробной среде в бродящем силос и чаще связаны с болезнями в животноводстве , а не деградации силос 38. Могут быть добавлены непреднамеренно из почвы бактерии масляная кислота остается при заполнении силосных элеваторов и способны превращать молочную кислоту, продукт анаэробного сбраживания, в масляную кислоту, тем самым увеличивая рН силос 39. Такое увеличение рН может привести к всплеску гнилостных бактерий , которые обычно не в состоянии поддерживать рост при оптимальных условиях ферментации силосные 38. Clostridium SPP. , Listeria SPP. и Bacillus SPP. Особую обеспокоенность вызывает, особенно в силос для корма молочного скота, как бактериальные споры, которые выжили в желудочноointestinal тракт 40 может войти в пищевую цепь, приводят к порче пищевых продуктов и, в редких случаях, для животных и человека со смертельным исходом 37,39,41-44. Более того, в то время как трудно точно оценить экономические последствия ветеринарного лечения и потери домашнего скота, вызванного силос порче, это, вероятно, будет вредно для фермы, если вспышка должна была произойти.

Предполагается, что с помощью метагеномной подхода мы можем классифицировать микробных популяций, которые присутствуют в образцах силосных и, кроме того, определить микробных сообществ, связанных с силосной порче, что, в свою очередь, потенциально оказывающие вредное воздействие на домашний скот, позволяя меры по исправлению положения, чтобы быть принято до силос следует использовать в качестве источника питания.

Protocol

1. Расположение сайта Соберите образец силос из соответствующего сайта, таких как фермы. Здесь ферма расположена в Ballydulea, графство Корк, Ирландия (51 ° 51'58.4 "N 8 ° 16'48.7" W). 2. ДНК-экстракции Примечание: Выделение ДНК проводили с использованием коммерческого набора в соответствии с инструкциями изготовителя. Отрицательный контроль, который не содержал пробы, был использован в течение всего способа получения библиотеки. Добавить 100 – 400 мг образца в 978 мкл фосфатного буфера натрия и 122 мкл буфера для лизиса почвы в поставляемых лизиса трубок. Однородный образцы путем размещения лизис трубок в гомогенизатор в течение 40 сек при скорости 6,0 м / с. Центрифуга лизатов при 14000 х г в течение 15 мин и супернатант переносят в чистую микро-центрифужную пробирку, содержащую 250 мкл белка осадком раствора (ПФС). Приготовьте раствор переворачиванием 10 раз и центрифугупри 14000 х г в течение 5 мин. Добавляют надосадочную жидкость в 1 мл связывания ДНК матрицы в чистом 15 мл центрифужную пробирку. Приготовьте раствор путем переворачивания пробирки постоянно в течение 3 мин. Позвольте смеси оседать в течение 3 минут, затем удалите 500 мкл супернатанта. Смешайте оставшиеся супернатант. Перенести 600 мкл суспензии в спиновый фильтр и центрифуге при 14000 х г в течение 1 мин. Отбросить фильтрат и повторить процесс с оставшейся суспензии. Добавьте 500 мкл промывочного буфера связывания матрицы ДНК в спиновый фильтр, перемешать с помощью пипетки, а затем центрифуге при 14,000 х г в течение 1 мин. Отбросить фильтрат и снова центрифуге спиновый фильтр при 14000 мкг в течение 2 мин, чтобы гарантировать, что все промывочный буфер удаляется. Сушат центрифужные при 23 ° С в течение 5 мин. Предварительно теплой (70 ° С) ДНКазы свободной воды (DES) и повторно приостанавливать связывание матрицы ДНК в 100 мкл DES в пределах спинового фильтра. Передача спинового фильтра на чистую 1,5 мл микро-центрифуге втбыть и центрифуге при 14000 мкг в течение 1 мин для элюции ДНК. Хранить очищенной ДНК при температуре от -20 ° С до дальнейшего анализа не выполняется. 3. ДНК Очистка шариков Очистка с использованием ДНК ПРИМЕЧАНИЕ: До метагеномной подготовки библиотеки извлеченная ДНК очищали с использованием очистки бусинки, чтобы обеспечить чистый образец ДНК был получен. Инкубируйте бусинки при 23 ° С в течение 30 мин перед использованием. Добавьте 2 объема бисера в образце ДНК и инкубировать раствор при 23 ° С в течение 5 мин. Поместите образцы на магнит разделения в течение 5 мин, а затем отбросить супернатант. Промыть бусин в два раза с 200 мкл свежей 80% этанола (EtOH). Воздух сухой бусинки в течение 10 мин. Удалить образцы от магнита разделения и добавляют 50 мкл буфера для элюции (EB), перемешать с помощью пипетки. Выдержите в суспензии при 23 ° С в течение 5 мин, после чего поместить образцы обратно на магните разделения в течение 3 мин. Трansfer супернатант, который содержит ДНК, в чистую пробирку. Откажитесь бусы. Количественная очищенной ДНК в соответствии с разделом четыре. 4. Количественное Очищенную ДНК Примечание: Очищенная ДНК количественно с использованием флуориметра и двухцепочечной (дц) Высокая чувствительность (HS) для анализа комплекта в соответствии с инструкциями изготовителя. Подготовка рабочего раствора с использованием 199: 1 отношение буфера реагента. Добавьте 10 мкл каждого стандарта ДНК до 190 мкл рабочего раствора. Добавляют 10 мкл очищенной ДНК в 190 мкл рабочего раствора. Конечный объем должен составлять 200 мкл. Выдержите в стандартных, так и ДНК образцы при температуре 23 ° С в течение 2 мин. Анализ стандартов до образцов ДНК на флуорометре, используя инструкции на экране. 5. Ружье Секвенирование Библиотека Подготовка Примечание: Библиотека метод дробовика был подготовлен с использованиемкоммерческая подготовка комплекта библиотеки, используя инструкции изготовителя. Развести образцы ДНК до 0,2 нг / мкл с использованием EB. Любой образец , который уже ниже этой концентрации, то есть с отрицательным контролем, остается в его текущей концентрации. Смешайте 5 мкл очищенной ДНК с 10 мкл буфера и 5 мкл смеси фермента. Инкубируйте образцы при температуре 55 ° С в течение 5 мин. Добавьте 5 мкл буфера нейтрализации и инкубировать раствора при 23 ° С в течение 5 мин. Добавьте по 5 мкл каждого из образцов специфических показателей секвенирования и 15 мкл ПЦР основной смеси. В амплификатор, инкубировать образцов при 72 ° С в течение 3 мин, 95 ° С в течение 30 с, до того 12 циклов при 95 ° С в течение 10 с, 55 ° С в течение 30 с и 72 ° С в течение 30 с. Инкубируйте образцы, наконец, при 72 ° С в течение 5 мин. Очищают приготовленную ДНК с использованием очистки шарика, как и раньше, но с окончательным элюции 30 мкл EB. 6. Library Количество и качество проверки Примечание: Количество и качество подготовленных библиотек были оценены с использованием коммерческого набора и приборов. Инкубируйте компоненты набора при 23 ° С в течение 30 мин перед использованием. Добавьте 2 мкл ДНК в 2 мкл буфера и вихре в течение 1 мин при 2000 оборотах в минуту. Спин вниз образец, чтобы убедиться, что он находится в нижней части трубки. Вставьте пробирки с образцами, анализ ленты и советы в прибор, а также выполнять анализ по указанию программного обеспечения. Секвенирование ДНК 7. Передача подготовленных и количественных секвенирования ДНК библиотеки образцов к службе последовательности и последовательности , используя 300 пар оснований в паре концевой последовательности 45. 8. Анализ последовательности данных Raw Примечание: Команды для каждой программы с использованием операционной системы Linux приведены ниже шага протокола. Трубопровод используется для SАнализ данных equence показан на рисунке 1. Программы должны быть установлены пользователем перед анализом. Этот процесс должен выполняться индивидуально для каждого образца. Анализировать и визуализировать данные последовательности ДНК с использованием FastQC 46, введя в командной строки / путь-к-файлу / fastqc, а затем вперед и назад сырой читает raw_read1.fastq raw_read2.fastq. Укажите папку вывода, набрав -o output_fastqc и формат файла исходных чтения файлов с помощью -f fastq. Просмотр выходного файла (рисунок 2). путь к файлу / fastqc raw_read1.fastq raw_read2.fastq -o output_directory -f fastq. 9. Контроль качества Обрезка и фильтрация данных Последовательность Запустите программу подрезки, Trimmomatic 28, набрав в командной строке Java -jar / путь к файлу / trimmomatic-0.35.jar. Укажите файлы являются парными конечные файлы, набрав 'PE'. Государство, 16 центральный прocessing единиц (ЦП) должны использоваться программой, набрав -threads 16. Указать два файла для проверки качества, введя имена сырой в прямом и обратном читает. Префикс выходных файлов определяется набрав -baseout силос. Определить параметры для программы, набрав ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 ВЕДУЩИЙ: 3 TRAILING: 3 SLIDINGWINDOW: 4: 20 УРОЖАЙ: 200 HEADCROP: 15 MINLEN: 36. После завершения анализа обрезанные последовательностей с помощью FastQC, как и прежде, и сравните результат на необработанные данные о последовательности для обеспечения обрезки была выполнена успешно. Примечание: Программное средство, Trimmomatic, отделанные читает дальше путем удаления ведущего низкого качества или N оснований (ниже качество 3), удаление задней низкого качества или N оснований (ниже качество 3) и сканирование каждой операции чтения с широким скользящего окна 4-основания. Параметры были установлены для резки, когда среднее качество на базе падает ниже 20, а затем отказаться от любой читает ниже 36 оснований долго. И, наконец, 15 баз были обрезаны фром глава каждой операции чтения и чтений были обрезаны, чтобы держать 200 баз с самого начала чтения. Этот последний шаг был выполнен, чтобы преодолеть некоторые проблемы с качеством, когда секвенирования долго (> 200 пар оснований) читает. Они могут быть скорректированы для конкретных образцов 28. Java -jar /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq -baseout силос ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 ВЕДУЩИЙ: 3 TRAILING: 3 SLIDINGWINDOW: 4 : 20 УРОЖАЙ: 200 HEADCROP: 15 MINLEN: 36 10. Ассамблея метагенома Слияние непарный, отделанные читает, набрав кошку, за которой следует неспаренный читает; silage_read1_unpaired.fastq silage_read2_unpaired.fastq. Записать файлы в новый файл, набрав> silage_merged_unpaired.fastq кошка silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq Для того, чтобы заново собрать секвенировали ДНК, с помощью лопат (Санкт – Петербург) геном ассемблере 30, набрав / путь к-file / spades.py. Укажите, что 16 процессоров, которые будут использоваться, набрав -t 16 и что метагеномной параметр должен применяться набрав –meta. Идентифицировать отделан вперед читает используя -1 silage_read1_paired.fastq и обратный читает по -2 silage_read2_paired.fastq. Объединённая непарный читает указаны -s silage_merged_unpaired.fastq. Определите выходную папку, набрав -o silage_spades. путь к файлу / spades.py -t 16 –meta -1 -2 silage_read1_paired.fastq silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades 11. парноконцевое Read Перекрытие Слияние пар ДНК – последовательности операций чтения с использованием FLASH (Быстрая длина настройка коротких прочтений) 29, набрав в командной строки / путь к файлу / вспышки. Укажите, что 16 процессоров следует использовать при использовании -t 16 и префикс выхода, набрав -o силос. Определение обрезается читает набрав silage_trimmed_R1.fastq silage_trimmed_R2.fastq путь к файлу / флэш -t 16 -о мелькнула silage_read1_paired.fastq silage_read2_paired.fastq 12. таксономической классификации Тип / путь-к-файл / Кракен и указать базу данных, введя –db / путь-к-файлу / стандарт. Определить, что 16 процессоров следует использовать, набрав –threads 16 и определить папку вывода с помощью –output FLASHed_silage_extendedFrags_kraken.txt. Введите имя входного файла; FLASHed_silage.extendedFrags.fastq путь к файлу / Кракен –db стандарт –thread 16 –output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq Примечание: Классификация собранных каркасах последовательности ДНК с использованием Кракен 7 была завершена против самой последней, стандартной базе данных Kraken , который содержал все доступные последовательности прокариот генома. Передача столбцы 2 и 3 из выходного файла и в новый файл, введя вырезать -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int <li> Откройте выходной файл в веб-браузере. вырезать -f2,3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int Импорт нового файла в кроне 12, набрав ktImportTaxonomy. Укажите входной файл, набрав FLASHed_silage_extendedFrags_kraken.int. Определить выходной файл, набрав -o FLASHed_silage_extendedFrags_kraken.out.html. путь к файлу / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html 13. Функциональная Аннотация Перейти к MG-Раст 47 веб – сайт, http://metagenomics.anl.gov/~~HEAD=pobj. Регистрация в качестве нового пользователя, если требуется. После входа в систему, нажмите на кнопку "Загрузить". Загрузить собранные каркасы из шага 10. После того, как файлы загружены, нажмите на кнопку "Отправить" и следуйте инструкциям, и дождаться завершения анализа. После завершения анализа, просмотреть ссылку , отправленную эмАйыл от MG-Раст, или в качестве альтернативы, нажмите на "Прогресс". Существует список завершенных заданий. Нажмите на соответствующую идентификатор задания, а затем по ссылке на "страницу загрузки". На странице загрузки под заголовком "Протеин кластером 90%", нажмите на кнопку белка, чтобы загрузить файл предсказанного белка, 550.cluster.aa90.faa. Для классификации белков в качестве предполагаемо , принадлежащих к определенному классу ферментов CAZy, сравнить загруженные белки в базу данных CAZy 48. Загрузите базу данных Углеводы-активных энзимов (CAZy) из файлов являются: AA.zip, CE.zip, GH.zip, GT.zip и PL.zip. Эти файлы представляют следующие классы ферментов, соответственно: вспомогательная деятельность (AA), углеводный эстераз (CE), гликозид гидролазы (GH), гликозилтрансфераз (GT) и полисахарида лиазы (PL). Разархивируйте файлы базы данных и аннотировать белки путем определения сходства белка с белками базы данных CAZy с использованием ALGor USEARCH UBLASTithm 49. Для того, чтобы использовать цикл Баш (для I в * .txt) для итерации через 5 баз данных .txt файлов типа "для I в * .txt; делать". Запуск USEARCH набрав / путь-к-файлу / usearch8 с параметром -ublast для того, чтобы использовать алгоритм ublast. Затем введите имя файла последовательности белка, загруженного с MG-РАСТ "mgmXXXXXX.3.550.cluster.aa90.faa". Чтобы указать файл базы данных для использования типа "-db $ я" и указать порог E-значение при 1е -5, типа "-evalue 1e-5". Чтобы прекратить поиск после открытия последовательности – мишени и , следовательно , классификации этой белковой последовательности , как принадлежащие к классу целевого фермента, например , GH, типа "-masaccepts 1". Для того, чтобы определить, что 16 процессоров следует использовать тип "-threads 16" и указать формат выходного файла в качестве atab разделенных текста типа "-blast6out". Для того, чтобы определить тип выходного файла "$ i.ublast". Для завершения цикла Баш, тип ", сделано" для я в * .txt; делать / путь-к-файлу / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ я -evalue 1e-5 -maxaccepts 1 -threads 16 -blast6out $ i.ublast; сделанный 14. Визуализация CAZy Аннотация Для того, чтобы визуализировать выход из аннотации CAZy как диаграммы Венна, генерировать списки белка ID для каждого класса ферментов с помощью цикла Баш. Тип "для I в * .ublast; делать". Для передачи столбца 1 из выходного файла и новый файл, типа "кошка $ я | вырезать -f 1> $ i.list". Завершает цикл и тип "; Done". Откройте .list файлы в текстовом редакторе. Зайдите на сайт, выберите количество наборов, как 5 и вставить содержимое каждого файла списка в отдельном окне. Загрузите полученную диаграмму в виде файла .svg. ибо я в * .ublast; делают кошки $ I | вырезать -f 1> $ i.list; сделанный

Representative Results

До биоинформатики обработки, сырые последовательность чтений были обрезаны и адаптеры были удалены с помощью программного обеспечения Trimmomatic 28. После обрезки и фильтрации шаг, число чтений была снижена до 50% последовательности операций чтения (таблица 1). Средняя оценка база Phred была> 30 после того, как контроль качества (Рисунок 2). Пары ДНК – последовательностей , которые имели перекрывающиеся области были объединены с помощью программного обеспечения FLASH 29 для создания одного больше читает, не перекрываются чтений были сохранены в отдельном файле. 45,47% читает (105343) в сочетании успешно. После перекрытия чтения с использованием FLASH прочтений, полученные в результате расширенные фрагменты подверглись бактериальный таксономическую классификацию с использованием программного обеспечения Кракен 7 и впоследствии были визуализированы с помощью программного обеспечения Krona (рисунок 3). <p class="jove_content" fo:keep-togetherНе познее-страница = "1"> Большинство видов бактерий, присутствующих в силосной метагенома находятся в пределах 4 прокариотической фил: Firmicutes (34%), Actinobacteria (28%), Proteobacteria (27%) и Bacteroidetes (7%) , Распределение классов , присутствующих в этих фил можно увидеть на рисунке 4. Наиболее многочисленный вид в метагенома были Lactobacillus SPP. (24%; Firmicutes), Corynebacterium SPP. (8%; Actinobacteria), Propionibacterium SPP. (3%; Actinobacteria) и Prevotella SPP. (3%; Bacteroidetes). были также отмечены виды, важные для здоровья животных и замешанные в болезни; Clostridium SPP. (1%) Bacillus SPP. (0,6%), Listeria SPP. (0,2%) были предсказаны присутствовать в образце силос. Функциональная аннотаций была выполнена на собранном читает. Метагенома был собран с использованием лопат ассемблер 30 с помощью обрезанная и фильтровалипарноконцевое и непарного чтений генерации 92,284 строительных лесов. Для того чтобы идентифицировать целлюлазы, белки были предсказаны с помощью MG-Раст и аннотированный с использованием базы данных Углеводы-активных энзимов (CAZy). Из 97,562 предсказанных белков, 6357 были аннотированный в качестве мнимого углеводного-активного фермента в одном из пяти ферментов классов , которые составляют базу данных CAZy (рисунок 5). Результаты были визуализированы в виде диаграммы Венна , используя программное обеспечение InteractiVenn 50 , отражающую распределение белковых аннотаций , включая те , которые содержат более одного CAZy фермента класса аннотацию. Из них 3861 были предсказаны, чтобы иметь гликозид гидролазы активность и будет дополнительно характеризоваться в лаборатории, чтобы подтвердить функцию. Рисунок 1: Биоинформатический метагеномика трубопровода для анализа силос. Два основных подхода былииспользуется для исследования микробиомом сенажа, таксономической классификации и функциональной аннотации. Пожалуйста , нажмите здесь , чтобы посмотреть увеличенную версию этой фигуры. Рисунок 2: Последовательность качества Per-базы до и после обрезки и удаления адаптера. За последовательность оснований качества участок из FASTQC показывает средний балл Phred по всей длине последовательности считывает до и после контроля качества. Пожалуйста , нажмите здесь , чтобы посмотреть увеличенную версию этой фигуры. Рисунок 3: Таксономическое КЛАССИФИние бактериального микробиомом твердого силос. Классификация подстриженной и перекрывающей последовательности считывает данные из FLASH проводили с использованием Кракен 7 и впоследствии визуализированы с кроне. Пожалуйста , нажмите здесь , чтобы посмотреть увеличенную версию этой фигуры. Рисунок 4: Таксономический класс Распределение 4 самых обильных фил в бактериальном микробиомом твердого силос. Процент каждого класса бактерий в пределах четырех наиболее распространенных фил. Firmicutes: клостридии (красный) и бациллы (темно – синий); Proteobacteria: дельта / эпсилон (розовый), альфа (бледно – голубой), гамма (оранжевый) и бета (бирюзовый); Bacteroidetes: Flavobacteriia (темно – синий) и Bacteroidia(бледно-зеленый); Actinobacteria: Coriobacteriia (темно – фиолетовый) и другие Actinobacteria (темно – зеленый). Пожалуйста , нажмите здесь , чтобы посмотреть увеличенную версию этой фигуры. Рисунок 5: CAZy Аннотация предсказанного Протеом в Solid Силос микробиомом. Венна диаграмма, показывающая распределение пяти классов ферментных CAZy аннотаций в предсказанной протеомом твердого силосной микробиомом. Пожалуйста , нажмите здесь , чтобы посмотреть увеличенную версию этой фигуры. # Raw читает # Filtered читает (в паре) </TD> # Filtered читает # Мелькнула читает (В паре) (Непарный) 2374949 x2 231679 x2 1892534 105343 Таблица 1: Сводная таблица Секвенирование Читает.

Discussion

В то время как в силикомарганца анализа может дать отличную способность проникновения в суть микробных сообществ, которые присутствуют в пробах окружающей среды, крайне важно , чтобы таксономические классификации продемонстрировали проводиться совместно с соответствующими контролем и что подходящая глубина секвенирования была достигнута , чтобы захватить весь население присутствует 51.

При любом компьютерного анализа, существует много путей для достижения той же цели. Методы , которые мы использовали в данном исследовании , являются примерами подходящих и простых методов, которые были объединены для достижения диапазона анализов на силос микробиомом. Разнообразие и все большее количество биоинформатики инструментов и методов доступны для анализа метагеномных данных, например , Phylosift 8 и MetaPhlAn2 52, и они должны быть оценены до расследования по их значимости для выборки и анализа REQuired 53. Методы анализа метагеномной ограничены базы данных, для для классификации, глубины секвенирования и качества секвенирования.

Биоинформатический обработка продемонстрировала здесь была выполнена на локальном, высокой мощности машины; Однако облачные системы также доступны. Эти облачные сервисы позволяют за аренду необходимой вычислительной мощности без необходимости инвестиций высокой стоимости подходящей мощной локальной рабочей станции. Потенциальное применение этого метода было бы оценить силос до его использования в сельском хозяйстве, чтобы гарантировать, что никакие потенциально вредные бактерии не присутствуют, поэтому предотвращая их попадание в пищевую цепь.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Authors would like to thank Andrew Bird for the silage samples and Audrey Farbos of the Exeter Sequencing Service for her assistance in preparing DNA sequencing libraries. Exeter Sequencing Service and Computational core facilities at the University of Exeter. Medical Research Council Clinical Infrastructure award (MR/M008924/1). Wellcome Trust Institutional Strategic Support Fund (WT097835MF), Wellcome Trust Multi User Equipment Award (WT101650MA) and BBSRC LOLA award (BB/K003240/1).

Materials

FastDNA SPIN Kit for Soil MP Bio 116560200 DNA Extraction
DNA FastPrep MP Bio 116004500 DNA Extraction
Agencourt AMPure XP beads Beckman Coulter A63880 DNA Purification
Elution Buffer Qiagen 19806 DNA Purification
Qubit Fluorometer Thermo Fisher Q33216 DNA Quantification
Qubit dsDNA HS Assay Kit Thermo Fisher Q32854 DNA Quantification
Nextera XT DNA Library Prep Kit Illumina FC-131-1024 Library Preparation
Nextera XT Index Kit Illumina FC-131-1001 Library Preparation
TapeStation 2200 Agilent G2964AA DNA Quantification
HS D100 ScreenTape Agilent 5067-5584 DNA Quantification
HS D100 ScreenTape Reagents Agilent 5067-5585 DNA Quantification
TapeStation Tips Agilent 5067-5153 DNA Quantification
TapeStation Tubes Agilent 401428 and 401425 DNA Quantification
HiSeq 2500 Illumina DNA Sequencing – provided by a sequencing service
High Power Analysis Workstation Various Local or cloud based, user preferred system

References

  1. Riesenfeld, C. S., Schloss, P. D., Handelsman, J. Metagenomics: genomic analysis of microbial communities. Annu. Rev. Genet. 38 (1), 525-552 (2004).
  2. Amann, R. I., Ludwig, W., Schleifer, K. H. Phylogenetic identification and in situ detection of individual microbial cells without cultivation. Microbiol. Rev. 59 (1), 143-169 (1995).
  3. Human Microbiome Project Consortium. Structure, function and diversity of the healthy human microbiome. Nature. 486 (7402), 207-214 (2012).
  4. Venter, J. C., et al. Environmental genome shotgun sequencing of the Sargasso Sea. Science. 304 (5667), 66-74 (2004).
  5. Vilanova, C., Iglesias, A., Porcar, M. The coffee-machine bacteriome: biodiversity and colonisation of the wasted coffee tray leach. Sci. Rep. 5, 17163 (2015).
  6. Hayden, E. C. Technology: The $1,000 genome. Nature. 507 (7492), 294-295 (2014).
  7. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Gen. Biol. 15 (3), 46 (2014).
  8. Darling, A. E., et al. PhyloSift: phylogenetic analysis of genomes and metagenomes. PeerJ. 2 (12), 243 (2014).
  9. Buchfink, B., Xie, C., Huson, D. H. Fast and sensitive protein alignment using DIAMOND. Nat. Meth. 12 (1), 59-60 (2015).
  10. Moreno-Hagelsieb, G., Hudy-Yuffa, B. Estimating overannotation across prokaryotic genomes using BLAST+, UBLAST, LAST and BLAT. BMC Res Notes. 7 (1), 651 (2014).
  11. Hauser, M., Steinegger, M., Söding, J. MMseqs software suite for fast and deep clustering and searching of large protein sequence sets. Bioinf. 32 (9), 1323-1330 (2016).
  12. Ondov, B. D., Bergman, N. H., Phillippy, A. M. Interactive metagenomic visualization in a Web browser. BMC Bioinf. 12, (2011).
  13. Kolde, R., Vilo, J. GOsummaries: an R Package for Visual Functional Annotation of Experimental Data. F1000Res. 4, 574 (2015).
  14. Reddy, T. B. K., et al. The Genomes OnLine Database (GOLD) v.5: a metadata management system based on a four level (meta)genome project classification. Nuc. Aci. Res. 43 (1), 1099-1106 (2015).
  15. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinf. 10 (1), 421 (2009).
  16. Chakravorty, S., Helb, D., Burday, M., Connell, N., Alland, D. A detailed analysis of 16S ribosomal RNA gene segments for the diagnosis of pathogenic bacteria. J. Micro. Met. 69 (2), 330-339 (2007).
  17. Fadrosh, D. W., et al. An improved dual-indexing approach for multiplexed 16S rRNA gene sequencing on the Illumina MiSeq platform. Microbiome. 2 (1), 6 (2014).
  18. Mikheyev, A. S., Tin, M. M. Y. A first look at the Oxford Nanopore MinION sequencer. Molecular Ecology Resources. 14 (6), 1097-1102 (2014).
  19. Schadt, E. E., Turner, S., Kasarskis, A. A window into third generation sequencing. Hum. Mol. Genet. 20 (4), 853-853 (2011).
  20. Shapiro, B., Hofreiter, M. A Paleogenomic Perspective on Evolution and Gene Function: New Insights from Ancient DNA. Science. 343 (6169), 1236573 (2014).
  21. Der Sarkissian, C., et al. Ancient genomics. Phil. Trans. R. Soc. B. 370 (1660), (2015).
  22. Patin, N. V., Kunin, V., Lidström, U., Ashby, M. N. Effects of OTU Clustering and PCR Artifacts on Microbial Diversity Estimates. Microb Ecol. 65 (3), 709-719 (2013).
  23. McInroy, G. R., Raiber, E. -. A., Balasubramanian, S. Chemical biology of genomic DNA: minimizing PCR bias. Chem. Commun. 50 (81), 12047-12049 (2014).
  24. Aller, P., Rould, M. A., Hogg, M., Wallace, S. S., Doublié, S. A structural rationale for stalling of a replicative DNA polymerase at the most common oxidative thymine lesion, thymine glycol. Proc. Natl. Acad. Sci. U.S.A. 104 (3), 814-818 (2007).
  25. Ranjan, R., Rani, A., Metwally, A., McGee, H. S., Perkins, D. L. Analysis of the microbiome: Advantages of whole genome shotgun versus 16S amplicon sequencing. Biochem. Biophys. Res. Commun. 469 (4), 967-977 (2016).
  26. Sims, D., Sudbery, I., Ilott, N. E., Heger, A., Ponting, C. P. Sequencing depth and coverage: key considerations in genomic analyses. Nat Rev Genet. 15 (2), 121-132 (2014).
  27. Li, X., Rao, S., Wang, Y., Gong, B. Gene mining: a novel and powerful ensemble decision approach to hunting for disease genes using microarray expression profiling. Nuc. Aci. Res. 32 (9), 2685-2694 (2004).
  28. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinf. 30 (15), 2114-2120 (2014).
  29. Magoc, T., Salzberg, S. L. FLASH: fast length adjustment of short reads to improve genome assemblies. Bioinf. 27 (21), 2957-2963 (2011).
  30. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. J. Comput. Biol. 19 (5), 455-477 (2012).
  31. Nurk, S., Meleshko, D., Korobeynikov, A. . metaSPAdes: a new versatile de novo metagenomics assembler. , (2016).
  32. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215 (3), 403-410 (1990).
  33. Tanaseichuk, O., Borneman, J., Jiang, T. Phylogeny-based classification of microbial communities. Bioinf. 30 (4), 449-456 (2014).
  34. Bose, T., Haque, M. M., Reddy, C., Mande, S. S. COGNIZER: A Framework for Functional Annotation of Metagenomic Datasets. PLoS ONE. 10 (11), 0142102 (2015).
  35. Sharma, A. K., Gupta, A., Kumar, S., Dhakan, D. B., Sharma, V. K. Woods: A fast and accurate functional annotator and classifier of genomic and metagenomic sequences. Genomics. 106 (1), 1-6 (2015).
  36. Eikmeyer, F. G., et al. Metagenome analyses reveal the influence of the inoculant Lactobacillus buchneri CD034 on the microbial community involved in grass ensiling. J. Biotech. 167 (3), 334-343 (2013).
  37. Driehuis, F., Elferink, S. J. W. H. O. The impact of the quality of silage on animal health and food safety: A review. Vet. Quart. 22 (4), 212-216 (2000).
  38. Dunière, L., Sindou, J., Chaucheyras-Durand, F., Chevallier, I., Thévenot-Sergentet, D. Silage processing and strategies to prevent persistence of undesirable microorganisms. Anim Feed Sci Technol. 182 (1-4), 1-15 (2013).
  39. Vissers, M. M. M., et al. Minimizing the Level of Butyric Acid Bacteria Spores in Farm Tank Milk. J. of Dairy Sci. 90 (7), 3278-3285 (2007).
  40. Te Giffel, M. C., Wagendorp, A., Herrewegh, A. Bacterial spores in silage and raw milk. Antonie van. , (2002).
  41. Wiedmann, M. ADSA Foundation Scholar Award-An Integrated Science-Based Approach to Dairy Food Safety: Listeria monocytogenes as a Model System. J. of Dairy Sci. 86 (6), 1865-1875 (2003).
  42. Low, J. C., Donachie, W. A review of Listeria monocytogenes and listeriosis. Vet J. 153 (1), 9-29 (1997).
  43. Schoder, D., Melzner, D., Schmalwieser, A. Important vectors for Listeria monocytogenes transmission at farm dairies manufacturing fresh sheep and goat cheese from raw. J.Food. , (2011).
  44. Lindström, M., Myllykoski, J., Sivelä, S., Korkeala, H. Clostridium botulinumin Cattle and Dairy Products. Crit. Rev. Food Sci. Nutr. 50 (4), 281-304 (2010).
  45. Bentley, D. R., et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 456 (7218), 53-59 (2008).
  46. Andrews, S. . Babraham Bioinformatic- FastQC: A Quality Control tool for High Throughput Sequence Data. , (2015).
  47. Keegan, K. P., Glass, E. M., Meyer, F. FMG-RAST, a Metagenomics Service for Analysis of Microbial Community Structure and Function. Methods Mol. Biol. 1399, 207-233 (2016).
  48. Cantarel, B. L., et al. The Carbohydrate-Active EnZymes database (CAZy): an expert resource for Glycogenomics. Nuc. Aci. Res. 37, 233-238 (2009).
  49. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinf. 26 (19), 2460-2461 (2010).
  50. Heberle, H., et al. InteractiVenn: a web-based tool for the analysis of sets through Venn diagrams. BMC Bioinf. 16 (1), 213 (2015).
  51. Ni, J., Yan, Q., Yu, Y. How much metagenomic sequencing is enough to achieve a given goal. Sci. Rep. 3, 1968 (2013).
  52. Truong, D. T., et al. MetaPhlAn2 for enhanced metagenomic taxonomic profiling. Nat. Meth. 12 (10), 902-903 (2015).
  53. Oulas, A., et al. Metagenomics: tools and insights for analyzing next-generation sequencing data derived from biodiversity studies. Bioinform Biol Insights. 9 (9), 75-88 (2015).

Play Video

Cite This Article
Tennant, R. K., Sambles, C. M., Diffey, G. E., Moore, K. A., Love, J. Metagenomic Analysis of Silage. J. Vis. Exp. (119), e54936, doi:10.3791/54936 (2017).

View Video