Summary

تحليل Metagenomic من السيلاج

Published: January 13, 2017
doi:

Summary

Metagenomics was used to investigate the microbiome of silage cattle feed. Analysis was performed by shotgun sequencing. This approach was used to characterize the composition of the microbial community within the cattle feed.

Abstract

Metagenomics is defined as the direct analysis of deoxyribonucleic acid (DNA) purified from environmental samples and enables taxonomic identification of the microbial communities present within them. Two main metagenomic approaches exist; sequencing the 16S rRNA gene coding region, which exhibits sufficient variation between taxa for identification, and shotgun sequencing, in which genomes of the organisms that are present in the sample are analyzed and ascribed to “operational taxonomic units”; species, genera or families depending on the extent of sequencing coverage.

In this study, shotgun sequencing was used to analyze the microbial community present in cattle silage and, coupled with a range of bioinformatics tools to quality check and filter the DNA sequence reads, perform taxonomic classification of the microbial populations present within the sampled silage, and achieve functional annotation of the sequences. These methods were employed to identify potentially harmful bacteria that existed within the silage, an indication of silage spoilage. If spoiled silage is not remediated, then upon ingestion it could be potentially fatal to the livestock.

Introduction

Metagenomics هو تحليل مباشر من الحمض النووي تنقيته من المجتمعات البيولوجية الموجودة في العينات البيئية وكان يستخدم في الأصل للكشف عن البكتيريا unculturable الموجودة في الرواسب 2. وقد استخدم على نطاق واسع Metagenomics لعدد من التطبيقات، مثل تحديد microbiome الإنسان تصنيف السكان الميكروبية داخل المحيط 4 وحتى لتحليل المجتمعات البكتيرية التي تضع على آلات القهوة 5. أدى إدخال تقنيات التسلسل الجيل القادم في أكبر الإنتاجية تسلسل والإخراج. ونتيجة لذلك، أصبح تسلسل الحمض النووي أكثر اقتصادا 6 وعمق تسلسل التي يمكن القيام بها قد زاد بشكل كبير، مما metagenomics لتصبح قوية وأداة تحليلية.

دفعت التعزيزات "الواجهة الأمامية" في الجانب العملي، الجزيئي للتسلسل metagenomic نمو فيأدوات سيليكون والمعلوماتية الحيوية المتاحة لتصنيف التصنيفية 7-9، والشرح وظيفية 10،11 و 12،13 التمثيل المرئي للبيانات تسلسل الحمض النووي. تزايد عدد المتاحة، التسلسل أولية النواة وحقيقية النواة 14 الجينوم يسمح مزيد من الدقة في تصنيف المجتمعات الميكروبية، التي تتم دائما ضد "في نهاية العام" قاعدة بيانات مرجعية من الجينوم متسلسلة 15. ويمكن اعتماد نهجين رئيسيين لتحليل metagenomic.

طريقة أكثر تقليدية هو تحليل الجينات 16S الريباسي الترميز المنطقة من جينوم بكتيري. يتم حفظها في 16S الريباسي للغاية بين الأنواع بدائيات النوى ولكن المعارض تسع مناطق فرط متغير (V1 – V9) التي يمكن استغلالها لتحديد الأنواع 16. إدخال التسلسل الطويل (≤ 300 نقطة أساس نهاية الاقتران) يسمح لتحليل تسلسل الحمض النووي التي تغطي منطقتين شديدة متغير، ولا سيماوV3 – المنطقة V4 17. التقدم في تقنيات التسلسل الأخرى، مثل أكسفورد ثقب النانو 18 و 19 PacBIO، لا يسمح كامل الجينات 16S الريباسي لتكون متسلسلة متاخم.

بينما توفر 16S الحمض النووي المؤتلف المكتبات القائمة على نهج تستهدف تحديد الأنواع وتمكن من الكشف عن عدد المنخفضة نسخة الحمض النووي الذي يحدث طبيعيا في عينات النقاء والمكتبات بندقية التسلسل تسمح للكشف عن الأنواع التي قد تحتوي على مناطق الحمض النووي التي هي إما غير amplifiable من قبل 16S الريباسي تسلسل علامة التمهيدي المستخدمة، أو بسبب الخلافات بين تسلسل قالب وتسلسل تضخيم التمهيدي كبيرة جدا 20،21. وعلاوة على ذلك، على الرغم من بلمرة الحمض النووي لديها الدقة العالية تكرار الحمض النووي، وأخطاء قاعدة يمكن مع ذلك أن يحدث خلال PCR والتضخيم، وهذه الأخطاء أدرجت يمكن أن يؤدي إلى تصنيف غير صحيحة من مصدرها الأنواع 22. التحيز في التضخيم PCR من بعدها القالبيمكن أيضا أن تحدث uences. تسلسل الحمض النووي مع محتوى GC عالية يمكن أن يكون تحت الممثلة في تجمع amplicon النهائي 23 وبالمثل التعديلات قاعدة غير طبيعية، مثل غليكول الثايمين، يمكن وقف بلمرة الحمض النووي تسبب الفشل في التضخيم من الحمض النووي تسلسل 24. في المقابل، مكتبة الحمض النووي بندقية التسلسل هي مكتبة الحمض النووي التي تم إعدادها باستخدام كل من الحمض النووي المنقى الذي تم استخراجه من عينة ومجزأة في وقت لاحق إلى أطوال سلسلة أقصر الحمض النووي قبل التحضير لالتسلسل. وأكثر دقة مقارنة تصنيف التصنيفي للتسلسل الحمض النووي التي تم إنشاؤها بواسطة تسلسل طلقات نارية على 16S الريباسي amplicon التسلسل 25، على الرغم من أن التكلفة المالية المطلوبة للوصول إلى عمق التسلسل موثوق هو أعظم من ذلك من amplicon تسلسل 26. الفائدة الرئيسية من metagenomics بندقية التسلسل هو أن المناطق متسلسلة من مختلف العوامل الوراثية في العينة متاحة للتنقيب الجينات مرة واحدة أنها كانتتم تصنيف تصنيفيا 27.

ويتم تحليل Metagenomic تسلسل البيانات من قبل مجموعة متزايدة من أدوات بيوينفورمتيك. هذه الأدوات هي قادرة على أداء مجموعة واسعة من التطبيقات، على سبيل المثال، تحليل ومراقبة جودة البيانات تسلسل الخام 28، وتداخل في نهاية يقترن يقرأ 29، دي نوفو تجميع تسلسل يقرأ لcontigs والسقالات 30،31، تصنيف التصنيف والتصور تسلسل يقرأ وتجميع سلاسل 7،12،32،33 والشرح وظيفية من متواليات تجميعها 34،35.

السيلاج، التى ينتجها المزارعون في جميع أنحاء العالم من الحبوب المخمرة مثل الذرة (ذرة شامية)، ويستخدم في الغالب كعلف للماشية. يتم التعامل مع السيلاج مع س البكتيريا الملبنة. لمساعدة التخمير 36 ولكن حتى الآن، هناك معرفة محدودة السكان الميكروبية أخرى وجدت في السيلاج. على انزيمعملية ن يمكن أن يؤدي إلى الكائنات الدقيقة غير مرغوب فيها ويمكن أن تكون ضارة تصبح سائدة داخل السيلاج 37. بالإضافة إلى الخمائر والفطريات والبكتيريا قابلة للتكيف بشكل خاص على البيئة اللاهوائية في تخمير الأعلاف وأكثر في كثير من الأحيان ترتبط مع الأمراض في الماشية بدلا من تدهور السيلاج 38. بكتيريا حمض زبدي يمكن أن تضاف عن غير قصد من التربة لا تزال عند ملء الصوامع السيلاج وتكون قادرة على تحويل حمض اللبنيك، وهو منتج من الهضم اللاهوائي، لحامض زبدي، وبالتالي زيادة درجة الحموضة في السيلاج 39. هذه الزيادة في درجة الحموضة يمكن أن يؤدي إلى زيادة في البكتيريا التلف التي عادة ما تكون غير قادرة على مواصلة النمو في ظل السيلاج الأمثل ظروف التخمر 38. كلوستريديوم النيابة. ، الليسترية. وعصية النيابة. تثير القلق بشكل خاص، لا سيما في السيلاج كعلف للماشية الألبان، والجراثيم البكتيرية التي نجت من الاضالجهاز ointestinal 40 يمكن أن تدخل في السلسلة الغذائية، يؤدي إلى تلف المواد الغذائية و، في حالات نادرة، إلى الحيوان وفيات بشرية 37،39،41-44. وعلاوة على ذلك، في حين أنه من الصعب تقدير التأثير الاقتصادي المحدد من العلاج البيطري وفقدان الماشية الناجمة عن تلف السيلاج، فمن المحتمل أن تكون ضارة إلى مزرعة إذا كان تفشي تحدث.

والافتراض بأن باستخدام نهج metagenomic يمكننا تصنيف السكان الميكروبية الموجودة في عينات الأعلاف وعلاوة على ذلك تحديد المجتمعات الميكروبية المرتبطة تلف السيلاج من شأنه، في المقابل، من المحتمل أن يكون لها تأثير ضار على الماشية، مما يتيح إجراءات تصحيحية ليكون اتخذت قبل السيلاج لاستخدامه كمصدر للغذاء.

Protocol

1. الموقع الموقع جمع العينة السيلاج من موقع مناسب مثل مزرعة. هنا، كانت تقع المزرعة في Ballydulea، شركة كورك، أيرلندا (51 ° 51'58.4 "N 8 ° 16'48.7" W). 2. استخراج الحمض النووي تم إجراء استخراج الحمض النووي باستخدام طقم التجارية باتباع إرشادات الشركة المصنعة: ملاحظة. عنصر تحكم السلبية، التي لا تتضمن أي عينة، وكان يستخدم في جميع أنحاء طريقة إعداد مكتبة. إضافة 100-400 ملغ من عينة إلى 978 ميكرولتر الصوديوم العازلة الفوسفات و 122 ميكرولتر العازلة تحلل التربة في أنابيب تحلل الموردة. التجانس عينات عن طريق وضع أنابيب تحلل في الخالط لمدة 40 ق بسرعة 6.0 م / ث. لست] أجهزة الطرد المركزي في 14000 x ج لمدة 15 دقيقة، وطاف لنقل أنبوب الطرد المركزي الصغيرة نظيفة تحتوي على 250 ميكرولتر من البروتين المتعجل الحل (PPS). مزيج الحل بواسطة عكس 10 مرات وأجهزة الطرد المركزيفي 14000 x ج لمدة 5 دقائق. إضافة طاف إلى 1 مل الحمض النووي مصفوفة ملزم في 15 مل أنبوب الطرد المركزي نظيفة. مزيج الحل عن طريق أنبوب للقلب باستمرار لمدة 3 دقائق. يسمح هذا المزيج ليستقر لمدة 3 دقائق، ثم تجاهل 500 ميكرولتر من طاف. مزيج طاف المتبقية. نقل 600 ميكرولتر من تعليق لمرشح وتدور أجهزة الطرد المركزي في 14000 x ج لمدة 1 دقيقة. تجاهل الترشيح وتكرار هذه العملية مع تعليق المتبقية. إضافة 500 ميكرولتر من غسل العازلة إلى مصفوفة ملزم الحمض النووي داخل فلتر زيادة ونقصان، مزيج من قبل pipetting، ثم الطرد المركزي في 14000 x ج لمدة 1 دقيقة. تجاهل الترشيح والطرد المركزي تصفية تدور مرة أخرى في 14000 x ج لمدة 2 دقيقة لضمان تتم إزالة كافة العازلة يغسل. تجفيف مرشح تدور في 23 مئوية لمدة 5 دقائق. قبل دافئ (70 درجة) على مياه خالية من الدناز (DES) وإعادة تعليق المصفوفة ملزمة الحمض النووي في 100 ميليلتر من DES داخل فلتر زيادة ونقصان. نقل مرشح تدور لنظيفة 1.5 مل الدقيقة الطرد المركزي توأن تكون وأجهزة الطرد المركزي في 14000 x ج لمدة 1 دقيقة إلى أزل الحمض النووي. تخزين الحمض النووي تنقيته في -20 مئوية حتى يتم تنفيذ مزيد من التحليل. 3. الحمض النووي تنقية الخرز تنقية باستخدام الحمض النووي تم الحصول قبل إعداد مكتبة metagenomic تمت تنقية الحمض النووي المستخرج باستخدام الخرز تنقية لضمان عينة من الحمض النووي النقي: ملاحظة. احتضان حبات في 23 مئوية لمدة 30 دقيقة قبل الاستخدام. إضافة 2 مجلدات من الخرز لعينة من الحمض النووي واحتضان الحل عند 23 مئوية لمدة 5 دقائق. وضع العينات على مغناطيس فصل لمدة 5 دقائق ثم تجاهل طاف. تغسل حبات مرتين مع 200 ميكرولتر الطازجة 80٪ من الإيثانول (ETOH). الهواء الجاف حبات لمدة 10 دقيقة. إزالة عينات من المغناطيس الانفصال وإضافة 50 ميكرولتر من شطف العازلة (EB)، مزيج من قبل pipetting. احتضان تعليق على 23 مئوية لمدة 5 دقائق، وبعد ذلك وضع العينات مرة أخرى إلى المغناطيس الفصل لمدة 3 دقائق. آرansfer طاف، التي تحتوي على الحمض النووي لأنبوب نظيفة. تجاهل الخرز. تحديد الحمض النووي تنقيته كما في القسم الرابع. 4. الكمي من الحمض النووي تنقية ملاحظة: كان كميا تنقية الحمض النووي باستخدام مقياس التألق والمزدوج تقطعت بهم السبل (dsDNA) حساسية عالية (HS) طقم فحص باتباع إرشادات الشركة المصنعة. إعداد محلول العمل باستخدام 199: 1 نسبة عازلة لالكاشف. إضافة 10 ميكرولتر من كل مستوى الحمض النووي ل190 ميكرولتر من محلول العمل. إضافة 10 ميكرولتر من الحمض النووي المنقى إلى 190 ميكرولتر من محلول العمل. يجب أن يكون الحجم النهائي 200 ميكرولتر. احتضان العينات القياسية والحمض النووي في 23 مئوية لمدة 2 دقيقة. تحليل المعايير قبل عينات من الحمض النووي على التألق باستخدام التعليمات التي تظهر على الشاشة. 5. بندقية تسلسل إعداد مكتبة ملاحظة: تم إعداد مكتبة بندقية التسلسل باستخدامالتجارية إعداد مكتبة عدة باستخدام إرشادات الشركة المصنعة. تمييع عينات من الحمض النووي إلى 0.2 نانوغرام / ميكرولتر باستخدام EB. أي عينة التي هي بالفعل أقل من هذا التركيز، أي سيطرة سلبية، يتم ترك في تركيزه الحالي. مزيج 5 ميكرولتر من الحمض النووي المنقى مع 10 ميكرولتر العازلة و 5 ميكرولتر مزيج إنزيم. احتضان العينات عند 55 مئوية لمدة 5 دقائق. إضافة 5 ميكرولتر من تحييد العازلة واحتضان الحل عند 23 مئوية لمدة 5 دقائق. إضافة 5 ميكرولتر من كل من مؤشرات التسلسل محددة عينة و 15 ميكرولتر من PCR مزيج الرئيسي. في thermocycler، احتضان العينات عند 72 مئوية لمدة 3 دقائق، 95 مئوية لمدة 30 ثانية، قبل 12 دورات من 95 مئوية لمدة 10 ثانية، 55 مئوية لمدة 30 ثانية و 72 ج لمدة 30 ثانية. احتضان عينات أخيرا في 72 مئوية لمدة 5 دقائق. تنقية الحمض النووي استعداد باستخدام تنقية حبة كما كان من قبل ولكن مع شطف النهائي من 30 ميكرولتر من EB. 6. Library الكمية وفحص الجودة ملاحظة: كمية ونوعية المكتبات إعداد وتقييم استخدام عدة التجارية والأجهزة. احتضان مكونات عدة في 23 مئوية لمدة 30 دقيقة قبل الاستخدام. إضافة 2 ميكرولتر من الحمض النووي ل2 ميكرولتر من العازلة ودوامة لمدة 1 دقيقة في 2000 دورة في الدقيقة. تدور باستمرار العينة لضمان أنها في الجزء السفلي من الأنبوب. إدراج أنابيب العينات، شريط تحليل ونصائح في الصك، وإجراء تحليل وفقا لتوجيهات من قبل البرنامج. تسلسل الحمض النووي 7. نقل المكتبات تسلسل الحمض النووي عينات مستعدة وكميا في خدمة التسلسل والتسلسل باستخدام 300 نقطة أساس نهاية يقترن تسلسل 45. 8. تحليل البيانات الخام تسلسل ملاحظة: يتم عرض الأوامر لكل برنامج باستخدام نظام التشغيل لينكس أدناه الخطوة البروتوكول. خط الأنابيب المستخدمة في الصورةويظهر تحليل البيانات equence في الشكل 1. برامج ليتم تثبيتها من قبل المستخدم قبل التحليل. يجب أن يتم تنفيذ هذه العملية بشكل فردي لكل عينة. تحليل وتصور البيانات تسلسل الحمض النووي باستخدام FastQC 46 عن طريق الكتابة في سطر الأوامر / مسار إلى ملف / fastqc، تليها وإلى الأمام وعكس الخام يقرأ raw_read2.fastq raw_read1.fastq. تحديد المجلد الإخراج عن طريق كتابة output_fastqc -o وتنسيق ملف من الملفات المقروءة الخام عن طريق fastq -f. عرض ملف الإخراج (الشكل 2). مسار إلى ملف / fastqc raw_read1.fastq raw_read2.fastq -o output_directory -f fastq. 9. مراقبة الجودة التشذيب وتصفية البيانات تسلسل تشغيل برنامج التشذيب، Trimmomatic 28 عن طريق كتابة في سطر الأوامر جافا جرة / مسار إلى ملف / trimmomatic-0.35.jar. يتم إقران تحديد الملفات ملفات نهاية بكتابة "PE". الدولة أن 16 العلاقات العامة المركزيةوحدات ocessing (وحدات المعالجة المركزية) وينبغي أن تستخدم من قبل البرنامج عن طريق كتابة -threads 16. قائمة الملفين إلى الاختيار مراقبة الجودة عن طريق كتابة أسماء الأمام الخام وعكس يقرأ. يتم تحديد بادئة من الناتج الملفات عن طريق كتابة السيلاج -baseout. تحديد خيارات للبرنامج عن طريق كتابة ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 قيادي: 3 زائدة: 3 SLIDINGWINDOW: 4: 20 محصول: 200 HEADCROP: 15 MINLEN: 36. مرة واحدة كاملة، وتحليل تسلسل قلص باستخدام FastQC كما كان من قبل ومقارنة الإخراج إلى تسلسل البيانات الخام لضمان وتقليم تم تنفيذها بنجاح. ملاحظة: أداة البرمجيات، Trimmomatic، قلص يقرأ المزيد عن طريق إزالة الرائدة جودة منخفضة أو قواعد N (أقل جودة 3)، وإزالة زائدة جودة منخفضة أو قواعد N (أقل جودة 3) ومسح كل قراءة مع 4-قاعدة نافذة انزلاق واسعة. وقد تم تحديد معايير لقطع عندما تنخفض متوسط ​​الجودة في قاعدة أقل من 20 ومن ثم إلى إسقاط أي يقرأ أدناه 36 قواعد طويلة. وأخيرا، تم اقتصاص 15 قاعدة الابام على رأس كل قراءة ويقرأ تم اقتصاص للحفاظ على 200 قاعدة من بداية القراءة. تم تنفيذ هذه الخطوة النهائية للتغلب على بعض قضايا الجودة عند تسلسل طويلة (> 200 سنة مضت) يقرأ. هذه يمكن تعديلها لعينات محددة 28. جافا جرة /path-to-file/trimmomatic-0.35.jar PE -threads 16 raw_read1.fastq raw_read2.fastq -baseout السيلاج ILLUMINACLIP: NexteraPE-PE.fa: 2: 30: 10 قيادي: 3 زائدة: 3 SLIDINGWINDOW: 4 : 20 محصول: 200 HEADCROP: 15 MINLEN: 36 10. الجمعية Metagenome دمج المفردة، وقلص يقرأ بكتابة القط تليها يقرأ المفردة. silage_read1_unpaired.fastq silage_read2_unpaired.fastq. إرسال الملفات إلى ملف جديد عن طريق كتابة> silage_merged_unpaired.fastq القط silage_read1_unpaired.fastq silage_read2_unpaired.fastq> silage_merged_unpaired.fastq لدي نوفو تجميع الحمض النووي التسلسل، استخدم البستوني (سانت بطرسبورغ الجينوم المجمع) 30 عن طريق كتابة / مسار ل-file / spades.py. تحديد أن 16 وحدات المعالجة المركزية هي لاستخدامها من قبل بكتابة -t 16 وأن المعلمة metagenomic يجب تطبيقها عن طريق كتابة –meta. تحديد قلصت إلى الأمام يقرأ باستخدام -1 silage_read1_paired.fastq والعكس يقرأ من قبل -2 silage_read2_paired.fastq. وأونبايريد المدمجة يقرأ يتم تحديده من قبل silage_merged_unpaired.fastq -s. تحديد المجلد الإخراج عن طريق كتابة -o silage_spades. مسار إلى ملف / -t spades.py 16 –meta -1 silage_read1_paired.fastq -2 silage_read2_paired.fastq -s silage_merged_unpaired.fastq -o silage_spades 11. المقترنة نهاية مقروءة التداخل دمج أزواج من تسلسل الحمض النووي يقرأ باستخدام FLASH (سريع طول تعديل قصيرة يقرأ) 29 عن طريق الكتابة في سطر الأوامر / مسار إلى ملف / فلاش. تحديد أن 16 وحدات المعالجة المركزية وينبغي أن تستخدم باستخدام -t 16 و البادئة الانتاج عن طريق كتابة -o السيلاج. تحديد قلص يقرأ بكتابة silage_trimmed_R1.fastq silage_trimmed_R2.fastq مسار إلى ملف / فلاش -t 16 -o تومض silage_read2_paired.fastq silage_read1_paired.fastq 12. تصنيف تصنيفية نوع / مسار إلى ملف / كراكن وتحديد قاعدة البيانات عن طريق كتابة –db / مسار لملف / قياسي. تحديد أن 16 وحدات المعالجة المركزية يجب استخدامها من قبل كتابة –threads 16 وتحديد مجلد الناتج باستخدام –output FLASHed_silage_extendedFrags_kraken.txt. اكتب اسم ملف الإدخال. FLASHed_silage.extendedFrags.fastq مسار إلى ملف / –thread مستوى –db كراكن 16 –output FLASHed_silage_extendedFrags_kraken.txt FLASHed_silage.extendedFrags.fastq ملاحظة: تم الانتهاء من تصنيف وتجميع السقالات تسلسل الحمض النووي باستخدام كراكن 7 ضد الأخيرة، قاعدة بيانات كراكن القياسية التي تحتوي على كل ما هو متاح تسلسل الجينوم بدائيات النوى. أعمدة نقل 2 و 3 من ملف الإخراج وإلى ملف جديد عن طريق كتابة قطع -f2،3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int <li> فتح ملف الإخراج في متصفح الويب. قطع -f2،3 FLASHed_silage_extendedFrags_kraken.txt> FLASHed_silage_extendedFrags_kraken.int استيراد ملف جديد إلى الكرونا 12 عن طريق كتابة ktImportTaxonomy. تحديد ملف الإدخال عن طريق كتابة FLASHed_silage_extendedFrags_kraken.int. تحديد ملف الإخراج عن طريق كتابة -o FLASHed_silage_extendedFrags_kraken.out.html. مسار إلى ملف / ktImportTaxonomy FLASHed_silage_extendedFrags_kraken.int -o FLASHed_silage_extendedFrags_kraken.out.html 13. الشرح الوظيفي انتقل إلى موقع 47 MG-راست، http://metagenomics.anl.gov/. تسجيل كمستخدم جديد إذا لزم الأمر. بعد تسجيل الدخول، انقر على زر "تحميل". تحميل السقالات تجميعها من الخطوة 10. بمجرد تحميل الملفات، انقر على "إرسال" واتبع التعليمات وينتظر الانتهاء من التحليل. بعد التحليل الكامل، الاطلاع على الرابط إرسالها عبر متزعج من MG-راست، أو بدلا من ذلك، انقر على "التقدم". وهناك قائمة من المهام المكتملة. انقر على هوية المهمة ذات الصلة ومن ثم على وصلة إلى "صفحة التحميل". على صفحة التحميل، تحت عنوان "البروتين تجميع 90٪"، انقر على زر البروتين لتحميل الملف البروتين وتوقع، 550.cluster.aa90.faa. لتصنيف البروتينات التي تنتمي كما مزعومة لCAZy الطبقة انزيم معين، مقارنة البروتينات تحميلها على قاعدة البيانات CAZy 48. تحميل قاعدة البيانات الانزيمات الكربوهيدرات النشطة (CAZy) من الملفات هي: AA.zip، CE.zip، GH.zip، GT.zip وPL.zip. وتمثل هذه الملفات الطبقات انزيم التالية على التوالي: الأنشطة المساعدة (AA)، الكربوهيدرات المونوأمينوأوكسيداز (CE)، غليكوزيدات هيدروليز (GH)، غليكوزيل ترانسفيراز (GT) والسكاريد Lyases (PL). بفك ملفات قاعدة البيانات وتعليم البروتينات عن طريق تحديد التشابه البروتين البروتينات قاعدة بيانات CAZy باستخدام algor USEARCH UBLASTithm 49. لاستخدام حلقة باش (لأنني في * النص) لتكرار خلال قاعدة البيانات 5 ملفات .txt نوع "لأنني في *. TXT، هل". تشغيل USEARCH عن طريق كتابة / مسار لملف / usearch8 مع -ublast المعلمة لاستخدام خوارزمية ublast. ثم اكتب في اسم الملف تسلسل البروتين تحميلها من MG-راست، "mgmXXXXXX.3.550.cluster.aa90.faa". للإشارة إلى ملف قاعدة بيانات لاستخدامها نوع "-db $ ط" وتحديد عتبة قيمة E في 1E -5، اكتب "-evalue 1E-5". لإنهاء البحث بعد اكتشاف تسلسل الهدف، وبالتالي تصنيف هذا التسلسل البروتين أنها تنتمي إلى فئة انزيم الهدف، على سبيل المثال GH، اكتب "-masaccepts 1". لتحديد ذلك 16 وحدات المعالجة المركزية يجب استخدام نوع "-threads 16" وتحدد شكل ملف الإخراج كنوع النص "-blast6out" مفصولة عتاب. لتحديد نوع ملف الإخراج "$ i.ublast". لإنهاء حلقة باش، ريب] "، يجري" لأنني في *. TXT. تفعل / مسار لملف / usearch8 -ublast ../mgmXXXXXX.3.550.cluster.aa90.faa -db $ ط -evalue 1E-5 -maxaccepts 1 -threads 16 -blast6out i.ublast $. فعله 14. تصور CAZy الشرح لتصور الإخراج من الشرح CAZy كما رسم تخطيطي لفين، وتوليد قوائم معرف البروتين لكل فئة الإنزيم باستخدام حلقة باش. نوع "لأنني في * .ublast، هل". لنقل العمود 1 من ملف الإخراج وإلى ملف جديد، اكتب "القط $ ط | قطع -f 1> $ i.list". إنهاء حلقة ونوع؛ "القيام به". فتح ملفات .list في محرر النص. انتقل إلى موقع ويب، حدد عدد من مجموعات الى 5 ولصق محتوى كل ملف القائمة في مربع منفصل. تحميل الرسم البياني الناتج كملف .SVG. لأنني في * .ublast. القيام القط $ ط | قطع -f 1> $ i.list. فعله

Representative Results

قبل تجهيزها بيوينفورمتيك، تسلسل الخام يقرأ وقلص وأزيلت محولات باستخدام برنامج Trimmomatic 28. بعد خطوة وتقليم وتصفية، وعدد من يقرأ تم تخفيضها إلى 50٪ من تسلسل يقرأ (الجدول 1). وكان متوسط النقاط الأساسية PHRED> 30 بعد مراقبة الجودة (الشكل 2). أزواج من تسلسل الحمض النووي الذي كان تم دمج مناطق متداخلة باستخدام برنامج فلاش 29 لتوليد يعد احد يقرأ، غير متداخلة يقرأ تم الاحتفاظ بها في ملف منفصل. يقرأ 45.47٪ (105343) جنبا إلى جنب بنجاح. بعد تداخل من يقرأ باستخدام FLASH من يقرأ، شظايا بمد الناتجة خضعت تصنيف التصنيفية البكتيرية باستخدام برنامج كراكن 7 وكانت تصور في وقت لاحق مع برنامج الكرونا (الشكل 3). <p class="jove_content" fo:keep-together. في غضون الصفحات = "1"> تم العثور على معظم الأنواع البكتيرية الموجودة في metagenome السيلاج خلال 4 من الكائنات الحية في بدائيات النواة: افيرميكوتس (34٪)، شعاويات (28٪)، متقلبات (27٪) وعصوانيات (7٪) . يمكن أن ينظر إلى توزيع الطبقات موجودة داخل هذه الشعب في الشكل (4). كانت الأنواع الأكثر وفرة في metagenome الملبنة النيابة. (24٪، افيرميكوتس)، الوتدية النيابة. (8٪، شعاويات)، بروبيونيباكتيريوم النيابة. (3٪، شعاويات) وPrevotella النيابة. (3٪، عصوانيات). وقد لوحظت أيضا الأنواع الهامة لصحة الحيوان والمتورطين في المرض؛ كلوستريديوم النيابة. (1٪) عصية النيابة. (0.6٪)، الليسترية. ويتوقع أن تكون موجودة في عينة السيلاج (0.2٪). تم تنفيذ الشرح وظيفية على تجميعها يقرأ. تم تجميع metagenome باستخدام المجمع البستوني 30 باستخدام قطع وتصفيتهاإقران نهاية وأونبايريد يقرأ توليد 92284 السقالات. من أجل تحديد السليلوزات، وتوقع البروتينات باستخدام MG-راست وشرحها باستخدام قاعدة بيانات الانزيمات الكربوهيدرات النشطة (CAZy). من البروتينات توقع 97562، والمشروح 6357 كما انزيم المفترض الكربوهيدرات الفعالة في واحدة من الانزيمات الطبقات الخمس التي تشكل قاعدة بيانات CAZy (الشكل 5). وتصور النتائج بمثابة مخطط فين باستخدام برنامج InteractiVenn 50 تبين توزيع الشروح البروتين بما في ذلك تلك التي تحتوي على أكثر من CAZy الطبقة انزيم الشرح. من هؤلاء، كان من المتوقع أن يكون 3861 النشاط هيدرولاز الأنتراكينون والتي سيتواصل تميزت في المختبر للتأكد من وظيفة. الشكل 1: بيوينفورمتيك Metagenomics خط أنابيب لتحليل الأعلاف. كانت نهجين رئيسيينتستخدم للتحقيق في microbiome من السيلاج، تصنيف التصنيف والشرح وظيفية. الرجاء انقر هنا لعرض نسخة أكبر من هذا الرقم. الشكل 2: تسلسل الجودة لكل قاعدة قبل وبعد التشذيب وإزالة محول. تسلسل جودة مؤامرة لكل قاعدة من FASTQC يبين متوسط ​​درجة PHRED عبر طول تسلسل يقرأ السيطرة قبل وبعد الجودة. الرجاء انقر هنا لعرض نسخة أكبر من هذا الرقم. الشكل (3): التصنيفي Classificaنشوئها من البكتيرية Microbiome من السيلاج الصلبة. تصنيف تسلسل قلصت وتداخل يقرأ من تم تنفيذ FLASH باستخدام كراكن 7 و تصور في وقت لاحق مع الكرونا. الرجاء انقر هنا لعرض نسخة أكبر من هذا الرقم. الشكل 4: توزيع الفئة التصنيفية للمن الكائنات الحية 4 الأكثر وفرة في البكتيرية Microbiome من السيلاج الصلبة. نسبة كل فئة من البكتيريا داخل من الكائنات الحية الأربعة الأكثر وفرة. افيرميكوتس: المطثيات (الحمراء)، والعصيات (الأزرق الداكن)؛ متقلبات: دلتا / إبسيلون (وردي)، ألفا (شاحب اللون الأزرق) وغاما (برتقالي) وبيتا (الفيروز)؛ عصوانيات: Flavobacteriia (الأزرق الداكن) وBacteroidia(أخضر باهت)؛ شعاويات: Coriobacteriia (الأرجواني الداكن) وغيرها من شعاويات (الأخضر الداكن). الرجاء انقر هنا لعرض نسخة أكبر من هذا الرقم. الرقم 5: CAZy الشرح للبروتيوم توقع في صلب علف Microbiome. فين رسم بياني يوضح توزيع الطبقات انزيم خمسة من الشروح CAZy في بروتيوم توقع من microbiome السيلاج الصلبة. الرجاء انقر هنا لعرض نسخة أكبر من هذا الرقم. يقرأ # الخام # المصفاة يقرأ (الاقتران) </td> يقرأ # المصفاة # تومض يقرأ (الاقتران) (المفردة) 2374949 X2 231679 X2 1892534 105343 الجدول 1: يقرأ جدول ملخص التسلسل.

Discussion

في حين أن في تحليل SILICO يمكن أن تعطي فكرة ممتازة إلى المجتمعات الميكروبية التي تكون موجودة ضمن العينات البيئية، فمن الأهمية بمكان أن التصنيفات التصنيفية أظهرت أن يقوم بالتعاون مع الضوابط ذات الصلة والتي تم التوصل إلى عمق مناسب من تسلسل للقبض على كامل السكان الحالي 51.

مع أي تحليل الحسابية، وهناك العديد من الطرق لتحقيق هدف مماثل. الأساليب التي استخدمناها في هذه الدراسة هي أمثلة على أساليب مناسبة وواضحة، والتي تم عرضها معا لتحقيق مجموعة من التحليلات على microbiome السيلاج. وهناك مجموعة متنوعة وعدد متزايد من الأدوات والتقنيات المعلوماتية الحيوية المتاحة لتحليل البيانات metagenomic، على سبيل المثال Phylosift 8 و MetaPhlAn2 52، وهذه يجب أن يتم تقييم مسبق للتحقيق لأهميتها بالنسبة للعينة ومسا تحليلuired 53. تقتصر أساليب التحليل Metagenomic من قواعد البيانات الخاصة متاحة للتصنيف، وعمق التسلسل ونوعية التسلسل.

تم إجراء معالجة بيوينفورمتيك تظاهر هنا على، آلة تعمل بالطاقة العالية المحلية؛ ومع ذلك النظم القائمة على السحابة وتتوفر أيضا. هذه الخدمات المستندة إلى سحابة تسمح لاستئجار الطاقة الحسابية اللازمة دون الحاجة للاستثمار عالية التكلفة لمحطة العمل المحلية قوية مناسبة. ومن شأن التطبيق المحتمل لهذه الطريقة هو تقييم السيلاج قبل استخدامه في الزراعة لضمان عدم وجود البكتيريا الضارة المحتملة موجودة وبالتالي منعهم من دخول السلسلة الغذائية.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Authors would like to thank Andrew Bird for the silage samples and Audrey Farbos of the Exeter Sequencing Service for her assistance in preparing DNA sequencing libraries. Exeter Sequencing Service and Computational core facilities at the University of Exeter. Medical Research Council Clinical Infrastructure award (MR/M008924/1). Wellcome Trust Institutional Strategic Support Fund (WT097835MF), Wellcome Trust Multi User Equipment Award (WT101650MA) and BBSRC LOLA award (BB/K003240/1).

Materials

FastDNA SPIN Kit for Soil MP Bio 116560200 DNA Extraction
DNA FastPrep MP Bio 116004500 DNA Extraction
Agencourt AMPure XP beads Beckman Coulter A63880 DNA Purification
Elution Buffer Qiagen 19806 DNA Purification
Qubit Fluorometer Thermo Fisher Q33216 DNA Quantification
Qubit dsDNA HS Assay Kit Thermo Fisher Q32854 DNA Quantification
Nextera XT DNA Library Prep Kit Illumina FC-131-1024 Library Preparation
Nextera XT Index Kit Illumina FC-131-1001 Library Preparation
TapeStation 2200 Agilent G2964AA DNA Quantification
HS D100 ScreenTape Agilent 5067-5584 DNA Quantification
HS D100 ScreenTape Reagents Agilent 5067-5585 DNA Quantification
TapeStation Tips Agilent 5067-5153 DNA Quantification
TapeStation Tubes Agilent 401428 and 401425 DNA Quantification
HiSeq 2500 Illumina DNA Sequencing – provided by a sequencing service
High Power Analysis Workstation Various Local or cloud based, user preferred system

References

  1. Riesenfeld, C. S., Schloss, P. D., Handelsman, J. Metagenomics: genomic analysis of microbial communities. Annu. Rev. Genet. 38 (1), 525-552 (2004).
  2. Amann, R. I., Ludwig, W., Schleifer, K. H. Phylogenetic identification and in situ detection of individual microbial cells without cultivation. Microbiol. Rev. 59 (1), 143-169 (1995).
  3. Human Microbiome Project Consortium. Structure, function and diversity of the healthy human microbiome. Nature. 486 (7402), 207-214 (2012).
  4. Venter, J. C., et al. Environmental genome shotgun sequencing of the Sargasso Sea. Science. 304 (5667), 66-74 (2004).
  5. Vilanova, C., Iglesias, A., Porcar, M. The coffee-machine bacteriome: biodiversity and colonisation of the wasted coffee tray leach. Sci. Rep. 5, 17163 (2015).
  6. Hayden, E. C. Technology: The $1,000 genome. Nature. 507 (7492), 294-295 (2014).
  7. Wood, D. E., Salzberg, S. L. Kraken: ultrafast metagenomic sequence classification using exact alignments. Gen. Biol. 15 (3), 46 (2014).
  8. Darling, A. E., et al. PhyloSift: phylogenetic analysis of genomes and metagenomes. PeerJ. 2 (12), 243 (2014).
  9. Buchfink, B., Xie, C., Huson, D. H. Fast and sensitive protein alignment using DIAMOND. Nat. Meth. 12 (1), 59-60 (2015).
  10. Moreno-Hagelsieb, G., Hudy-Yuffa, B. Estimating overannotation across prokaryotic genomes using BLAST+, UBLAST, LAST and BLAT. BMC Res Notes. 7 (1), 651 (2014).
  11. Hauser, M., Steinegger, M., Söding, J. MMseqs software suite for fast and deep clustering and searching of large protein sequence sets. Bioinf. 32 (9), 1323-1330 (2016).
  12. Ondov, B. D., Bergman, N. H., Phillippy, A. M. Interactive metagenomic visualization in a Web browser. BMC Bioinf. 12, (2011).
  13. Kolde, R., Vilo, J. GOsummaries: an R Package for Visual Functional Annotation of Experimental Data. F1000Res. 4, 574 (2015).
  14. Reddy, T. B. K., et al. The Genomes OnLine Database (GOLD) v.5: a metadata management system based on a four level (meta)genome project classification. Nuc. Aci. Res. 43 (1), 1099-1106 (2015).
  15. Camacho, C., et al. BLAST+: architecture and applications. BMC Bioinf. 10 (1), 421 (2009).
  16. Chakravorty, S., Helb, D., Burday, M., Connell, N., Alland, D. A detailed analysis of 16S ribosomal RNA gene segments for the diagnosis of pathogenic bacteria. J. Micro. Met. 69 (2), 330-339 (2007).
  17. Fadrosh, D. W., et al. An improved dual-indexing approach for multiplexed 16S rRNA gene sequencing on the Illumina MiSeq platform. Microbiome. 2 (1), 6 (2014).
  18. Mikheyev, A. S., Tin, M. M. Y. A first look at the Oxford Nanopore MinION sequencer. Molecular Ecology Resources. 14 (6), 1097-1102 (2014).
  19. Schadt, E. E., Turner, S., Kasarskis, A. A window into third generation sequencing. Hum. Mol. Genet. 20 (4), 853-853 (2011).
  20. Shapiro, B., Hofreiter, M. A Paleogenomic Perspective on Evolution and Gene Function: New Insights from Ancient DNA. Science. 343 (6169), 1236573 (2014).
  21. Der Sarkissian, C., et al. Ancient genomics. Phil. Trans. R. Soc. B. 370 (1660), (2015).
  22. Patin, N. V., Kunin, V., Lidström, U., Ashby, M. N. Effects of OTU Clustering and PCR Artifacts on Microbial Diversity Estimates. Microb Ecol. 65 (3), 709-719 (2013).
  23. McInroy, G. R., Raiber, E. -. A., Balasubramanian, S. Chemical biology of genomic DNA: minimizing PCR bias. Chem. Commun. 50 (81), 12047-12049 (2014).
  24. Aller, P., Rould, M. A., Hogg, M., Wallace, S. S., Doublié, S. A structural rationale for stalling of a replicative DNA polymerase at the most common oxidative thymine lesion, thymine glycol. Proc. Natl. Acad. Sci. U.S.A. 104 (3), 814-818 (2007).
  25. Ranjan, R., Rani, A., Metwally, A., McGee, H. S., Perkins, D. L. Analysis of the microbiome: Advantages of whole genome shotgun versus 16S amplicon sequencing. Biochem. Biophys. Res. Commun. 469 (4), 967-977 (2016).
  26. Sims, D., Sudbery, I., Ilott, N. E., Heger, A., Ponting, C. P. Sequencing depth and coverage: key considerations in genomic analyses. Nat Rev Genet. 15 (2), 121-132 (2014).
  27. Li, X., Rao, S., Wang, Y., Gong, B. Gene mining: a novel and powerful ensemble decision approach to hunting for disease genes using microarray expression profiling. Nuc. Aci. Res. 32 (9), 2685-2694 (2004).
  28. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinf. 30 (15), 2114-2120 (2014).
  29. Magoc, T., Salzberg, S. L. FLASH: fast length adjustment of short reads to improve genome assemblies. Bioinf. 27 (21), 2957-2963 (2011).
  30. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. J. Comput. Biol. 19 (5), 455-477 (2012).
  31. Nurk, S., Meleshko, D., Korobeynikov, A. . metaSPAdes: a new versatile de novo metagenomics assembler. , (2016).
  32. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215 (3), 403-410 (1990).
  33. Tanaseichuk, O., Borneman, J., Jiang, T. Phylogeny-based classification of microbial communities. Bioinf. 30 (4), 449-456 (2014).
  34. Bose, T., Haque, M. M., Reddy, C., Mande, S. S. COGNIZER: A Framework for Functional Annotation of Metagenomic Datasets. PLoS ONE. 10 (11), 0142102 (2015).
  35. Sharma, A. K., Gupta, A., Kumar, S., Dhakan, D. B., Sharma, V. K. Woods: A fast and accurate functional annotator and classifier of genomic and metagenomic sequences. Genomics. 106 (1), 1-6 (2015).
  36. Eikmeyer, F. G., et al. Metagenome analyses reveal the influence of the inoculant Lactobacillus buchneri CD034 on the microbial community involved in grass ensiling. J. Biotech. 167 (3), 334-343 (2013).
  37. Driehuis, F., Elferink, S. J. W. H. O. The impact of the quality of silage on animal health and food safety: A review. Vet. Quart. 22 (4), 212-216 (2000).
  38. Dunière, L., Sindou, J., Chaucheyras-Durand, F., Chevallier, I., Thévenot-Sergentet, D. Silage processing and strategies to prevent persistence of undesirable microorganisms. Anim Feed Sci Technol. 182 (1-4), 1-15 (2013).
  39. Vissers, M. M. M., et al. Minimizing the Level of Butyric Acid Bacteria Spores in Farm Tank Milk. J. of Dairy Sci. 90 (7), 3278-3285 (2007).
  40. Te Giffel, M. C., Wagendorp, A., Herrewegh, A. Bacterial spores in silage and raw milk. Antonie van. , (2002).
  41. Wiedmann, M. ADSA Foundation Scholar Award-An Integrated Science-Based Approach to Dairy Food Safety: Listeria monocytogenes as a Model System. J. of Dairy Sci. 86 (6), 1865-1875 (2003).
  42. Low, J. C., Donachie, W. A review of Listeria monocytogenes and listeriosis. Vet J. 153 (1), 9-29 (1997).
  43. Schoder, D., Melzner, D., Schmalwieser, A. Important vectors for Listeria monocytogenes transmission at farm dairies manufacturing fresh sheep and goat cheese from raw. J.Food. , (2011).
  44. Lindström, M., Myllykoski, J., Sivelä, S., Korkeala, H. Clostridium botulinumin Cattle and Dairy Products. Crit. Rev. Food Sci. Nutr. 50 (4), 281-304 (2010).
  45. Bentley, D. R., et al. Accurate whole human genome sequencing using reversible terminator chemistry. Nature. 456 (7218), 53-59 (2008).
  46. Andrews, S. . Babraham Bioinformatic- FastQC: A Quality Control tool for High Throughput Sequence Data. , (2015).
  47. Keegan, K. P., Glass, E. M., Meyer, F. FMG-RAST, a Metagenomics Service for Analysis of Microbial Community Structure and Function. Methods Mol. Biol. 1399, 207-233 (2016).
  48. Cantarel, B. L., et al. The Carbohydrate-Active EnZymes database (CAZy): an expert resource for Glycogenomics. Nuc. Aci. Res. 37, 233-238 (2009).
  49. Edgar, R. C. Search and clustering orders of magnitude faster than BLAST. Bioinf. 26 (19), 2460-2461 (2010).
  50. Heberle, H., et al. InteractiVenn: a web-based tool for the analysis of sets through Venn diagrams. BMC Bioinf. 16 (1), 213 (2015).
  51. Ni, J., Yan, Q., Yu, Y. How much metagenomic sequencing is enough to achieve a given goal. Sci. Rep. 3, 1968 (2013).
  52. Truong, D. T., et al. MetaPhlAn2 for enhanced metagenomic taxonomic profiling. Nat. Meth. 12 (10), 902-903 (2015).
  53. Oulas, A., et al. Metagenomics: tools and insights for analyzing next-generation sequencing data derived from biodiversity studies. Bioinform Biol Insights. 9 (9), 75-88 (2015).

Play Video

Cite This Article
Tennant, R. K., Sambles, C. M., Diffey, G. E., Moore, K. A., Love, J. Metagenomic Analysis of Silage. J. Vis. Exp. (119), e54936, doi:10.3791/54936 (2017).

View Video