Summary

جمعية الجينوم الهجين دي نوفو لتوليد الجينوم الكامل للبكتيريا البولية باستخدام تقنيات التسلسل قصيرة وطويلة القراءة

Published: August 20, 2021
doi:

Summary

هذا البروتوكول تفاصيل نهج شامل لزراعة وتسلسل، ودي نوفو تجميع الجينوم الهجين من البكتيريا البولية. وهو يوفر إجراء قابل للتكرار لتوليد تسلسلات الجينوم الدائرية الكاملة المفيدة في دراسة كل من العناصر الوراثية الكروموسومية وخارج الكروموسومية التي تساهم في استعمار المسالك البولية، والتسبب في الإمراض، ونشر مقاومة مضادات الميكروبات.

Abstract

توفر تسلسلات الجينوم الكاملة بيانات قيمة لفهم التنوع الوراثي وعوامل الاستعمار الفريدة للميكروبات البولية. وقد تشمل هذه البيانات العناصر الوراثية المتنقلة، مثل البلازميدات والفياج خارج الكروموسومات، التي تسهم في نشر مقاومة مضادات الميكروبات وتزيد من تعقيد علاج عدوى المسالك البولية. بالإضافة إلى توفير دقة في بنية الجينوم ، تسمح الجينومات الكاملة والمغلقة بالجينوم المقارن التفصيلي والتحليلات التطورية. لطالما كان توليد الجينوم الكامل مهمة صعبة بسبب القيود المفروضة على تكنولوجيا التسلسل المتاحة. ينتج تسلسل الجيل التالي المقترن (NGS) قراءات قصيرة عالية الجودة غالبا ما تؤدي إلى تجميعات جينوم دقيقة ولكنها مجزأة. على العكس من ذلك ، يوفر تسلسل Nanopore قراءات طويلة من جودة أقل مما يؤدي عادة إلى تجميعات كاملة عرضة للخطأ. وقد تعوق هذه الأخطاء دراسات الارتباط على نطاق الجينوم أو توفر نتائج تحليل متغيرة مضللة. لذلك ، ظهرت النهج الهجينة التي تجمع بين القراءات القصيرة والطويلة كطرق موثوقة لتحقيق الجينوم البكتيري المغلق عالي الدقة. وذكرت هنا هو وسيلة شاملة لثقافة البكتيريا البولية المتنوعة، وتحديد الأنواع من قبل تسلسل الجينات 16S rRNA، واستخراج الحمض النووي الجينومي (gDNA)، وتوليد قراءات قصيرة وطويلة من قبل منصات NGS وNanopore، على التوالي. بالإضافة إلى ذلك، تصف هذه الطريقة خط أنابيب المعلوماتية الحيوية من خوارزميات مراقبة الجودة والتجميع والتنبؤ الجيني لتوليد تسلسل الجينوم الكامل المشروح. مزيج من الأدوات المعلوماتية الحيوية تمكن من اختيار بيانات القراءة عالية الجودة لتجميع الجينوم الهجين وتحليل المصب. ويمكن تكييف النهج المبسط لتجميع الجينوم الهجين دي نوفو الموصوفة في هذا البروتوكول للاستخدام في أي بكتيريا قابلة للتكتل.

Introduction

الميكروبيوم البولي هو مجال ناشئ من الأبحاث التي حطمت الاعتقاد الخاطئ لعقود طويلة بأن المسالك البولية معقمة في الأفراد الأصحاء. أعضاء الميكروبات البولية قد تعمل على تحقيق التوازن بين البيئة البولية ومنع عدوى المسالك البولية (UTI)1،2. البكتيريا المسالك البولية تغزو المسالك البولية وتستخدم آليات ضراوة متنوعة لإزاحة الميكروبات المقيمة ، واستعمار المسالك البولية ، والتهرب من الاستجابات المناعية ومواجهة الضغوط البيئية3،4. البول هو وسيلة محدودة نسبيا المغذيات تتميز ارتفاع osmolarity، النيتروجين محدودة وتوافر الكربوهيدرات، وانخفاض الأوكسجين، وانخفاض درجة الحموضة5،6،7. ويعتبر البول أيضا أن تكون مضادات الميكروبات, تتألف من تركيزات عالية من اليوريا المثبطة والببتيدات المضادة للميكروبات مثل cathelicidin الإنسان LL-378. آليات التحقيق المستخدمة من قبل كل من البكتيريا المقيمة وuropathogens لاستعمار المسالك البولية أمر بالغ الأهمية لزيادة فهم صحة المسالك البولية ووضع استراتيجيات جديدة لعلاج التهاب المسالك البولية. وعلاوة على ذلك، مع فشل العلاجات المضادة للميكروبات في الخط الأمامي يصبح أكثر شيوعا، من المهم على نحو متزايد لرصد نشر العناصر الوراثية المتنقلة التي تحمل محددات مقاومة مضادات الميكروبات داخل مجموعات من البكتيريا البولية9،10.

للتحقيق في الأنماط الجينية والأنماط الظاهرية للبكتيريا البولية ، فإن ثقافتهم الناجحة وتسلسل الجينوم الكامل اللاحق (WGS) أمر حتمي. الطرق المعتمدة على الثقافة ضرورية للكشف عن الميكروبات القابلة للحياة وتحديدها في عينات البول11. ثقافة البول السريرية القياسية ينطوي على طلاء البول على 5٪ أجار دم الأغنام (BAP) وMacConkey أجار واحتضان هوائيا في 35 درجة مئوية لمدة 24 ساعة12. ومع ذلك، مع عتبة الكشف عن ≥105 CFU/mL13،لا يتم الإبلاغ عن العديد من أعضاء الميكروبات البولية من خلال هذه الطريقة. تقنيات زراعة المخدرات المحسنة مثل تعزيز ثقافة البول الكمي (EQUC)11 تستخدم مجموعات مختلفة من أحجام البول المختلفة ، وأوقات الحضانة ، ووسائل الإعلام الثقافية ، والظروف الجوية لتحديد الميكروبات التي تفتقدها عادة ثقافة البول القياسية. وصف في هذا البروتوكول هو نسخة معدلة من EQUC, يطلق عليها هنا تعديل تعزيز بروتوكول ثقافة البول, التي تمكن من زراعة البكتيريا البولية المتنوعة وuropathogens باستخدام وسائل الإعلام الانتقائية والظروف الجوية المثلى ولكن ليس كميا بطبيعتها. العزل الناجح للبكتيريا البولية تمكن من استخراج الحمض النووي الجينومي (gDNA) لWGS المصب وجمع الجينوم.

تمكن تجميعات الجينوم ، والتجميعات الكاملة على وجه الخصوص ، من اكتشاف العوامل الوراثية التي قد تساهم في الاستعمار ، والصيانة المتخصصة ، والفوعة بين كل من البكتيريا الدقيقة والبكتيريا الوروباتشيكية المقيمة. تحتوي تجميعات الجينوم المسودة على عدد متنوع من التسلسلات المتجاورة (المتجاورة) التي قد تحتوي على أخطاء تسلسلية وتفتقر إلى معلومات التوجيه. في تجميع الجينوم كاملة، وقد تم التحقق من كل من التوجه ودقة كل زوج قاعدة14. وعلاوة على ذلك، فإن الحصول على تسلسل الجينوم الكامل يوفر نظرة ثاقبة في بنية الجينوم والتنوع الوراثي والعناصر الوراثية المتنقلة15. قراءات قصيرة وحدها قد تحدد وجود أو عدم وجود جينات هامة ولكن قد لا تحدد سياقها الجينومي16. مع تمكين تقنيات التسلسل طويلة القراءة مثل أكسفورد Nanopore وPacBio ، وتوليد مغلقة دي نوفو تجميعات الجينوم البكتيري لم يعد يتطلب أساليب مضنية مثل إغلاق يدوي للتجمعات دي نوفو من قبل PCRمتعددة 17،18. مزيج من الجيل القادم قصيرة القراءة التسلسل وNanopore تقنيات تسلسل القراءة الطويلة يسمح للجيل سهل من دقيقة وكاملة ومغلقة جمعيات الجينوم البكتيرية بتكاليف منخفضة نسبيا19. تسلسل القراءة القصيرة تنتج دقيقة بعد تجميعات الجينوم مجزأة تتكون عموما من متوسط 40-100 المتجاورة، في حين أن تسلسل Nanopore يولد قراءات طويلة من حوالي 5-100 كيلو بايت في الطول التي هي أقل دقة ولكن يمكن أن تكون بمثابة سقالات للانضمام إلى المتجاورة وحل سينتيني الجينوم. يمكن أن تنتج النهج الهجينة التي تستخدم تقنيات القراءة القصيرة والقراءة الطويلة الجينوم البكتيري الدقيق والكامل19.

وصف هنا هو بروتوكول شامل لعزل وتحديد البكتيريا من البول البشري، واستخراج الحمض النووي الجينوم، والتسلسل، وتجميع الجينوم كاملة باستخدام نهج التجميع الهجين. يوفر هذا البروتوكول تركيزا خاصا على الخطوات اللازمة لتعديل القراءات الناتجة عن التسلسل قصير القراءة والقراءة الطويلة بشكل صحيح للتجميع الدقيق للكروموسوم البكتيري المغلق والعناصر خارج الكروموسومات مثل البلازميدات.

Protocol

تم زراعة البكتيريا من البول الذي تم جمعه من النساء بالتراضي كجزء من الدراسات المعتمدة من مجلس المراجعة المؤسسية 19MR0011 (UTD) وS STU 032016-006 (UTSW). 1. تعديل تعزيز ثقافة البول ملاحظة: يجب تنفيذ كافة الخطوات الثقافية في ظل ظروف معقمة. تعقيم جميع الأدوات والحلول ووسائل الإعلام. تنظيف منطقة العمل مع الإيثانول 70٪، ثم إعداد الموقد بونسن والعمل بعناية على مقربة من اللهب للحد من فرص التلوث. وبالتناوب، يمكن استخدام خزانة السلامة البيولوجية من الفئة الثانية للحفاظ على بيئة معقمة. ارتداء معدات الحماية الشخصية المناسبة (PPE) لتجنب التعرض للميكروبات المسببة للأمراض المحتملة. طلاء البول الجلسرين مخزنة وعزل مستعمرة إذابة البول المجهز بالجلسرين في درجة حرارة الغرفة (RT). مرة واحدة إذابة، دوامة العينة لمدة 5 ق لخلط. في أنابيب الطرد المركزي الدقيق المعقمة، قم بإعداد 1:3 و 1:30 تمييع البول في محلول ملحي معقم 1x الفوسفات العازل (PBS) إلى حجم نهائي قدره 100 ميكرولتر.ملاحظة: يتم إعداد البول الجلسرين المخزنة عن طريق خلط 500 ميكرولتر من البول غير المخفف و 500 ميكرولتر من 50٪ الجلسرين المعقم في cryovials وتخزينها في -80 درجة مئوية. لوحات أجار قبل الحارة في 37 درجة مئوية لمدة 15 دقيقة قبل الاستخدام. يرجى الاطلاع على الشكل 1 لأنواع الوسائط وظروف الثقافة المناسبة للأجناس البكتيرية البولية الشائعة. خلط البول المخفف جيدا عن طريق pipetting قبل الطلاء، لوحة 100 μL من البول المخفف على لوحة أجار المطلوب ونشر العينة باستخدام الخرز الزجاج العقيم. لوحة 100 ميكرولتر من 1x برنامج تلفزيوني diluent على لوحة منفصلة كما لا تحكم النمو.ملاحظة: إذا كان محاولة زراعة الأنواع الشائعة المسالك البولية (على سبيل المثال، إشريكيا القولونية، كليبسيلا spp.، Enterococcus faecalis، الخ)، فمن المستحسن استخدام أجار كروموجينيك (جدول المواد) كما أنه يسمح بسهولة تحديد الأنواع البكتيرية المسالك البولية(الشكل 1). حمض Colistin Nalidixic (CNA) أو MRS agar مفيدة لعزل الأنواع الإيجابية للجرام (على سبيل المثال ، Lactobacillus spp.) من البول المعروف أنه يحتوي على الاوروباتوغنز السلبي للجرام ، والذي قد يتفوق على الأنواع السريعة في أجار غير انتقائية. احتضان لوحة مقلوب في حالة الغلاف الجوي المطلوب في 35 درجة مئوية لمدة 24 ساعة لuropathogens و 3-5 أيام للبكتيريا fastidious (الشكل 1). بعد فترة الحضانة، قم بإزالة الصفائح من الحاضنة. من كل لوحة، اختر المستعمرات التي تظهر لونا فريدا أو مورفولوجيا أو أنماط انحللية. إعادة خط مستعمرة بكتيرية باستخدام حلقة معقمة على أجار المقابلة واحتضان لوحة مقلوب لمدة 2-5 أيام في الغلاف الجوي المطلوب للحصول على مستعمرات معزولة جيدا.ملاحظة: إذا كان استخدام BAP للثقافة الأولية، قد الترقيع المستعمرات على أجار الكروموجينيك توفر معلومات مفيدة حول عدم التجانس من السكان البكتيرية في العينة. زراعة في مرق السائل والجلسرين تخزين البكتيرية يعزل بمجرد الحصول على المستعمرات المعزولة التي تتطابق مع مورفولوجيا المستعمرة الأم ، اختر مستعمرة واحدة وتلقيحها في 3 مل من مرق السائل باستخدام حلقة تلقيح معقمة. الرجوع إلى الشكل 1 للمرق قادرة على دعم نمو أجناس الميكروبات البولية المشتركة. ختم لوحات أجار مع البارافيلم وتخزينها في 4 درجة مئوية لمدة 2-4 أيام. احتضان الثقافات السائلة في الظروف الجوية المرغوبة لمدة 1-5 أيام حتى تكون الثقافة عكرة بشكل واضح. بعد أن لوحظ النمو, دوامة الثقافة, ومن ثم إضافة 1 مل من الثقافة بين عشية وضحاها إلى 500 ميكرولتر من العقيمة 50٪ الجلسيرول في 2 مل cryovial; ختم ومزيج بلطف عن طريق عكس. إعداد اثنين من مخزون الجلسرين لكل مستعمرة (واحد بمثابة نسخة احتياطية) وتخزينها في -80 درجة مئوية. 2. تحديد الأنواع البكتيرية من قبل 16S rRNA جين سانجر التسلسل ملاحظة: يمكن تأكيد الهوية الميكروبية بدلا من ذلك باستخدام الليزر بمساعدة مصفوفة Desorption وقت تأين قياس الطيف كتلة الطيران (MALDI-TOF)20. سلسلة تفاعل Colony-Polymerase المتسلسلة (PCR) إعداد 25 ميكرولتر من تفاعل PCR في أنابيب PCR بإضافة 12.5 ميكرولتر من 2x Taq Polymerase ماستر ميكس، 0.5 ميكرولتر من 10 ميكرومتر 8F التمهيدي، 0.5 ميكرولتر من 10 ميكرومتر 1492R التمهيدي(جدول المواد)،و 11.5 ميكرولتر من المياه الخالية من النيوكليز21.ملاحظة: إذا كان أداء PCR لعينات متعددة، وجعل مزيج رد فعل رئيسي من مزيج Taq بوليمراز، التمهيديات، والمياه الخالية من النيوكليز العقيمة. ثم aliquot 25 ميكرولتر في كل أنبوب PCR. لأداء مستعمرة PCR، انتقد مستعمرة معزولة جيدا من إعادة خط باستخدام مسواك معقمة أو تلميح ماصة. Resuspend المستعمرة في مزيج رد فعل PCR أعدت في الخطوة 2.1.1. مزيج بلطف. جمع السائل في الجزء السفلي من الأنبوب عن طريق تدور سريعة في 2000 x ز.ملاحظة: تأكد من خلو العينة من فقاعات الهواء. تضمين نموذج عنصر تحكم بلا قالب (NTC) يحتوي على مزيج تفاعل PCR وحده. ضع أنابيب العينة في المدور الحراري واركض البرنامج التالي: 95 درجة مئوية لمدة 3 دقائق؛ 40 دورة من: 95 درجة مئوية لمدة 30 s، 51 °C لمدة 30 s، و 72 °C لمدة 1 دقيقة 30 s؛ 72 درجة مئوية لمدة 10 دقائق؛ عقد عند 10 °C. استخراج الجل وتحديد الأنواع عند الانتهاء من تشغيل PCR، تحقق من المنتج PCR على هلام agarose 1٪ أعدت في 0.5x تريس بورات-EDTA (TBE) العازلة. قبل صب الجل، إضافة بروميد الإيثيديوم (EtBr). ثم، يلقي هلام باستخدام أمشاط لل آبار التي تحمل ما لا يقل عن 20 ميكرولتر حجم العينة.تنبيه: EtBr هو عامل تداخل يشتبه في أنه مسرطن. ارتدي دائما قفازات وPPE عند التعامل معها والتخلص من المواد التي تحتوي على EtBr وفقا لإرشادات المؤسسة. عندما يتم تعيين هلام، وضع هلام في خزان الكهربائي مليئة 0.5x TBE العازلة وإزالة المشط. تحميل سلم 1 كيلوبايت في البئر الأول و 10-20 ميكرولتر من تفاعل PCR في الآبار اللاحقة. تشغيل في 100-140 V حتى حلها. تصور هلام تحت ضوء الأشعة فوق البنفسجية وتأكيد وجود نطاق محدد بوضوح في ~ 1.5 كيلو بايت التي هي غائبة في بئر المجلس الانتقالي.تنبيه: الأشعة فوق البنفسجية ضارة بالجلد والعينين، استخدم حارسا مناسبا عند تصور الجل وارتداء معدات الوقاية الشخصية المناسبة.ملاحظة: قد تكون مستعمرة PCR غير ناجحة لبعض البكتيريا; المتابعة مع PCR من gDNA معزولة هو خيار بديل22. استئصال العصابات ~ 1.5 كيلو بايت باستخدام شفرة الحلاقة ونقل القطع هلام في أنابيب الطرد الدقيق نظيفة. المضي قدما في بروتوكول استخراج هلام وفقا لتعليمات الشركة المصنعة(جدول المواد). قياس تركيز الحمض النووي المنقى بواسطة مطياف ميكروفولوم.ملاحظة: من المستحسن التركيز >10 نانوغرام/ميكرولتر، و A260/280 بين 1.7-2.0 مقبول. إعداد اثنين من ردود الفعل تسلسل سانجر لكل عينة، واحدة باستخدام 8F والآخر باستخدام التمهيدي 1492R في المياه الخالية من النيوكليز وفقا للمبادئ التوجيهية لأي خدمة تسلسل سانجر المختار. بمجرد تلقي بيانات التسلسل ، قم بتحميل تسلسل الحمض النووي إلى موقع NCBI Basic Alignment Search Tool (BLAST) (blast.ncbi.nlm.nih.gov/Blast.cgi) ، واختر Nucleotide BLAST (blastn) ، وحدد قاعدة بيانات rRNA / ITS 16S تسلسل الحمض النووي الريبي الريبوسومي (البكتيريا والأرشايا) ، وتشغيل برنامج Megablast. يمكن التعرف على العزل بواسطة أعلى جودة ضرب إلى مرجع من قاعدة البيانات.ملاحظة: تظهر بعض الأنواع البكتيرية هوية عالية في تسلسلات rRNA 16S الخاصة بها وقد لا يمكن تمييزها عن طريق هذه الطريقة وحدها. سوف يتطلب التحليل تحليل الحمض النووي وتحليلات البيوكيميائية للتمييز بثقة أعضاء من نفس الجنس23. 3. استخراج الحمض النووي الجينومي (gDNA) ملاحظة: يستخدم هذا القسم الكواشف والأعمدة الدورانية المتوفرة في مجموعة الاستخراج gDNA المشار إليها في جدول المواد لاستخراج الغلة العالية للحمض النووي الجينومي عالي الجودة من الأنواع البكتيرية المتنوعة. فيما يلي التعديلات والتعليمات الموصى بها. إعداد الكواشف عدة لكل إرشادات الشركة المصنعة. إعداد 3-10 مل الثقافات في مرق العقيمة المناسبة (الشكل 1) عن طريق تلقيح البكتيريا من مستعمرات معزولة جيدا في وسائل الإعلام واحتضان في درجة الحرارة والضغط الجوي المشار إليها في الشكل 1 حتى لوحظ نمو كاف. بعد الحضانة، قياس الكثافة البصرية في 600 نانومتر (OD600)من الثقافة باستخدام مطياف24. إعداد العينة للقياس الكمي عن طريق تمييع الثقافات بين عشية وضحاها في نسبة 1:10. قم بتضمين فراغ من الوسائط الثقافية العقيمة للقياس أيضا. حساب الكثافة البصرية عن طريق طرح القراءة الفارغة من قراءة العينة والضرب بعامل التخفيف من عشرة. باستخدام قياس OD600 ونسبة OD600 إلى CFU/mL المحددة مسبقا للأنواع ، احسب عدد ملليلترات الاستزراع اللازمة للحصول على 2 × 109 خلايا. الطرد المركزي حجم الثقافة المطلوبة لمدة 5 دقائق في 5000 × ز إلى بيليه. يستنشق supernatant وإعادة إنفاق بيليه في 200 ميكرولتر العازلة TE الباردة (قبل البرد على الجليد في بداية الإجراء). الطرد المركزي العينة لمدة 2 دقيقة في 5000 x g. إزالة supernatant، ومن ثم resuspend بيليه في 180 ميكرولتر من العازلة تحلل الأنزيمية (ELB) وإضافة 20 ميكرولتر من RNase A المسلوقة مسبقا (10 ملغم / مل). للتحلل الفعال للبكتيريا إيجابية الغرام، إضافة 18 ميكرولتر من المتانولين (25 كيلوU/mL). دوامة جيدا، ومن ثم احتضان العينات في 37 درجة مئوية على الدوار لمدة 2 ساعة.ملاحظة: من المستحسن الاستفادة من ELB الموصوفة في بروتوكول الشركة المصنعة لكل من البكتيريا إيجابية الغرام وغرام سلبية. المضي قدما وفقا لتعليمات الشركة المصنعة.ملاحظة: كرر الخطوات elution مرة أو مرتين للحصول على العائد gDNA إضافية إذا رغبت في ذلك. تقييم جودة gDNA المستخرجة وفقا للتعليمات الواردة في القسم 4 وتخزين gDNA في 4 درجة مئوية إذا كان سيتم استخدامه في غضون أسبوع واحد. بدلا من ذلك، احتفظ ب gDNA عند -20 درجة مئوية للتخزين على المدى الطويل. 4. تقييم جودة gDNA المستخرجة لتقييم الجودة بواسطة هلام الكهربائي، وإعداد هلام agarose 1٪ كما هو موضح في القسم الفرعي 2.2. إعداد العينة في أنبوب نظيف: مزيج 1-2 ميكرولتر من gDNA المستخرجة و 3 ميكرولتر من 2x تحميل صبغة على parafilm. تشغيل هلام تحميل مرة واحدة، ومن ثم تصور تحت ضوء الأشعة فوق البنفسجية.ملاحظة: استخراج gDNA ناجحة سوف يكون واضحا من قبل الفرقة منفصلة في الجزء العلوي من هلام والحد الأدنى من تشويه (الشكل 2A). التلطيخ يدل على القص. إذا لم يكن هناك نطاق gDNA واضح و / أو تلطيخ كبيرة، كرر استخراج gDNA. فكر في تقليل أوقات الحضانة في RNase A وبروتيناز K. إذا لوحظت نطاقات اثنين حول 1.5-3 كيلوبايت، وهذا يشير إلى تلوث الحمض النووي الريبي(الشكل 2B). إعداد RNase A الطازجة وتكرار الاستخراج. لتقييم الجودة بواسطة مطياف الميكروفولومي، قم بقياس تركيز gDNA ونسبة الامتصاص A260/280 بواسطة مطياف ميكروفولومي. التركيزات >50 نانوغرام/ميكرولتر و A260/280 بين 1.7-2.0 مقبولة.ملاحظة: قد يكون انخفاض غلة gDNA بسبب انخفاض المدخلات، وارتفاع المدخلات، وتلوث النيوكلياس، وتحلل غير كاف. نسب الامتصاص فوق النطاق تشير إلى تلوث الحمض النووي الريبي. كرر استخراج إذا كانت نوعية gDNA سيئة. لتقييم الجودة حسب مقياس الفلور، اتبع تعليمات الشركة المصنعة لتحديد تركيز gDNA باستخدام عدة المقايسة عالية الحساسية وأداة قياس الفلورومتر(جدول المواد). التركيز >50 نانوغرام / ميكرولتر أمر مرغوب فيه. 5. الاقتران نهاية الجيل القادم قصيرة القراءة التسلسل وإعداد المكتبة ملاحظة: يمكن تنفيذ تسلسل القراءة القصيرة على أدوات مختلفة بأطوال واتجاهات قراءة متميزة. يوصى بتسلسل ثنائي الطرف 150 نقطة أساس (300 دورة) ل WGS البكتيرية. ويمكن الاستعانة بمصادر خارجية لإعداد المكتبات وتسلسلها إلى المرافق الأساسية أو المختبرات التجارية. إعداد مكتبة التسلسل وفقا لتعليمات الشركة المصنعة(جدول المواد). اتبع تركيز مكتبة التحميل النهائي الموصى به من قبل الشركة المصنعة؛ ومع ذلك، تعديل الموصى به لتحميل المكتبة المجمعة في 1.8 pM لإنشاء القراءة الأمثل على أدوات NextSeq. على الرغم من اختياري، استخدم Bioanalyzer(جدول المواد)لتقييم توزيع جزء المكتبة المجمعة وضمان أن حجم الجزء هو 600 نقطة أساس في المتوسط. 6. نانوبور MinION تسلسل إعداد المكتبة إعداد مكتبة التسلسل وفقا لبروتوكول الشركة المصنعة(جدول المواد). باستخدام مجموعتين توسيع الباركود يسمح لتعدد ما يصل إلى 24 عينات على خلية تدفق واحدة. من المستحسن إجراء إعداد المكتبة في جزأين، 12 عينة في وقت تعدد 24 عينات. ويمكن تجميع جميع العينات ال 24 على النحو المبين أدناه.ملاحظة: قد يتم تخزين عينات عند 4 °C بين عشية وضحاها عند الانتهاء من ربط الباركود الأصلي – وهذا يوفر نقطة توقف في البروتوكول، إذا لزم الأمر. في نهاية قسم ربط الباركود الأصلي من بروتوكول إعداد المكتبة ، يوصى بتجميع كميات متساوية من كل عينة تصل إلى الحد الأقصى لكتلة الحمض النووي (ng) الممكنة. للقيام بذلك، قم بتحديد جميع العينات التالية ربط الباركود باستخدام مقياس الفلورومتر(جدول المواد)لكل إرشادات الشركة المصنعة. تقدير حجم العينة مع تركيز dsDNA أدنى، ومن ثم حساب dsDNA الإجمالي وجدت في هذه العينة. استخدم هذا الرقم لتحديد كميات متساوية من كافة العينات الأخرى التي سيتم تجميعها معا.ملاحظة: لأن حساب equimolar سوف تكبير مقدار dsDNA مجمعة وبالتالي ينتج تجمع عالي الحجم (>65 ميكرولتر) ، تنظيف ضرورية لتركيز التجمع. تنظيف تجمع dsDNA وتركيزه إضافة حجم 2.5x من الخرز paramagnetic(جدول المواد)إلى تجمع الحمض النووي، ومن ثم نفض الغبار بلطف أنبوب لخلط محتويات. ضع الأنبوب في الدوار لمدة 5 دقائق في RT. سبين أسفل العينة في 2000 × ز والكريه على المغناطيس. إضافة 250 ميكرولتر أعدت حديثا 70٪ الإيثانول (في ماء خال من النيوكليز)، مع الحرص على عدم إزعاج بيليه. يستنشق الإيثانول وكرر غسل الإيثانول مرة واحدة. بعد الطموح الثاني، تدور أسفل العينة في 2000 x ز ووضعها مرة أخرى على المغناطيس. ماصة قبالة أي الإيثانول المتبقية والسماح للعينة لتجف لمدة 30 ق تقريبا. إزالة أنبوب من المغناطيس وإعادة إنفاق بيليه في 60-70 ميكرولتر من الماء الخالي من النيوكليز. احتضان في RT لمدة 2 دقيقة. بيليه العينة على المغناطيس حتى elute واضحة، ومن ثم إزالة elute ونقلها إلى أنبوب الطرد المركزي الدقيق 1.5 مل نظيفة. تحديد حجم تجمع مركزة باستخدام مقياس الفلور، ومن ثم إعداد aliquot للمضي قدما في خطوة ربط محول: إعداد 700 نانوغرام من العينة في حجم نهائي 65 ميكرولتر. احتفظ بباقي التجمع عند 4 درجات مئوية للركض ثانية ليتم إكمالها بمجرد انتهاء التشغيل الأول. تابع ربط المحول كما هو من قبل الشركة المصنعة ثم قم بتحميل العينة على الخلية التدفق. بدء تشغيل التسلسل.ملاحظة: أسبيرات الهواء و ~ 200 ميكرولتر من المخزن المؤقت التخزين من منفذ فتيلة الخلية تدفق قبل تحميل العينة. وهذا أمر بالغ الأهمية لنجاح تدفق فتيلة الخلية وتحميل العينة. استخدام ماصة P1000 ونصائح عند رسم وإيداع الحلول من خلال منفذ فتيلة من الخلية تدفق. تسلسل المكتبة وفقا لتعليمات الشركة المصنعة. افتح برنامج التشغيل للتسلسل وانقر على ابدأ. إدخال اسم للتجربة، تسمية الموصى بها يتضمن تاريخ التشغيل واسم المستخدم. انقر على متابعة لاختيار كيت، حدد مجموعة مناسبة من إعداد المكتبة وحزمة (حزم) توسيع الباركود المستخدمة ، ثم انقر على متابعة تشغيل الخيارات. ضبط طول التشغيل إلى 48 ساعة إذا التخطيط لإعداد مكتبة كافية لتشغيل ثانية (وإلا ترك في الافتراضي 72 ساعة). انقر على متابعة إلى Basecalling. تحقق من الخيار basecalling التكوين: Basecalling سريع وتأكد من تعيين باركودينج إلى تمكين بحيث سيتم اقتطاع إخراج FASTQ الملفات من تسلسل الباركود و demultiplexed إلى دلائل منفصلة استنادا إلى الباركود. انقر على متابعة الإخراج. اختر مكان حفظ بيانات تسلسل الإخراج. توقع ما يقرب من 30-50 غيغابايت من البيانات إذا حفظ إخراج FASTQ فقط و >500 غيغابايت من البيانات إذا أيضا حفظ إخراج FAST5. إلغاء تحديد الخيار تصفية Qscore: 7 | Readlength: غير المصفاة إذا كان التخطيط للمضي قدما في التصفية الموصوفة في القسم 7.2، وإلا ترك فحص وتعديل Readlength إلى 200. انقر على متابعة تشغيل الإعداد ومراجعة كافة الإعدادات. إذا كانت الإعدادات صحيحة، انقر على ابدأ،وإلا انقر على العودة وإجراء أي تعديلات ضرورية. إذا رغبت في ذلك، قد يتم غسل خلية التدفق وفقا لتعليمات الشركة المصنعة وإعادة تحميلها مع التجمع المتبقي. كرر الخطوات في 6.2 للتجمع المتبقية بمجرد اكتمال التشغيل الأول ثم تم غسل الخلية تدفق.ملاحظة: عند إعداد التشغيل الثاني، ضبط الجهد التحيز إلى -250 mV لكل توصيات الشركة المصنعة لتدفق الخلايا المستخدمة سابقا في أشواط أكثر من 48 ساعة. 7. تقييم وإعداد القراءات ملاحظة: يتم تصوير بنية دليل مستحسن في الشكل 4. إنشاء الدلائل الموجودة في سطح المكتب، وهي Long_Reads Short_Reads Trimmed_Reads ، قبل المتابعة مع خطوات الحساب أدناه. قراءات قصيرة (الشكل 3)ملاحظة: يتم إنشاء قراءات قصيرة بتنسيق FASTQ. تحتوي الملفات على 4000 القراءة القصوى لكل FASTQ. وغالبا ما تكون مضغوط هذه (أرشيف .gz) وتنظيمها في ملفات متعددة. اعتمادا على النظام الأساسي، يتم عادة اقتطاع الباركود. بعض البرامج تقبل الملفات في شكل مضغوط ، والبعض الآخر قد تتطلب استخراجها قبل الاستيراد. يجب أن تمر القراءات خطوات مراقبة الجودة (QC) لضمان دقة البيانات أثناء تجميع الجينوم. إذا لم تتوفر منضدة عمل الجينوم CLC، فقد يتم استخدام برامج بديلة للتقليم وقرأات QC القصيرة مثل Trimmomatic25 أو تريم Galore (https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/) لتقليم وFastQC (http://www.bioinformatics.babraham.ac.uk/projects/fastqc/) لتقييم جودة القراءة. ويوصى بأن يكون متوسط تغطية القراءة القصيرة، المقدرة بضرب عدد القراءات بمتوسط طول القراءة وقسمتها على حجم الجينوم، 100x >.فتح الجينوم برنامج منضدة العمل(جدول المواد)واستيراد جميع الملفات FASTQ المقترنة نهاية قصيرة القراءة. سيتم إنشاء الملفات المقترنة تلقائيا. إنشاء مجلد جديد تحت CLC_Data بالنقر فوق جديد في شريط الأدوات العلوي وتحديد المجلد… لتخزين الملفات. اسم المجلد كما هو مطلوب، اصطلاح مستحسن يستخدم نموذج معرف. حفظ كافة الإخراج من الخطوات التالية إلى هذا المجلد. في شريط الأدوات العلوي، انقر على زر الاستيراد وحدد Illumina… انتقل إلى كافة الملفات قصيرة القراءة التي تتوافق مع العينة وحددها. تأكد من تحديد خيار القراءات المقترنة ثم قم بإلغاء تحديد الخيار إزالة القراءات الفاشلة. انقر على التالي، حدد حفظ، وانقر على التالي مرة أخرى. اختر حفظ الملفات المستوردة في المجلد الجديد الذي تم إنشاؤه في الخطوة السابقة وانقر فوق إنهاء. إنشاء قائمة تسلسل كافة الملفات المقترنة لعزل; سيؤدي ذلك إلى تجميع بيانات القراءة في ملف واحد لبساطة التحليل. في شريط الأدوات العلوي، انقر فوق الزر جديد وحدد قائمة التسلسل… في قائمة الدليل على اليسار، حدد الملفات المراد تسلسلها واستخدم الأسهم لنقلها إلى قائمة الملفات المحددة على اليمين. انقر على التالي، حدد حفظ، وانقر على التالي مرة أخرى. اختر حفظ قائمة التسلسل وانقر على إنهاء. بمجرد إنشاء قائمة التسلسل، قم بإعادة تسميتها فورا باستخدام نموذج معرف. تشغيل أداة QC للتسلسل القراءات على قائمة التسلسل: سيقوم هذا الإجراء بتقييم معلمات الجودة الكلية للقراءات التي تم إنشاؤها بواسطة NGS قصيرة القراءة. البحث عن أداة QC ل “قراءة التسلسل” في قائمة مربع الأدوات (الإطار السفلي الأيسر). انقر نقرا مزدوجا فوق الأداة، ثم اختر قائمة التسلسل لتحليلها وانقر على التالي. تأكد من فحص جميع خيارات الإخراج واختر حفظ ضمن معالجة النتائج. انقر فوق التالي وحدد لحفظ ملفات الإخراج، ثم انقر فوق إنهاء. تشغيل أداة القراءة تريم على قائمة التسلسل: سيتم التشذيب استنادا إلى الجودة والطول والغموض. تفترض هذه العملية أن الباركود المستخدم في التسلسل قد تم اقتطاعه قبل هذه الخطوة. البحث عن أداة “القراءات تريم” في مربع الأدوات (الإطار السفلي الأيمن). انقر نقرا مزدوجا على تريم يقرأ، ثم اختر قائمة التسلسل ليتم تحليلها وانقر على التالي. التشذيب الجودة: تعيين حد درجة الجودة إلى 0.01 وترك النيوكليوتيدات غامضة في 2. انقر على التالي.ملاحظة: يمكن تعديل المعلمات حسب تقدير المستخدم؛ هذه هي الإعدادات الموصى بها. إلغاء تحديد التلقائي القراءة من خلال محول التشذيب (فقط القيام بذلك إذا تم اقتطاع المحولات من القراءات قبل استيرادها إلى CLC). انقر على التالي وتحقق تجاهل القراءات أدناه طول، استخدم الافتراضي 15. انقر على التالي، حدد إنشاء تقرير، ثم اختر حفظ. انقر على التالي وحدد مكان حفظ ملفات الإخراج. انقر على إنهاء. تصدير قائمة التسلسل المشذب: سيتم إكمال التجميع والتحليل المختلط اللاحق خارج CLC ويتطلب تصدير الملفات القصيرة القراءة. من التنقل الدليل في أعلى اليسار، اختر الملف المشذب الذي تم إنشاؤه في الخطوة 7.1.4، ثم انقر فوق تصدير في شريط الأدوات العلوي. حدد Fastq لنوع ملف التصدير وانقر على التالي. تحقق تصدير قائمة تسلسل المقترنة إلى ملفين. ثم انقر فوق التالي واختر الدليل Trimmed_Reads لتصدير الملفات إليه. انقر على إنهاء. تأكد من أن الملفات القصيرة القراءة التي تم اقتطاعها تم تصديرها بنجاح كملفين (R1 و R2) مع الملحق .fastq.ملاحظة: يجب تصدير قائمة التسلسل المشذبة إلى ملفين، عادة ما يتم تعيينها بواسطة CLC ك R1 و R2. وهذا أمر بالغ الأهمية لأن التجميع المختلط المتلقين للمعلومات يتطلب إدخال بيانات للقراءة القصيرة لإعدادها على هذا النحو. إعادة تسمية الملفات المصدرة، يرجى الامتناع عن استخدام المسافات والأحرف الخاصة في أسماء الملفات. للبساطة تنسيق الموصى بها هو trimmed_short_file. R1.fastq. طويل (MinION) يقرأ (الشكل 3)ملاحظة: خط الأنابيب التالي لإعداد طويل (MinION) تسلسل يقرأ التجميع المختلط يستخدم NanoFilt و Nanostat البرامج26 تنفيذها بواسطة سطر الأوامر. تثبيت الأدوات قبل المتابعة وتكون على دراية أساسيات UNIX من أجل تنفيذ هذه الأوامر. يوصى بالمحطات الطرفية الافتراضية و Bash Shell. تم العثور على دليل الدرس للأوامر الطرفية المشتركة والاستخدام في النجارة البرمجيات27. تفترض الإرشادات أدناه أن الملفات التي تم إنشاؤها سيتم تسميتها بتسمية الباركود (NB01 و NB02 وما إلى ذلك) ويتم حفظها في دليل Long_Reads. بدلا من ذلك، يمكن إنجاز تصفية القراءة باستخدام MinKNOW عند إعداد تشغيل التسلسل. يوصى بأن يكون متوسط تغطية القراءة الطويلة 100x >. متوسط طول القراءة الموصى به هو >2000 نقطة أساس؛ لذلك، عدد القراءات الطويلة المطلوبة أقل من عدد القراءات القصيرة. إنشاء أدلة جديدة لكل الباركود المستخدمة في المدى (الباركود01، الباركود02، الخ) داخل الدليل Long_Reads(الشكل 4). نسخ كافة الملفات .fastq التي تتوافق مع كل الباركود في المجلد المناسب. الجمع بين جميع الملفات .fastq لكل الباركود من كل شوط. فتح المحطة الطرفية والانتقال إلى دلائل الباركود داخل الدليل Long_Reads باستخدام الأمر cd: cd Desktop/Long_Reads/barcode01 تجميع كافة ملفات .fastq لكل الباركود في ملف .fastq واحد بتنفيذ الأمر التالي: cat *.fastq > NB01.fastqملاحظة: يجمع هذا الأمر كافة القراءات من كل من الملفات FASTQ في واحد FASTQ كبيرة واحدة باسم NB01.fastq. استخدم NanoStat لتقييم جودة قراءة العينة بتنفيذ الأمر التالي: NanoStat –fastq NB01.fastq تسجيل النتائج عن طريق نسخ الإخراج إلى نص أو ملف Word للرجوع إليها في المستقبل. استخدام NanoFilt لتصفية MinION يقرأ تجاهل يقرأ مع Q < 7 وطول < 200 عن طريق تنفيذ الأمر: NanoFilt -q 7 -l 200 bp NB01.fastq | gzip > NB01 _trimmed.fastq.gz تشغيل NanoStat على الملف قلصت التي تم إنشاؤها في الخطوة 7.2.6 بتنفيذ الأمر: NanoStat –fastq NB01 _trimmed.fastq.gz تسجيل النتائج عن طريق نسخ الإخراج إلى نص أو ملف Word ومقارنة النتائج من الخطوة 7.2.4 للتأكد من أن التصفية كانت ناجحة(الجدول 1). كرر الخطوات 7.2.2 إلى 7.2.8 لكل الباركود المستخدمة في تشغيل التسلسل.ملاحظة: سيتم استخدام الملف NB01_trimmed.fastq.gz الذي تم إنشاؤه في الخطوة 7.2.6 للتجميع المختلط. 8. توليد تجميع الجينوم الهجين ملاحظة: يستخدم خط أنابيب التجميع التالي Unicycler19و28و29و30 للجمع بين القراءات القصيرة والطويلة المعدة في القسمين 7.1 و 7.2 ( الشكل3). تثبيت Unicycler وتبعياتها وتنفيذ الأوامر أدناه. يفترض أن يتم تسمية الملفات قصيرة القراءة التي تم تصديرها في الخطوة 7.1.5 trimmed_short_file. R1.fastq trimmed_short_file. R2.fastq للبساطة. تنظيم الملفات قصيرة القراءة والملفات طويلة القراءة في دليل واحد اسمه Trimmed_Reads. يجب أن يحتوي الدليل على ما يلي: ملف .gz.fastq لقراءات طويلة قلصت (التي تم إنشاؤها في الخطوة 7.2.6). ملفين .fastq (R1 و R2) لقراءات قصيرة قلصت (التي تم إنشاؤها في الخطوة 7.1.5). انتقل إلى Trimmed_Reads الدليل الذي يخزن الملفات المقروءة باستخدام الأمر cd في Terminal: cd Desktop/Trimmed_Reads مرة واحدة في الدليل الصحيح، الرمز البريدي اثنين من ملفات القراءة القصيرة بحيث تكون أيضا في تنسيق .gz.fastq عن طريق تنفيذ الأمر التالي: gzip trimmed_short_file. R1.fastq كرر الخطوة 8.2 لكل من R1 و R2. تحقق من أن كافة الملفات المقروءة الآن بتنسيق .fastq.gz وتحقق من تطابق كافة الملفات مع نفس العزل. بدء التجميع المختلط باستخدام Unicycler عن طريق تشغيل الأمر التالي:unicycler -1 trimmed_short_file. R1.fastq.gz -2 trimmed_short_file. R2.fastq.gz -l NB01 _trimmed.fastq.gz -o unicycler_output_directoryملاحظة: -o يحدد الدليل الذي سيتم حفظ الإخراج Unicycler، سيتم إنشاء Unicycler هذا الدليل بمجرد تنفيذ الأمر; لا تقم بإنشاء الدليل مسبقا. وقت التشغيل يختلف حسب القوة الحسابية للكمبيوتر المستخدم وكذلك حجم الجينوم وعدد القراءات. قد يستغرق هذا في أي مكان من 4 ساعة إلى 1 أو 2 أيام. تم تنفيذ هذا البروتوكول على جهاز CentOS Linux 7 مع ذاكرة وصول عشوائي 250 غيغابايت، وحدة المعالجة المركزية Intel Xeon (R) مع 2.5 جيجاهرتز 12 نواة عملية و48 نواة افتراضية. بدلا من ذلك، يمكن لأجهزة الكمبيوتر الشخصية المزودة بذاكرة وصول عشوائي 16 غيغابايت ومعالجات 6-core 2.6 جيجاهرتز حساب هذه التجميعات في وقت معالجة أطول. عند اكتمال التشغيل، راجع ملف unicycler.log للتأكد من عدم وجود أخطاء – سجل رقم المتجاورات التي تم إنشاؤها وحجمها وحالتها (كاملة وغير مكتملة). إذا تم تعريف المتجاورات غير كاملة (المشار إليها على أنها غير كاملة في سجل Unicycler) ، إعادة تشغيل Unicycler في وضع غامق بإضافة العلامة التالية إلى الأمر في الخطوة 8.4: –وضع غامق.ملاحظة: وضع غامق سيخفض عتبة الجودة المقبولة الجسور القراءة الطويلة أثناء التجميع; قد ينتج تجميع كامل ولكن قد يتم تقليل جودة التجميع. فمن المستحسن للاستفادة من وضع جريئة فقط عند الضرورة وكأدلة أولية للانضمام إلى الملتق ليتم تأكيده في وقت لاحق من قبل PCR. 9. تقييم جودة التجميع ملاحظة: يستخدم البروتوكول التالي Bandage31 و QUAST32، برنامجين يجب إعدادهما قبل الاستخدام(الشكل 2 والشكل 4). ضمادة لا تتطلب التثبيت مرة واحدة تحميلها وQUAST يتطلب الألفة مع استخدام سطر الأوامر الأساسية. ومن المستحسن أيضا لتقييم اكتمال الجينوم باستخدام القياس العالمي واحد نسخة تقويم العظام (BUSCO)33. ضمادة: انقر على ملف. ثم اختر تحميل Graph وحدد ملف assembly.gfa الذي تم حفظه إلى unicycler_output_directory التي تم إنشاؤها بواسطة Unicycler في الخطوة 8.4. بمجرد تحميلها، انقر على رسم الرسم البياني زر على شريط الأدوات الأيسر وننظر في كيفية اتصال المتجاورة (تسمى العقد) وتنظيمها لتقييم ما إذا كان التجميع هو كاملة (الشكل 5).ملاحظة: يتم تمثيل التجميعات الكاملة بواسطة متجاورات دائرية مفردة مرتبطة في كلا الطرفين (الشكل 5A, B). التجميعات غير المكتملة لها عدة متجاورات مرتبطة ببعضها البعض أو خطية(الشكل 5C). قد لا تكون المتجاورات الخطية الصغيرة غير مكتملة لأنها قد تشير إلى عناصر خطية خارج نطاق الذاكرة. التغطية، وتسمى أيضا العمق، وسوف يلاحظ في ضمادة ويمثل وفرة النسبية من المتجاورة إلى الكروموسوم، تطبيع في Unicycler إلى 1x. كواست داخل المحطة الطرفية، انتقل إلى المجلد الذي يخزن إخراج Unicycler باستخدام الأمر cd: cd Desktop/Trimmed_Reads/unicycler_output_directoryملاحظة: لا يسمح المسافات في المسار إلى حيث يوجد التجميع، أي، لا يمكن أن يكون أية دلائل تؤدي إلى إخراج Unicycler مسافات باسمها. بدلا من ذلك، نسخ ملف assembly.fasta إلى سطح المكتب لسهولة الوصول. تشغيل QUAST بتنفيذ الأمر التالي: quast assembly.fasta -o quast_output_directory مراجعة التقارير التي تم إنشاؤها بواسطة QUAST في دليل الإخراج quast_output_directory. 10. شرح الجينوم ملاحظة: خط أنابيب التعليقات التوضيحية أدناه يستخدم Prokka34، أداة سطر الأوامر التي يجب تثبيتها قبل الاستخدام. بدلا من ذلك، استخدم بروكا من خلال الآلي واجهة المستخدم الرسومية K-قاعدة (جدول المواد) أو الجينوم المشروح عبر خادم الويب RAST35. إذا إيداع الجينوم في NCBI، سيتم المشروح تلقائيا باستخدام خط أنابيب الشرح الجينوم Prokaryotic (PGAP)36. انتقل داخل المحطة الطرفية إلى المجلد الذي يخزن الإخراج Unicycler باستخدام الأمر cd (راجع الخطوة 9.2.1). ثم قم بتشغيل Prokka بتنفيذ الأمر التالي: prokka –البادئة sample_ID –outdir prokka_output_directory assembly.fastaملاحظة: –بادئة سيتم تسمية كافة ملفات الإخراج استنادا إلى sample_ID المحدد.–سيقوم outdir بإنشاء دليل إخراج بالاسم المحدد حيث سيتم حفظ كافة ملفات إخراج Prokka; لا تقم بإنشاء دليل إخراج ل Prokka مسبقا. راجع التعليقات التوضيحية عن طريق فتح الجدول .tsv و/أو عن طريق تحميل الملف .gff الذي تم إنشاؤه في برنامج تحليل تسلسلي لتصور وتحليل التعليقات التوضيحية(الشكل 6). يمكن إنشاء أنواع محددة من الشروح اعتمادا على العوامل الوراثية ذات الاهتمام. من المستحسن أن تبدأ مع أدوات سهلة الاستخدام على مركز علم الأوبئة الجينومية (www.genomicepidemiology.org/) خادم الويب للتحليل الأولي37،38،39،40،41. تتوفر أدوات إضافية للكشف عن أنظمة CRISPR-cas والسند (الشكل 3)42،43. 11. الممارسات المقترحة لإضفاء الطابع الديمقراطي على البيانات عند الإمكان، قم بإيداع جميع بيانات القراءة الأولية وكذلك الجينوم المجمع في مستودع عام مثل أرشيف قراءة تسلسل NCBI (SRA) وGenbank. يتم تعليق الجينوم تلقائيا عبر خط أنابيب PGAP أثناء عملية ترسب NCBI.

Representative Results

وقد تم تحسين هذا البروتوكول لثقافة وتسلسل البكتيريا البولية التي تنتمي إلى أجناس المدرجة في الشكل 1. ليست كل البكتيريا البولية قابلة للتكفير بهذه الطريقة. يتم تحديد الوسائط الثقافية والشروط حسب الجنس في الشكل 1. يتم تصوير تقييمات إلكتروفورسيس هلام مثالية من سلامة gDNA في الشكل 2. ويرد وصف لمحة عامة عن خط أنابيب المعلوماتية الحيوية لتسلسل معالجة القراءة وتجميع الجينوم والتعليق التوضيحي في الشكل 3. يتم توفير دليل لبنية الدليل الحسابي في الشكل 4 لتبسيط فهم البروتوكول وتوفير إطار عمل للتنظيم الناجح. وعلاوة على ذلك، وشملت هي الجينوم كاملة ممثل اثنين من Klebsiella spp.، K. الالتهاب الرئوي وK. أوكسيتوكا،التي تم إنشاؤها بواسطة هذا البروتوكول. يتم توفير تمثيل لهذه الجمعيات في الشكل 5 ويتضمن أيضا مثالا إضافيا غير مكتمل ك. جينوم الالتهاب الرئوي. يتم عرض نظرة عامة مفصلة على كل الجينوم الكامل المشروح بالكامل في الشكل 6. وأخيرا، يقدم الجدول 1 موجزا لإحصاءات قراءة التسلسل لتقديم فهم واسع للبيانات الخام والمقتطعة بما يكفي لتوليد تجميعات الجينوم المغلقة عالية الجودة. بالإضافة إلى ذلك، المعلمات الرئيسية للممثلين اثنين كاملة Klebsiella spp. يتم سرد الجينوم. تم إيداع الجينوم والبيانات الخام في جينبانك تحت المشروع الحيوي PRJNA683049. الشكل 1:تعديل ثقافة البول المحسنة من أجناس بولية متنوعة. رسم بياني للمرق أجار والسائلة التي يمكن استخدامها لثقافة أجناس بولية متنوعة. ويقترح إجراء جميع عمليات الاستزراع عند 35 درجة مئوية على النحو المبين في القسم الفرعي 1-1. تمثل الدوائر الوسائط المناسبة لزراعة جنس معين ، وتم اختيار الألوان بشكل تعسفي لتمييز نوع وسائط واحد عن آخر. CDC-AN BAP (أحمر), CDC Anaerobe الأغنام الدم أجار; 5٪ الأغنام-BAP (البرتقال)، الأغنام أجار الدم؛ BHI (الأخضر), ضخ قلب الدماغ; TSB (الأصفر), مرق الصويا Tryptic; التوجه CHROMagar (الأزرق). وينبغيأن تكونمثقفة Gardnerella المهبلية على HBT بيلاير G. المهبل أجار انتقائية في الغلاف الجوي microaerophilic وتحت متطلبات الثقافة مرق خاص44. ب يجب أن تكون مثقفة Iners Lactobacillus على لوحات أرنب -BAP 5٪ ومرق NYCIII في الغلاف الجوي microaerophilic. جلاكتوباكيلوس SPP. قد تكون مثقفة على MRS في الظروف microaerophilic. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم. الشكل 2: الجينوم الحمض النووي استخراج الصور هلام agarose. صور هلامية تمثيلية تصور نتائج استخراج gDNA. (أ) حارة 1: 1 كيلوبايت سلم, لين 2: gDNA سليمة تمثل استخراج ناجحة, حارة 3: تلطيخ تشير إلى gDNA مجزأة. (ب) حارة 1: 1 كيلوبايت سلم، Lanes 2 و 3: تلوث rRNA تدل على اثنين من النطاقات بين 1.5 kb و 3 kb. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم. الشكل 3:سير عمل تجميع الجينوم المختلط. تخطيطي للخطوات من التحكم في جودة القراءة والمعالجة المسبقة إلى تعليق التجميع. إزالة التشذيب القراءة القراءة غامضة ومنخفضة الجودة. يتم الإشارة إلى معلمات درجة Q والطول وتمثل القراءات التي يتم الاحتفاظ بها. يستخدم التجميع قراءات قصيرة وطويلة لتوليد تجميع جينوم هجين من نوفو. يتم تقييم جودة التجميع على أساس الاكتمال والصحيح باستخدام أدوات محددة ومعلمات محددة. يتم شرح تجميع الجينوم النهائي لجميع الجينات و loci محددة من الفائدة. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم. الشكل 4: دليل دليل المعلوماتية الحيوية دليل. تخطيطي للدليل الموصى به وتنظيم الملفات لمعالجة القراءات القصيرة والطويلة والتجميع المختلط والتعليق الجينومي ومراقبة الجودة. يتم تمييز خطوات معالجة بيانات سطر الأوامر الرئيسية بجانب الملفات والدلائل المطابقة. الحصول على أوامر وأعلام (غامق) ، ملفات الإدخال (الأزرق) ، ملفات الإخراج أو الدلائل (أحمر) ، إدخال المستخدم مثل اصطلاح تسمية الملف (أرجواني). يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم. الشكل 5: الرسوم البيانية تجميع الجينوم بواسطة ضمادة. ممثل كامل الجينوم تجميع الرسوم البيانية من (أ) Klebsiella أوكسيتوكا KoPF10 و (ب) Klebsiella الالتهاب الرئوي KpPF25 وتجميع الجينوم غير مكتملة من (C) Klebsiella الالتهاب الرئوي KpPF46. الجينوم الكامل لKoPF10 يدل على كروموسوم واحد مغلق والجينوم الكامل ل KpPF25 يتكون من كروموسوم مغلق وخمسة بلازميدات مغلقة. الكروموسوم غير مكتملة من KpPF46 يتكون من اثنين من المتجاورة مترابطة. Unicycler الهجين دي نوفو التجمع يولد الرسم البياني التجميع الذي هو تصور من قبل ضمادة. يوفر الرسم البياني للتجميع تخطيطا مبسطا للجينوم ، يشير إلى كروموسوم مغلق أو بلازميدات بواسطة رابط يربط طرفي متجاورة واحدة. يشير وجود أكثر من متجاورة مترابطة إلى التجميع غير مكتمل. ويمكن ملاحظة حجم Contig وعمق في ضمادة كذلك. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم. الشكل 6:خرائط الجينوم الكاملة للتجميعات الهجينة المشروحة. خرائط التجميع التي تم إنشاؤها بواسطة Geneious Prime للجينوم الكامل ل (A) K. oxytoca KoPF10 و (B) K. pneumoniae KpPF25 تظهر الجينات المشروحة التي تشير إليها السهام الملونة على طول العمود الفقري البلازميد. الكروموسومات تظهر فقط جينات الحمض النووي الريبي والجيش الملكي النيبالي للبساطة. وقد أجريت تعليقات توضيحية على الجينوم باستخدام بروكا على النحو المبين في الفرع 10 من هذا البروتوكول. يرجى النقر هنا لعرض نسخة أكبر من هذا الرقم. الجدول 1: النائب Klebsiella spp. معلمات التجميع من سلالة K. oxytoca KoPF10 وK. سلالة الالتهاب الرئوي KpPF25. يتم توفير أرقام الانضمام للبيانات المودعة على NCBI. يتم تحديد عدد القراءات قبل التشذيب وبعده لكل من تقنيات التسلسل. يتم توفير N50 لقراءات طويلة فقط منذ قراءات قصيرة هي من طول تسيطر عليها. Plasmid replicon توقع استخدام PlasmidFinder v2.1 Enteroebacteriaceae قاعدة البيانات مع المعلمات تعيين إلى 80 ٪ الهوية وطول 60 ٪. (أ) MLST، نوع تسلسل متعدد الأطراف. ب CDS، تسلسلات الترميز. ج Plasmid replicon توقع باستخدام PlasmidFinder v2.1 Enterobacteriaceae قاعدة البيانات مع المعلمات تعيين إلى 80٪ الهوية وطول 60٪. (د) أودعت شركة أكسفورد نانوبور تكنولوجيز (ONT) بيانات للقراءة. ه Illumina أودعت قراءة البيانات. الرجاء الضغط هنا لتحميل هذا الجدول.

Discussion

يقدم بروتوكول تجميع الجينوم الهجين الشامل الموصوف هنا نهجا مبسطا للنجاح في زراعة الميكروبات البولية المتنوعة والمسالك البولية ، والتجميع الكامل لجينومها. يبدأ WGS الناجح من الجينوم البكتيري بعزل الميكروبات المتنوعة والسريعة في بعض الأحيان من أجل استخراج الحمض النووي الجينومي الخاص بها. حتى الآن، تفتقر بروتوكولات زراعة البول الحالية إما إلى الحساسية اللازمة للكشف عن العديد من الأنواع البولية أو تنطوي على نهج طويلة وواسعة النطاق تتطلب وقتا طويلا وموارد11. يقدم نهج ثقافة البول المحسن المعدل الموصوف بروتوكولا مبسطا وشاملا للعزل الناجح للبكتيريا التي تنتمي إلى 17 جنسا بوليا شائعا ، بما في ذلك الأنواع المشتركة المسببة للأمراض أو المفيدة ، والبكتيريا الهوائية أو اللاهوائية التي يحتمل أن تكون مسببة للأمراض أو مفيدة. وهذا بدوره يوفر المواد اللازمة لبدء تسلسل دقيق وتجميع الجينوم البكتيري والتجارب الحيوية، والتي تسهم في فهم صحة المسالك البولية والمرض. وعلاوة على ذلك، فإن هذا النهج المعدل للثقافة ينص على تشخيص سريري أكثر تحديدا للكائنات الحية الدقيقة القابلة للحياة الموجودة في عينات البول ويسمح ببنوكها الحيوية للدراسات الجينومية المستقبلية. ومع ذلك، هذا البروتوكول لا يخلو من قيود. قد يتطلب الأمر فترات حضانة طويلة اعتمادا على الكائن الحي بالإضافة إلى استخدام موارد مثل غرفة نقص الأكxia أو الحاضنات الخاضعة للرقابة التي قد لا تكون متاحة بسهولة. استخدام GasPaks اللاهوائية يوفر حلا بديلا ولكن هذه مكلفة ولا تنتج دائما بيئة مستدامة وخاضعة للرقابة. وأخيرا، قد يسمح التحيز الثقافي وكذلك تنوع العينات لكائنات معينة ومركبات المسالك البولية بالتنافس مع البكتيريا السريعة. على الرغم من هذه القيود، يتم جعل ثقافة البكتيريا البولية المتنوعة ممكنة من خلال هذا النهج.

وقد اكتسب تسلسل الجينوم شعبية مع تقدم الجيل القادم من تقنيات التسلسل التي زادت بشكل كبير كل من العائد ودقة تسلسل البيانات14،15. إلى جانب تطوير خوارزميات لمعالجة البيانات وتجميع دي نوفو ، فإن تسلسل الجينوم الكامل في متناول العلماء المبتدئين والخبراء على حد سواء15،45. توفر المعرفة بتنظيم الجينوم الشامل الذي توفره الجينوم الكامل رؤى تطورية وبيولوجية مهمة ، بما في ذلك الازدواجية الجينية ، وفقدان الجينات ، ونقل الجينات الأفقي14. بالإضافة إلى ذلك ، غالبا ما يتم توطين الجينات الهامة لمقاومة مضادات الميكروبات والفوعة على العناصر المتنقلة ، والتي عادة ما لا يتم حلها في تجميعات الجينوم المسودة15،16.

يتبع البروتوكول هنا نهجا هجينا لمزيج من بيانات التسلسل من منصات قصيرة القراءة وطويلة القراءة لتوليد تجميعات الجينوم الكاملة. في حين تركز على الجينوم البكتيري البولي، قد يتم تكييف هذا الإجراء مع البكتيريا المتنوعة من مصادر العزل المختلفة. وتشمل الخطوات الحاسمة في هذا النهج اتباع تقنية معقمة كافية واستخدام وسائل الإعلام المناسبة وظروف الثقافة لعزل البكتيريا البولية النقية. وعلاوة على ذلك، فإن استخراج gDNA سليمة وعالية الغلة أمر ضروري لتوليد بيانات التسلسل خالية من تلوث يقرأ التي قد تعوق نجاح التجمع. بروتوكولات إعداد المكتبة اللاحقة حاسمة لتوليد قراءات عالية الجودة من الطول والعمق الكافيين. لذلك ، من الأهمية بمكان التعامل مع gDNA بعناية أثناء إعداد المكتبة لتسلسل القراءة الطويلة على وجه الخصوص ، حيث أن أكبر فائدة لهذه التكنولوجيا هي توليد قراءات طويلة بدون حد أقصى نظري للطول العلوي. كما تم توضيح أقسام لمراقبة الجودة المناسبة (QC) من قراءات التسلسل التي تقضي على البيانات الصاخبة وتحسن نتائج التجميع.

على الرغم من عزل الحمض النووي الناجح ، وإعداد المكتبة ، والتسلسل ، فإن طبيعة العمارة الجينومية لبعض الأنواع قد لا تزال تشكل عقبة أمام توليد تجميع الجينوم المغلق45،46. غالبا ما تعقد التسلسلات المتكررة حساب التجميع ، وعلى الرغم من بيانات القراءة الطويلة ، قد يتم حل هذه المناطق بثقة منخفضة ، أو لا يتم حلها على الإطلاق. يقرأ طويلة لذلك يضطر كنت في معدل طويلة من الكبيرة يكرر منطقة في الجينوم أو تغطية ينبغي كنت عال (>100x)19. وقد تظل بعض الجينومات غير مكتملة وتتطلب نهجا يدوية للإنجاز. ومع ذلك، فإن الجينوم المختلط غير المكتمل المجمع يتكون عادة من متجاورات أقل من الجينومات القصيرة القراءة. قد يساعد ضبط المعلمات الافتراضية خوارزمية التجميع أو اتباع اقتطاعات أكثر صرامة لقراءة QC. وبدلا من ذلك، فإن أحد النهج المقترحة هو رسم خريطة قراءات طويلة للمناطق غير المكتملة بحثا عن أدلة على مسار التجميع الأكثر احتمالا، ثم تأكيد المسار الذي يستخدم تسلسل PCR وSanger للمنطقة المضخمة. ويقترح تعيين يقرأ باستخدام Minimap2 وضمادة يقدم أداة مفيدة لتصور قراءات المعينة على طول المواق تجميعها توفير الأدلة على الربطالمتجاورة 47.

ويكمن التحدي الإضافي لتوليد الجينوم الكامل في الألفة والراحة مع أدوات سطر الأوامر. يتم تطوير العديد من الأدوات المعلوماتية الحيوية لتوفير الفرص الحسابية لأي مستخدم؛ ومع ذلك، فإن استخدامها يعتمد على فهم أساسيات يونيكس والبرمجة. يهدف هذا البروتوكول إلى توفير تعليمات مفصلة بما فيه الكفاية لتمكين الأفراد الذين ليس لديهم خبرة سابقة في سطر الأوامر من إنشاء تجميعات الجينوم المغلقة والتعليق عليها.

Disclosures

The authors have nothing to disclose.

Acknowledgements

نشكر الدكتور موتيسي جبيدة إسلام والدكتور لوك جويس على مساهماتهما في هذا البروتوكول. ونود أيضا أن نعترف بجامعة تكساس في مركز دالاس للجينوم لردود فعلهم ودعمهم. تم تمويل هذا العمل من قبل مؤسسة ويلش، رقم الجائزة AT-2030-20200401 إلى N.J.D. ، من قبل المعاهد الوطنية للصحة، ورقم الجائزة R01AI116610 إلى K.P. ، وكرسي فيليسيا وجون كاين في صحة المرأة، الذي عقدته P.E.Z.

Materials

Equipment:
Bioanalyzer 2100 Agilent G29398A Optional but recommended
Centrifuge Eppendorf Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R)
Electrophoresis BioRad Laboratories 1645070
Gel Imaging System BioRad Laboratories ChemiDoc models
Incubator ThermoFisher Scientific Any CO2 Incubator (e.g. Thermo Forma model 3110)
Magnetic Rack New England BioLabs S15095 12-tube rack
MinION Oxford Nanopore Technologies
Nanodrop ThermoFisher Scientific ND-ONE-W
NextSeq 500 Illumina SY-415-1002 Other Illumina models are acceptable
Plate Reader BioTek Synergy H1
Qubit fluorometer ThermoFisher Scientific Q33238
Rotator Benchmark Scientific H2024
Thermocycler ThermoFisher Scientific Any thermocycler for PCR reactions (e.g. ProFlex PCR system)
Materials:
10X Phosphate Buffered Saline (PBS) Fisher Scientific BP3991
10X TBE buffer 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0)
1429R primer Sigma Aldrich (Custom oligos) GGTTACCTTGTTACGACTT
1kb Ladder VWR 101228-494
1M Tris-Cl (pH 7.5) ThermoFisher Scientific 15567027
6x Loading dye Fisher Scientific NC0783588
8F primer Sigma Aldrich (Custom oligos) AGAGTTTGATCCTGGCTCAG
Agar Fisher Scientific BP1423-2
Agarose BioRad Laboratories 63001
AMPure XP Beads Beckman Coulter A63880
Anaerobe Pouch System – GasPak EZ BD Diagnostic Systems B260683
Boric Acid Fisher Scientific A73-500
Brain Heart Infusion Broth BD Diagnostic Systems 212304
CDC Anaerobe 5% Sheep Blood Agar BD Diagnostic Systems L007357
CHROMagar Orientation BD Diagnostic Systems PA-257481.04
DNeasy Blood & Tissue QIAGEN 69504
DreamTaq Master Mix ThermoFisher Scientific K1081
Dry Anaerobic Indicator Strips BD Diagnostic Systems 271051
EDTA Fisher Scientific S311-500
Ethanol 200 Proof Sigma Aldrich E7023 For molecular biology
Ethidium Bromide ThermoFisher Scientific BP130210
Flow cell priming kit Oxford Nanopore Technologies EXP-FLP002
Flow cell wash kit Oxford Nanopore Technologies EXP-WSH003
Gel Extraction Miniprep Kit BioBasic BS654
Ligation sequencing kit Oxford Nanopore Technologies SQK-LSK109
Lysozyme Research Products International Corp L381005.05
Mutanolysin Sigma Aldrich M9901-5KU
Native barcoding expansion 1-12 Oxford Nanopore Technologies EXP-NBD104
NEB Blunt/TA Ligase Master Mix New England BioLabs M0367L
NEBNext FFPE DNA Repair Mix New England BioLabs M6630L
NEBNext quick ligation buffer New England BioLabs B6058S
NEBNext Ultra II End repair / dA-tailing module New England BioLabs E7546L
Nextera DNA CD Indexes Illumina 20018708
Nextera DNA Flex Library Prep – (M) Tagmentation Illumina 20018705
Nuclease-free water Sigma Aldrich W4502
Qubit 1X dsDNA HS Assay Kit ThermoFisher Scientific Q33230
Qubit Assay Tubes ThermoFisher Scientific Q32856
Quick T4 DNA Ligase New England BioLabs E6056L
R9 Flow cell Oxford Nanopore Technologies FLO-MIN106D
RNase A ThermoFisher Scientific EN0531
Sheep Blood Hemostat Laboratories DS13250
TE buffer 10mM Tris, 1mM EDTA (pH 8.0)
Triton X-100 Sigma Aldrich T8787
Tryptic Soy Broth BD Diagnostic Systems 211825
Software & Bioinformatic Tools:
Bandage https://rrwick.github.io/Bandage/
Center for Genomic Epidemiology http://www.genomicepidemiology.org/
CLC Genomics Workbench 12 QIAGEN
CRISPRcasFinder https://crisprcas.i2bc.paris-saclay.fr/
FastQC https://www.bioinformatics.babraham.ac.uk/projects/fastqc/
Geneious Prime Geneious
gVolante (BUSCO) https://gvolante.riken.jp/
Kbase Prokka Wrapper https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release
Minimap2 https://github.com/lh3/minimap2
MinKNOW Oxford Nanopore Technologies
NanoFilt https://github.com/wdecoster/nanofilt
NanoStat https://github.com/wdecoster/nanostat
PHASTER https://phaster.ca/
Prokka https://github.com/tseemann/prokka
QUAST http://quast.sourceforge.net/quast
Trim Galore https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/
Trimmomatic http://www.usadellab.org/cms/?page=trimmomatic
Unicycler https://github.com/rrwick/Unicycler#necessary-read-length

References

  1. Brubaker, L., Wolfe, A. The urinary microbiota: a paradigm shift for bladder disorders. Current Opinion in Obstetrics & Gynecology. 28 (5), 407-412 (2016).
  2. Neugent, M. L., Hulyalkar, N. V., Nguyen, V. H., Zimmern, P. E., De Nisco, N. J. Advances in understanding the human urinary microbiome and its potential role in urinary tract infection. mBio. 11 (2), (2020).
  3. Klein, R. D., Hultgren, S. J. Urinary tract infections: microbial pathogenesis, host-pathogen interactions and new treatment strategies. Nature Reviews. Microbiology. 18 (4), 211-226 (2020).
  4. Horsley, H., et al. Enterococcus faecalis subverts and invades the host urothelium in patients with chronic urinary tract infection. PLoS One. 8 (12), 83637 (2013).
  5. Reitzer, L., Zimmern, P. Rapid growth and metabolism of uropathogenic Escherichia coli in relation to urine composition. Clinical Microbiology Reviews. 33 (1), 00101-00119 (2019).
  6. Snyder, J. A., et al. Transcriptome of uropathogenic Escherichia coli during urinary tract infection. Infection and Immunity. 72 (11), 6373-6381 (2004).
  7. Ipe, D. S., Horton, E., Ulett, G. C. The basics of bacteriuria: Strategies of microbes for persistence in urine. Frontiers in Cellular and Infection Microbiology. 6, 14 (2016).
  8. Babikir, I. H., et al. The impact of cathelicidin, the human antimicrobial peptide LL-37 in urinary tract infections. BMC Infectious Diseases. 18 (1), 17 (2018).
  9. Jancel, T., Dudas, V. Management of uncomplicated urinary tract infections. The Western Journal of Medicine. 176 (1), 51-55 (2002).
  10. Ventola, C. L. The antibiotic resistance crisis: part 1: causes and threats. P & T. 40 (4), 277-283 (2015).
  11. Price, T. K., et al. The clinical urine culture: Enhanced techniques improve detection of clinically relevant microorganisms. Journal of Clinical Microbiology. 54 (5), 1216-1222 (2016).
  12. Kass, E. H. Asymptomatic infections of the urinary tract. Transactions of the Association of American Physicians. 69, 56-64 (1956).
  13. Garcia, L. S. . Clinical microbiology procedures handbook. 3rd edn. , (2010).
  14. Fraser, C. M., Eisen, J. A., Nelson, K. E., Paulsen, I. T., Salzberg, S. L. The value of complete microbial genome sequencing (you get what you pay for). Journal of Bacteriology. 184 (23), 6403-6405 (2002).
  15. Chen, Z., Erickson, D. L., Meng, J. Benchmarking hybrid assembly approaches for genomic analyses of bacterial pathogens using Illumina and Oxford Nanopore sequencing. BMC Genomics. 21 (1), 631 (2020).
  16. Greig, D. R., Dallman, T. J., Hopkins, K. L., Jenkins, C. MinION nanopore sequencing identifies the position and structure of bacterial antibiotic resistance determinants in a multidrug-resistant strain of enteroaggregative Escherichia coli. Microbial Genomics. 4 (10), 000213 (2018).
  17. Carraro, D. M., et al. PCR-assisted contig extension: stepwise strategy for bacterial genome closure. Biotechniques. 34 (3), 626-628 (2003).
  18. Tettelin, H., Radune, D., Kasif, S., Khouri, H., Salzberg, S. L. Optimized multiplex PCR: efficiently closing a whole-genome shotgun sequencing project. Genomics. 62 (3), 500-507 (1999).
  19. Wick, R. R., Judd, L. M., Gorrie, C. L., Holt, K. E. Unicycler: Resolving bacterial genome assemblies from short and long sequencing reads. PLoS Computational Biology. 13 (6), 1005595 (2017).
  20. Singhal, N., Kumar, M., Kanaujia, P. K., Virdi, J. S. MALDI-TOF mass spectrometry: an emerging technology for microbial identification and diagnosis. Frontiers in Microbiology. 6, 791 (2015).
  21. Turner, S., Pryer, K. M., Miao, V. P., Palmer, J. D. Investigating deep phylogenetic relationships among cyanobacteria and plastids by small subunit rRNA sequence analysis. The Journal of Eukaryotic Microbiology. 46 (4), 327-338 (1999).
  22. Weisburg, W. G., Barns, S. M., Pelletier, D. A., Lane, D. J. 16S ribosomal DNA amplification for phylogenetic study. Journal of Bacteriology. 173 (2), 697-703 (1991).
  23. Janda, J. M., Abbott, S. L. 16S rRNA gene sequencing for bacterial identification in the diagnostic laboratory: pluses, perils, and pitfalls. Journal of Clinical Microbiology. 45 (9), 2761-2764 (2007).
  24. Stevenson, K., McVey, A. F., Clark, I. B. N., Swain, P. S., Pilizota, T. General calibration of microbial growth in microplate readers. Science Reports. 6, 38828 (2016).
  25. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  26. De Coster, W., D’Hert, S., Schultz, D. T., Cruts, M., Van Broeckhoven, C. NanoPack: visualizing and processing long-read sequencing data. Bioinformatics. 34 (15), 2666-2669 (2018).
  27. Wilson, G., et al. The UNIX Shell. Zenodo. , (2019).
  28. Bankevich, A., et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of Computational Biology. 19 (5), 455-477 (2012).
  29. Vaser, R., Sovic, I., Nagarajan, N., Sikic, M. Fast and accurate de novo genome assembly from long uncorrected reads. Genome Research. 27 (5), 737-746 (2017).
  30. Walker, B. J., et al. Pilon: an integrated tool for comprehensive microbial variant detection and genome assembly improvement. PLoS One. 9 (11), 112963 (2014).
  31. Wick, R. R., Schultz, M. B., Zobel, J., Holt, K. E. Bandage: interactive visualization of de novo genome assemblies. Bioinformatics. 31 (20), 3350-3352 (2015).
  32. Gurevich, A., Saveliev, V., Vyahhi, N., Tesler, G. QUAST: quality assessment tool for genome assemblies. Bioinformatics. 29 (8), 1072-1075 (2013).
  33. Simao, F. A., Waterhouse, R. M., Ioannidis, P., Kriventseva, E. V., Zdobnov, E. M. BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs. Bioinformatics. 31 (19), 3210-3212 (2015).
  34. Seemann, T. Prokka: rapid prokaryotic genome annotation. Bioinformatics. 30 (14), 2068-2069 (2014).
  35. Aziz, R. K., et al. The RAST server: rapid annotations using subsystems technology. BMC Genomics. 9, 75 (2008).
  36. Tatusova, T., et al. NCBI prokaryotic genome annotation pipeline. Nucleic Acids Research. 44 (14), 6614-6624 (2016).
  37. Carattoli, A., Hasman, H. PlasmidFinder and In Silico pMLST: Identification and Typing of Plasmid Replicons in Whole-Genome Sequencing (WGS). Methods in Molecular Biology. 2075, 285-294 (2020).
  38. Carattoli, A., et al. In silico detection and typing of plasmids using PlasmidFinder and plasmid multilocus sequence typing. Antimicrobial Agents and Chemotherapy. 58 (7), 3895-3903 (2014).
  39. Larsen, M. V., et al. Multilocus sequence typing of total-genome-sequenced bacteria. Journal of Clinical Microbiology. 50 (4), 1355-1361 (2012).
  40. Bortolaia, V., et al. ResFinder 4.0 for predictions of phenotypes from genotypes. The Journal of Antimicrobial Chemotherapy. 75 (12), 3491-3500 (2020).
  41. Joensen, K. G., et al. Real-time whole-genome sequencing for routine typing, surveillance, and outbreak detection of verotoxigenic Escherichia coli. Journal of Clinical Microbiology. 52 (5), 1501-1510 (2014).
  42. Arndt, D., et al. PHASTER: a better, faster version of the PHAST phage search tool. Nucleic Acids Research. 44 (1), 16-21 (2016).
  43. Couvin, D., et al. CRISPRCasFinder, an update of CRISRFinder, includes a portable version, enhanced performance and integrates search for Cas proteins. Nucleic Acids Research. 46 (1), 246-251 (2018).
  44. Totten, P. A., Amsel, R., Hale, J., Piot, P., Holmes, K. K. Selective differential human blood bilayer media for isolation of Gardnerella (Haemophilus) vaginalis. Journal of Clinical Microbiology. 15 (1), 141-147 (1982).
  45. Nagarajan, N., Pop, M. Sequence assembly demystified. Nat Reviews. Genetics. 14 (3), 157-167 (2013).
  46. Phillippy, A. M., Schatz, M. C., Pop, M. Genome assembly forensics: finding the elusive mis-assembly. Genome Biology. 9 (3), 55 (2008).
  47. . Unicycler Wiki Available from: https://github.com/rrwick/Unicycler/wiki (2017)

Play Video

Cite This Article
Sharon, B. M., Hulyalkar, N. V., Nguyen, V. H., Zimmern, P. E., Palmer, K. L., De Nisco, N. J. Hybrid De Novo Genome Assembly for the Generation of Complete Genomes of Urinary Bacteria using Short- and Long-read Sequencing Technologies. J. Vis. Exp. (174), e62872, doi:10.3791/62872 (2021).

View Video