هذا البروتوكول تفاصيل نهج شامل لزراعة وتسلسل، ودي نوفو تجميع الجينوم الهجين من البكتيريا البولية. وهو يوفر إجراء قابل للتكرار لتوليد تسلسلات الجينوم الدائرية الكاملة المفيدة في دراسة كل من العناصر الوراثية الكروموسومية وخارج الكروموسومية التي تساهم في استعمار المسالك البولية، والتسبب في الإمراض، ونشر مقاومة مضادات الميكروبات.
توفر تسلسلات الجينوم الكاملة بيانات قيمة لفهم التنوع الوراثي وعوامل الاستعمار الفريدة للميكروبات البولية. وقد تشمل هذه البيانات العناصر الوراثية المتنقلة، مثل البلازميدات والفياج خارج الكروموسومات، التي تسهم في نشر مقاومة مضادات الميكروبات وتزيد من تعقيد علاج عدوى المسالك البولية. بالإضافة إلى توفير دقة في بنية الجينوم ، تسمح الجينومات الكاملة والمغلقة بالجينوم المقارن التفصيلي والتحليلات التطورية. لطالما كان توليد الجينوم الكامل مهمة صعبة بسبب القيود المفروضة على تكنولوجيا التسلسل المتاحة. ينتج تسلسل الجيل التالي المقترن (NGS) قراءات قصيرة عالية الجودة غالبا ما تؤدي إلى تجميعات جينوم دقيقة ولكنها مجزأة. على العكس من ذلك ، يوفر تسلسل Nanopore قراءات طويلة من جودة أقل مما يؤدي عادة إلى تجميعات كاملة عرضة للخطأ. وقد تعوق هذه الأخطاء دراسات الارتباط على نطاق الجينوم أو توفر نتائج تحليل متغيرة مضللة. لذلك ، ظهرت النهج الهجينة التي تجمع بين القراءات القصيرة والطويلة كطرق موثوقة لتحقيق الجينوم البكتيري المغلق عالي الدقة. وذكرت هنا هو وسيلة شاملة لثقافة البكتيريا البولية المتنوعة، وتحديد الأنواع من قبل تسلسل الجينات 16S rRNA، واستخراج الحمض النووي الجينومي (gDNA)، وتوليد قراءات قصيرة وطويلة من قبل منصات NGS وNanopore، على التوالي. بالإضافة إلى ذلك، تصف هذه الطريقة خط أنابيب المعلوماتية الحيوية من خوارزميات مراقبة الجودة والتجميع والتنبؤ الجيني لتوليد تسلسل الجينوم الكامل المشروح. مزيج من الأدوات المعلوماتية الحيوية تمكن من اختيار بيانات القراءة عالية الجودة لتجميع الجينوم الهجين وتحليل المصب. ويمكن تكييف النهج المبسط لتجميع الجينوم الهجين دي نوفو الموصوفة في هذا البروتوكول للاستخدام في أي بكتيريا قابلة للتكتل.
الميكروبيوم البولي هو مجال ناشئ من الأبحاث التي حطمت الاعتقاد الخاطئ لعقود طويلة بأن المسالك البولية معقمة في الأفراد الأصحاء. أعضاء الميكروبات البولية قد تعمل على تحقيق التوازن بين البيئة البولية ومنع عدوى المسالك البولية (UTI)1،2. البكتيريا المسالك البولية تغزو المسالك البولية وتستخدم آليات ضراوة متنوعة لإزاحة الميكروبات المقيمة ، واستعمار المسالك البولية ، والتهرب من الاستجابات المناعية ومواجهة الضغوط البيئية3،4. البول هو وسيلة محدودة نسبيا المغذيات تتميز ارتفاع osmolarity، النيتروجين محدودة وتوافر الكربوهيدرات، وانخفاض الأوكسجين، وانخفاض درجة الحموضة5،6،7. ويعتبر البول أيضا أن تكون مضادات الميكروبات, تتألف من تركيزات عالية من اليوريا المثبطة والببتيدات المضادة للميكروبات مثل cathelicidin الإنسان LL-378. آليات التحقيق المستخدمة من قبل كل من البكتيريا المقيمة وuropathogens لاستعمار المسالك البولية أمر بالغ الأهمية لزيادة فهم صحة المسالك البولية ووضع استراتيجيات جديدة لعلاج التهاب المسالك البولية. وعلاوة على ذلك، مع فشل العلاجات المضادة للميكروبات في الخط الأمامي يصبح أكثر شيوعا، من المهم على نحو متزايد لرصد نشر العناصر الوراثية المتنقلة التي تحمل محددات مقاومة مضادات الميكروبات داخل مجموعات من البكتيريا البولية9،10.
للتحقيق في الأنماط الجينية والأنماط الظاهرية للبكتيريا البولية ، فإن ثقافتهم الناجحة وتسلسل الجينوم الكامل اللاحق (WGS) أمر حتمي. الطرق المعتمدة على الثقافة ضرورية للكشف عن الميكروبات القابلة للحياة وتحديدها في عينات البول11. ثقافة البول السريرية القياسية ينطوي على طلاء البول على 5٪ أجار دم الأغنام (BAP) وMacConkey أجار واحتضان هوائيا في 35 درجة مئوية لمدة 24 ساعة12. ومع ذلك، مع عتبة الكشف عن ≥105 CFU/mL13،لا يتم الإبلاغ عن العديد من أعضاء الميكروبات البولية من خلال هذه الطريقة. تقنيات زراعة المخدرات المحسنة مثل تعزيز ثقافة البول الكمي (EQUC)11 تستخدم مجموعات مختلفة من أحجام البول المختلفة ، وأوقات الحضانة ، ووسائل الإعلام الثقافية ، والظروف الجوية لتحديد الميكروبات التي تفتقدها عادة ثقافة البول القياسية. وصف في هذا البروتوكول هو نسخة معدلة من EQUC, يطلق عليها هنا تعديل تعزيز بروتوكول ثقافة البول, التي تمكن من زراعة البكتيريا البولية المتنوعة وuropathogens باستخدام وسائل الإعلام الانتقائية والظروف الجوية المثلى ولكن ليس كميا بطبيعتها. العزل الناجح للبكتيريا البولية تمكن من استخراج الحمض النووي الجينومي (gDNA) لWGS المصب وجمع الجينوم.
تمكن تجميعات الجينوم ، والتجميعات الكاملة على وجه الخصوص ، من اكتشاف العوامل الوراثية التي قد تساهم في الاستعمار ، والصيانة المتخصصة ، والفوعة بين كل من البكتيريا الدقيقة والبكتيريا الوروباتشيكية المقيمة. تحتوي تجميعات الجينوم المسودة على عدد متنوع من التسلسلات المتجاورة (المتجاورة) التي قد تحتوي على أخطاء تسلسلية وتفتقر إلى معلومات التوجيه. في تجميع الجينوم كاملة، وقد تم التحقق من كل من التوجه ودقة كل زوج قاعدة14. وعلاوة على ذلك، فإن الحصول على تسلسل الجينوم الكامل يوفر نظرة ثاقبة في بنية الجينوم والتنوع الوراثي والعناصر الوراثية المتنقلة15. قراءات قصيرة وحدها قد تحدد وجود أو عدم وجود جينات هامة ولكن قد لا تحدد سياقها الجينومي16. مع تمكين تقنيات التسلسل طويلة القراءة مثل أكسفورد Nanopore وPacBio ، وتوليد مغلقة دي نوفو تجميعات الجينوم البكتيري لم يعد يتطلب أساليب مضنية مثل إغلاق يدوي للتجمعات دي نوفو من قبل PCRمتعددة 17،18. مزيج من الجيل القادم قصيرة القراءة التسلسل وNanopore تقنيات تسلسل القراءة الطويلة يسمح للجيل سهل من دقيقة وكاملة ومغلقة جمعيات الجينوم البكتيرية بتكاليف منخفضة نسبيا19. تسلسل القراءة القصيرة تنتج دقيقة بعد تجميعات الجينوم مجزأة تتكون عموما من متوسط 40-100 المتجاورة، في حين أن تسلسل Nanopore يولد قراءات طويلة من حوالي 5-100 كيلو بايت في الطول التي هي أقل دقة ولكن يمكن أن تكون بمثابة سقالات للانضمام إلى المتجاورة وحل سينتيني الجينوم. يمكن أن تنتج النهج الهجينة التي تستخدم تقنيات القراءة القصيرة والقراءة الطويلة الجينوم البكتيري الدقيق والكامل19.
وصف هنا هو بروتوكول شامل لعزل وتحديد البكتيريا من البول البشري، واستخراج الحمض النووي الجينوم، والتسلسل، وتجميع الجينوم كاملة باستخدام نهج التجميع الهجين. يوفر هذا البروتوكول تركيزا خاصا على الخطوات اللازمة لتعديل القراءات الناتجة عن التسلسل قصير القراءة والقراءة الطويلة بشكل صحيح للتجميع الدقيق للكروموسوم البكتيري المغلق والعناصر خارج الكروموسومات مثل البلازميدات.
يقدم بروتوكول تجميع الجينوم الهجين الشامل الموصوف هنا نهجا مبسطا للنجاح في زراعة الميكروبات البولية المتنوعة والمسالك البولية ، والتجميع الكامل لجينومها. يبدأ WGS الناجح من الجينوم البكتيري بعزل الميكروبات المتنوعة والسريعة في بعض الأحيان من أجل استخراج الحمض النووي الجينومي الخاص بها. حتى الآن، تفتقر بروتوكولات زراعة البول الحالية إما إلى الحساسية اللازمة للكشف عن العديد من الأنواع البولية أو تنطوي على نهج طويلة وواسعة النطاق تتطلب وقتا طويلا وموارد11. يقدم نهج ثقافة البول المحسن المعدل الموصوف بروتوكولا مبسطا وشاملا للعزل الناجح للبكتيريا التي تنتمي إلى 17 جنسا بوليا شائعا ، بما في ذلك الأنواع المشتركة المسببة للأمراض أو المفيدة ، والبكتيريا الهوائية أو اللاهوائية التي يحتمل أن تكون مسببة للأمراض أو مفيدة. وهذا بدوره يوفر المواد اللازمة لبدء تسلسل دقيق وتجميع الجينوم البكتيري والتجارب الحيوية، والتي تسهم في فهم صحة المسالك البولية والمرض. وعلاوة على ذلك، فإن هذا النهج المعدل للثقافة ينص على تشخيص سريري أكثر تحديدا للكائنات الحية الدقيقة القابلة للحياة الموجودة في عينات البول ويسمح ببنوكها الحيوية للدراسات الجينومية المستقبلية. ومع ذلك، هذا البروتوكول لا يخلو من قيود. قد يتطلب الأمر فترات حضانة طويلة اعتمادا على الكائن الحي بالإضافة إلى استخدام موارد مثل غرفة نقص الأكxia أو الحاضنات الخاضعة للرقابة التي قد لا تكون متاحة بسهولة. استخدام GasPaks اللاهوائية يوفر حلا بديلا ولكن هذه مكلفة ولا تنتج دائما بيئة مستدامة وخاضعة للرقابة. وأخيرا، قد يسمح التحيز الثقافي وكذلك تنوع العينات لكائنات معينة ومركبات المسالك البولية بالتنافس مع البكتيريا السريعة. على الرغم من هذه القيود، يتم جعل ثقافة البكتيريا البولية المتنوعة ممكنة من خلال هذا النهج.
وقد اكتسب تسلسل الجينوم شعبية مع تقدم الجيل القادم من تقنيات التسلسل التي زادت بشكل كبير كل من العائد ودقة تسلسل البيانات14،15. إلى جانب تطوير خوارزميات لمعالجة البيانات وتجميع دي نوفو ، فإن تسلسل الجينوم الكامل في متناول العلماء المبتدئين والخبراء على حد سواء15،45. توفر المعرفة بتنظيم الجينوم الشامل الذي توفره الجينوم الكامل رؤى تطورية وبيولوجية مهمة ، بما في ذلك الازدواجية الجينية ، وفقدان الجينات ، ونقل الجينات الأفقي14. بالإضافة إلى ذلك ، غالبا ما يتم توطين الجينات الهامة لمقاومة مضادات الميكروبات والفوعة على العناصر المتنقلة ، والتي عادة ما لا يتم حلها في تجميعات الجينوم المسودة15،16.
يتبع البروتوكول هنا نهجا هجينا لمزيج من بيانات التسلسل من منصات قصيرة القراءة وطويلة القراءة لتوليد تجميعات الجينوم الكاملة. في حين تركز على الجينوم البكتيري البولي، قد يتم تكييف هذا الإجراء مع البكتيريا المتنوعة من مصادر العزل المختلفة. وتشمل الخطوات الحاسمة في هذا النهج اتباع تقنية معقمة كافية واستخدام وسائل الإعلام المناسبة وظروف الثقافة لعزل البكتيريا البولية النقية. وعلاوة على ذلك، فإن استخراج gDNA سليمة وعالية الغلة أمر ضروري لتوليد بيانات التسلسل خالية من تلوث يقرأ التي قد تعوق نجاح التجمع. بروتوكولات إعداد المكتبة اللاحقة حاسمة لتوليد قراءات عالية الجودة من الطول والعمق الكافيين. لذلك ، من الأهمية بمكان التعامل مع gDNA بعناية أثناء إعداد المكتبة لتسلسل القراءة الطويلة على وجه الخصوص ، حيث أن أكبر فائدة لهذه التكنولوجيا هي توليد قراءات طويلة بدون حد أقصى نظري للطول العلوي. كما تم توضيح أقسام لمراقبة الجودة المناسبة (QC) من قراءات التسلسل التي تقضي على البيانات الصاخبة وتحسن نتائج التجميع.
على الرغم من عزل الحمض النووي الناجح ، وإعداد المكتبة ، والتسلسل ، فإن طبيعة العمارة الجينومية لبعض الأنواع قد لا تزال تشكل عقبة أمام توليد تجميع الجينوم المغلق45،46. غالبا ما تعقد التسلسلات المتكررة حساب التجميع ، وعلى الرغم من بيانات القراءة الطويلة ، قد يتم حل هذه المناطق بثقة منخفضة ، أو لا يتم حلها على الإطلاق. يقرأ طويلة لذلك يضطر كنت في معدل طويلة من الكبيرة يكرر منطقة في الجينوم أو تغطية ينبغي كنت عال (>100x)19. وقد تظل بعض الجينومات غير مكتملة وتتطلب نهجا يدوية للإنجاز. ومع ذلك، فإن الجينوم المختلط غير المكتمل المجمع يتكون عادة من متجاورات أقل من الجينومات القصيرة القراءة. قد يساعد ضبط المعلمات الافتراضية خوارزمية التجميع أو اتباع اقتطاعات أكثر صرامة لقراءة QC. وبدلا من ذلك، فإن أحد النهج المقترحة هو رسم خريطة قراءات طويلة للمناطق غير المكتملة بحثا عن أدلة على مسار التجميع الأكثر احتمالا، ثم تأكيد المسار الذي يستخدم تسلسل PCR وSanger للمنطقة المضخمة. ويقترح تعيين يقرأ باستخدام Minimap2 وضمادة يقدم أداة مفيدة لتصور قراءات المعينة على طول المواق تجميعها توفير الأدلة على الربطالمتجاورة 47.
ويكمن التحدي الإضافي لتوليد الجينوم الكامل في الألفة والراحة مع أدوات سطر الأوامر. يتم تطوير العديد من الأدوات المعلوماتية الحيوية لتوفير الفرص الحسابية لأي مستخدم؛ ومع ذلك، فإن استخدامها يعتمد على فهم أساسيات يونيكس والبرمجة. يهدف هذا البروتوكول إلى توفير تعليمات مفصلة بما فيه الكفاية لتمكين الأفراد الذين ليس لديهم خبرة سابقة في سطر الأوامر من إنشاء تجميعات الجينوم المغلقة والتعليق عليها.
The authors have nothing to disclose.
نشكر الدكتور موتيسي جبيدة إسلام والدكتور لوك جويس على مساهماتهما في هذا البروتوكول. ونود أيضا أن نعترف بجامعة تكساس في مركز دالاس للجينوم لردود فعلهم ودعمهم. تم تمويل هذا العمل من قبل مؤسسة ويلش، رقم الجائزة AT-2030-20200401 إلى N.J.D. ، من قبل المعاهد الوطنية للصحة، ورقم الجائزة R01AI116610 إلى K.P. ، وكرسي فيليسيا وجون كاين في صحة المرأة، الذي عقدته P.E.Z.
Equipment: | |||
Bioanalyzer 2100 | Agilent | G29398A | Optional but recommended |
Centrifuge | Eppendorf | — | Any centrifuge for spinning conicals and microcentrifuge tubes (e.g. Models 5810R/5424R) |
Electrophoresis | BioRad Laboratories | 1645070 | |
Gel Imaging System | BioRad Laboratories | ChemiDoc models | |
Incubator | ThermoFisher Scientific | — | Any CO2 Incubator (e.g. Thermo Forma model 3110) |
Magnetic Rack | New England BioLabs | S15095 | 12-tube rack |
MinION | Oxford Nanopore Technologies | — | |
Nanodrop | ThermoFisher Scientific | ND-ONE-W | |
NextSeq 500 | Illumina | SY-415-1002 | Other Illumina models are acceptable |
Plate Reader | BioTek | — | Synergy H1 |
Qubit fluorometer | ThermoFisher Scientific | Q33238 | |
Rotator | Benchmark Scientific | H2024 | |
Thermocycler | ThermoFisher Scientific | — | Any thermocycler for PCR reactions (e.g. ProFlex PCR system) |
Materials: | |||
10X Phosphate Buffered Saline (PBS) | Fisher Scientific | BP3991 | |
10X TBE buffer | — | — | 1M Tris,1M Boric Acid,0.2M EDTA (pH 8.0) |
1429R primer | Sigma Aldrich (Custom oligos) | — | GGTTACCTTGTTACGACTT |
1kb Ladder | VWR | 101228-494 | |
1M Tris-Cl (pH 7.5) | ThermoFisher Scientific | 15567027 | |
6x Loading dye | Fisher Scientific | NC0783588 | |
8F primer | Sigma Aldrich (Custom oligos) | — | AGAGTTTGATCCTGGCTCAG |
Agar | Fisher Scientific | BP1423-2 | |
Agarose | BioRad Laboratories | 63001 | |
AMPure XP Beads | Beckman Coulter | A63880 | |
Anaerobe Pouch System – GasPak EZ | BD Diagnostic Systems | B260683 | |
Boric Acid | Fisher Scientific | A73-500 | |
Brain Heart Infusion Broth | BD Diagnostic Systems | 212304 | |
CDC Anaerobe 5% Sheep Blood Agar | BD Diagnostic Systems | L007357 | |
CHROMagar Orientation | BD Diagnostic Systems | PA-257481.04 | |
DNeasy Blood & Tissue | QIAGEN | 69504 | |
DreamTaq Master Mix | ThermoFisher Scientific | K1081 | |
Dry Anaerobic Indicator Strips | BD Diagnostic Systems | 271051 | |
EDTA | Fisher Scientific | S311-500 | |
Ethanol 200 Proof | Sigma Aldrich | E7023 | For molecular biology |
Ethidium Bromide | ThermoFisher Scientific | BP130210 | |
Flow cell priming kit | Oxford Nanopore Technologies | EXP-FLP002 | |
Flow cell wash kit | Oxford Nanopore Technologies | EXP-WSH003 | |
Gel Extraction Miniprep Kit | BioBasic | BS654 | |
Ligation sequencing kit | Oxford Nanopore Technologies | SQK-LSK109 | |
Lysozyme | Research Products International Corp | L381005.05 | |
Mutanolysin | Sigma Aldrich | M9901-5KU | |
Native barcoding expansion 1-12 | Oxford Nanopore Technologies | EXP-NBD104 | |
NEB Blunt/TA Ligase Master Mix | New England BioLabs | M0367L | |
NEBNext FFPE DNA Repair Mix | New England BioLabs | M6630L | |
NEBNext quick ligation buffer | New England BioLabs | B6058S | |
NEBNext Ultra II End repair / dA-tailing module | New England BioLabs | E7546L | |
Nextera DNA CD Indexes | Illumina | 20018708 | |
Nextera DNA Flex Library Prep – (M) Tagmentation | Illumina | 20018705 | |
Nuclease-free water | Sigma Aldrich | W4502 | |
Qubit 1X dsDNA HS Assay Kit | ThermoFisher Scientific | Q33230 | |
Qubit Assay Tubes | ThermoFisher Scientific | Q32856 | |
Quick T4 DNA Ligase | New England BioLabs | E6056L | |
R9 Flow cell | Oxford Nanopore Technologies | FLO-MIN106D | |
RNase A | ThermoFisher Scientific | EN0531 | |
Sheep Blood | Hemostat Laboratories | DS13250 | |
TE buffer | — | — | 10mM Tris, 1mM EDTA (pH 8.0) |
Triton X-100 | Sigma Aldrich | T8787 | |
Tryptic Soy Broth | BD Diagnostic Systems | 211825 | |
Software & Bioinformatic Tools: | |||
Bandage | — | — | https://rrwick.github.io/Bandage/ |
Center for Genomic Epidemiology | — | — | http://www.genomicepidemiology.org/ |
CLC Genomics Workbench 12 | QIAGEN | — | |
CRISPRcasFinder | — | — | https://crisprcas.i2bc.paris-saclay.fr/ |
FastQC | — | — | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ |
Geneious Prime | Geneious | — | |
gVolante (BUSCO) | — | — | https://gvolante.riken.jp/ |
Kbase Prokka Wrapper | — | — | https://kbase.us/applist/apps/ProkkaAnnotation/annotate_contigs/release |
Minimap2 | — | — | https://github.com/lh3/minimap2 |
MinKNOW | Oxford Nanopore Technologies | — | |
NanoFilt | — | — | https://github.com/wdecoster/nanofilt |
NanoStat | — | — | https://github.com/wdecoster/nanostat |
PHASTER | — | — | https://phaster.ca/ |
Prokka | — | — | https://github.com/tseemann/prokka |
QUAST | — | — | http://quast.sourceforge.net/quast |
Trim Galore | — | — | https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/ |
Trimmomatic | — | — | http://www.usadellab.org/cms/?page=trimmomatic |
Unicycler | — | — | https://github.com/rrwick/Unicycler#necessary-read-length |