توفر هذه المنصة الحسابية التحليلية إرشادات عملية لعلماء الأحياء الدقيقة وعلماء البيئة وعلماء الأوبئة المهتمين بعلم جينوم السكان البكتيري. وعلى وجه التحديد، أظهر العمل المعروض هنا كيفية القيام بما يلي: (أ) رسم الخرائط الموجهة بالسلالات للأنماط الجينية الهرمية؛ و (ب) رسم الخرائط الوراثية الهرمية الموجهة بالسلالات الوراثية؛ و (ج) رسم الخرائط الموجهة بالسلالات للأنماط الجينية الهرمية؛ و (ج) رسم الخرائط الوراثية الموجهة بالسلالات للأنماط ب) التحليل القائم على التردد للأنماط الوراثية؛ ج) تحليلات القرابة والنسلية؛ iv) تحديد النسب الذي يميز مواقع الملحقات.
يعمل الاستخدام الروتيني والمنهجي لتسلسل الجينوم الكامل البكتيري (WGS) على تعزيز دقة وحل التحقيقات الوبائية التي تجريها مختبرات الصحة العامة والوكالات التنظيمية. يمكن استخدام كميات كبيرة من بيانات WGS المتاحة للجمهور لدراسة المجموعات المسببة للأمراض على نطاق واسع. في الآونة الأخيرة ، تم نشر منصة حسابية متاحة مجانا تسمى ProkEvo لتمكين التحليلات الجينومية السكانية القائمة على التسلسل الهرمي القابلة للتكرار والمؤتمتة والقابلة للتطوير باستخدام بيانات WGS البكتيرية. أظهر هذا التنفيذ ل ProkEvo أهمية الجمع بين رسم الخرائط الجينية القياسية للسكان مع تعدين المحتوى الجيني الملحق للاستدلال البيئي. على وجه الخصوص ، استخدم العمل الذي تم تسليط الضوء عليه هنا مخرجات مشتقة من ProkEvo للتحليلات الهرمية ذات النطاق السكاني باستخدام لغة البرمجة R. وكان الهدف الرئيسي هو توفير دليل عملي لعلماء الأحياء الدقيقة وعلماء البيئة وعلماء الأوبئة من خلال إظهار كيفية: (أ) استخدام رسم خرائط موجهة بالسلالات للأنماط الجينية الهرمية؛ و (ب) استخدام خرائط موجهة بالسلالات للأنماط الجينية الهرمية؛ و (ب) استخدام خرائط موجهة بالسلالات للأنماط الجينية الهرمية؛ و (ب) استخدام خرائط موجهة بالسلالات للأنماط الجينية الهرمية؛ و (ب) استخدام خرائط موجهة بالسلالات للأنماط الجينية الهرمية؛ و (ج) استخدام خرائط موجهة بالسلالات للأنماط الجينية الهرمية؛ و (ج) استخدام خرائط موجهة بالسلالات للأنماط الجينية الهرمية؛ و (ج) ب) تقييم التوزيعات الترددية للأنماط الجينية كبديل للياقة البيئية ؛ تحديد علاقات القرابة والتنوع الجيني باستخدام تصنيفات جينية محددة؛ و iv) خريطة النسب التي تميز مواقع الملحقات. لتعزيز قابلية التكرار وقابلية النقل ، تم استخدام ملفات تخفيض علامات R لإظهار النهج التحليلي بأكمله. احتوت مجموعة البيانات النموذجية على بيانات جينومية من 2,365 عزلة من مسببات الأمراض الحيوانية المنشأ المنقولة بالأغذية السالمونيلا نيوبورت. كشفت الخرائط المثبتة على الفيلوجيني للأنماط الجينية الهرمية (Serovar -> BAPS1 -> ST -> cgMLST) عن البنية الجينية للسكان ، مع تسليط الضوء على أنواع التسلسل (STs) باعتبارها حجر الزاوية الذي يميز النمط الوراثي. عبر السلالات الثلاثة الأكثر هيمنة ، تشترك ST5 و ST118 في سلف مشترك في الآونة الأخيرة أكثر من النمط التكاثري ST45 عالي النسيلة. كما تم تسليط الضوء على الاختلافات القائمة على ST من خلال توزيع مواقع مقاومة مضادات الميكروبات الملحقة. وأخيرا، استخدم تصور يرتكز على علم الوراثة للجمع بين الأنماط الجينية الهرمية ومحتوى مقاومة مضادات الميكروبات للكشف عن بنية القرابة والبصمات الجينومية الخاصة بالنسب. يوفر هذا النهج التحليلي مجتمعا بعض المبادئ التوجيهية لإجراء التحليلات الجينومية البكتيرية الإرشادية باستخدام المعلومات الجينومية الشاملة.
أدى الاستخدام المتزايد لتسلسل الجينوم الكامل البكتيري (WGS) كأساس للترصد الروتيني والتحقيق الوبائي من قبل مختبرات الصحة العمومية والوكالات التنظيمية إلى تعزيز كبير في تحقيقات فاشيات مسببات الأمراض1،2،3،4. ونتيجة لذلك، أصبحت الآن كميات كبيرة من بيانات WGS غير المحددة متاحة للجمهور ويمكن استخدامها لدراسة جوانب البيولوجيا السكانية للأنواع المسببة للأمراض على نطاق غير مسبوق، بما في ذلك الدراسات القائمة على: الهياكل السكانية، وترددات النمط الجيني، وترددات الجينات/الأليل عبر مكامن متعددة، ومناطق جغرافية، وأنواع البيئات5 . تستند الاستفسارات الوبائية الأكثر استخداما الموجهة من WGS إلى تحليلات تستخدم فقط المحتوى الجينومي الأساسي المشترك ، حيث يتم استخدام المحتوى المشترك (المحفوظ) وحده لتصنيف النمط الجيني (على سبيل المثال ، استدعاء المتغيرات) ، وتصبح هذه المتغيرات أساسا للتحليل الوبائي وتتبع1،2،6،7 . عادة ، يتم إجراء التنميط الجيني البكتيري القائم على الجينوم الأساسي باستخدام نهج كتابة التسلسل متعدد المواقع (MLST) باستخدام سبعة إلى بضعة آلاف من المواقع8،9،10. وتشمل هذه الاستراتيجيات القائمة على MLST رسم خرائط للتسلسلات الجينومية المجمعة مسبقا أو المجمعة في قواعد بيانات منسقة للغاية ، وبالتالي الجمع بين المعلومات الأليلية في وحدات النمط الجيني القابلة للتكرار للتحليل الوبائي والبيئي11,12. على سبيل المثال ، يمكن لهذا التصنيف القائم على MLST توليد معلومات النمط الجيني على مستويين من الدقة: أنواع التسلسل الأدنى مستوى (STs) أو سلالات ST (7 مواقع) ، ومتغيرات MLST الأساسية ذات المستوى الأعلى (cgMLST) (~ 300-3000 موقع)10.
تصنيف النمط الجيني القائم على MLST محمول حسابيا وقابل للتكرار بشكل كبير بين المختبرات ، مما يجعله مقبولا على نطاق واسع كنهج تصنيف فرعي دقيق تحت مستوى الأنواع البكتيرية13,14. ومع ذلك ، يتم تنظيم المجموعات البكتيرية بدرجات متفاوتة من النسيلة الخاصة بالأنواع (أي التجانس الوراثي) ، والأنماط المعقدة من القرابة الهرمية بين الأنماط الوراثية15،16،17 ، ومجموعة واسعة من التباين في توزيع المحتوى الجينومي التبعي18،19 . وبالتالي ، فإن النهج الأكثر شمولية يتجاوز التصنيفات المنفصلة إلى الأنماط الجينية MLST ويتضمن العلاقات الهرمية للأنماط الجينية على نطاقات مختلفة من الدقة ، إلى جانب رسم خرائط للمحتوى الجينومي التبعي على تصنيفات النمط الجيني ، مما يسهل الاستدلال القائم على السكان18،20،21 . علاوة على ذلك، يمكن أن تركز التحليلات أيضا على الأنماط المشتركة لوراثة المواقع الجينومية الملحقة بين الأنماط الجينية ذات الصلة البعيدة21,22. وعموما، يتيح النهج المشترك الاستجواب اللاأدري للعلاقات بين التركيب السكاني وتوزيع التراكيب الجينومية المحددة (على سبيل المثال، الموقع) بين التدرجات الجغرافية المكانية أو البيئية. ويمكن لمثل هذا النهج أن يسفر عن معلومات أساسية وعملية عن الخصائص الإيكولوجية لمجموعات سكانية محددة قد تفسر بدورها أنماط استداريتها وتشتتها عبر الخزانات، مثل الغذاء أو البشر.
يتطلب هذا النهج الهرمي القائم على النظم والموجه نحو السكان كميات كبيرة من بيانات WGS للحصول على قوة إحصائية كافية للتنبؤ بالتوقيعات الجينومية المميزة. وبالتالي ، يتطلب النهج منصة حسابية قادرة على معالجة عدة آلاف من الجينومات البكتيرية في وقت واحد. في الآونة الأخيرة ، تم تطوير ProkEvo وهو عبارة عن منصة معلوماتية حيوية متاحة مجانا ومؤتمتة ومحمولة وقابلة للتطوير تسمح بتحليلات سكانية بكتيرية تكاملية قائمة على التسلسل الهرمي ، بما في ذلك رسم الخرائط الجينوميةالشاملة 20. يسمح ProkEvo بدراسة مجموعات البيانات البكتيرية متوسطة إلى كبيرة الحجم مع توفير إطار عمل لتوليد فرضيات وبائية وبيئية قابلة للاختبار والاستدلال وتنبؤات مظهرية يمكن تخصيصها من قبل المستخدم. ويكمل هذا العمل خط الأنابيب هذا في توفير دليل حول كيفية استخدام ملفات المخرجات المشتقة من بروكإيفو كمدخلات لتحليل وتفسير تصنيفات السكان الهرمية والتعدين الجينومي الملحق. استخدمت دراسة الحالة المقدمة هنا سكان سلالة السالمونيلا المعوية I serovar S. نيوبورت كمثال وكان يهدف على وجه التحديد إلى توفير مبادئ توجيهية عملية لعلماء الأحياء الدقيقة وعلماء البيئة وعلماء الأوبئة حول كيفية: أ) استخدام نهج آلي يعتمد على علم الوراثة لرسم خرائط الأنماط الجينية الهرمية. ب) تقييم التوزيع الترددي للأنماط الجينية كبديل لتقييم اللياقة البيئية ؛ ج) تحديد درجات النسب الخاصة بالنسب باستخدام مناهج إحصائية مستقلة؛ ورابعا) رسم خريطة لمواقع مقاومة مضادات الميكروبات التي تميز النسب كمثال على كيفية استخراج المحتوى الجينومي التبعي في سياق التركيب السكاني. وعلى نطاق أوسع، يوفر هذا النهج التحليلي إطارا قابلا للتعميم لإجراء تحليل جينومي قائم على السكان على نطاق يمكن استخدامه لاستنتاج الأنماط التطورية والإيكولوجية بغض النظر عن الأنواع المستهدفة.
يوفر استخدام تحليل التركيب السكاني الإرشادي والهرمي القائم على النظم إطارا لتحديد التوقيعات الجينومية الجديدة في مجموعات البيانات البكتيرية التي لديها القدرة على شرح الأنماط الإيكولوجية والوبائية الفريدة20. بالإضافة إلى ذلك ، يمكن استخدام رسم خرائط بيانات الجينوم الملحقة …
The authors have nothing to disclose.
وقد تم دعم هذا العمل من خلال التمويل المقدم من شعبة البحوث الزراعية UNL-IANR والمعهد الوطني لبحوث مقاومة مضادات الميكروبات والتعليم ومن مركز نبراسكا للأغذية من أجل الصحة في إدارة علوم وتكنولوجيا الأغذية (UNL). لا يمكن إكمال هذا البحث إلا من خلال استخدام مركز هولندا للحوسبة (HCC) في UNL ، والذي يتلقى الدعم من مبادرة نبراسكا للأبحاث. نحن ممتنون أيضا لتمكننا من الوصول ، من خلال HCC ، إلى الموارد التي توفرها شبكة العلوم المفتوحة (OSG) ، والتي تدعمها المؤسسة الوطنية للعلوم ومكتب العلوم التابع لوزارة الطاقة الأمريكية. استخدم هذا العمل برنامج Pegasus لإدارة سير العمل الذي تموله المؤسسة الوطنية للعلوم (منحة #1664162).
amr_data_filtered | https://figshare.com/account/projects/116625/articles/14829225?file=28758762 | ||
amr_data_raw | https://figshare.com/account/projects/116625/articles/14829225?file=28547994 | ||
baps_output | https://figshare.com/account/projects/116625/articles/14829225?file=28548003 | ||
Core-genome phylogeny | https://figshare.com/account/projects/116625/articles/14829225?file=28548006 | ||
genome_sra | https://figshare.com/account/projects/116625/articles/14829225?file=28639209 | ||
Linux, Mac, or PC | any high-performance platform | ||
mlst_output | https://figshare.com/account/projects/116625/articles/14829225?file=28547997 | ||
sistr_output | https://figshare.com/account/projects/116625/articles/14829225?file=28548000 | ||
figshare credentials are required for login and have access to the files |