פלטפורמה חישובית אנליטית זו מספקת הדרכה מעשית למיקרוביולוגים, אקולוגים ואפידמיולוגים המתעניינים בגנומיקה של אוכלוסיית החיידקים. באופן ספציפי, העבודה שהוצגה כאן הדגימה כיצד לבצע: א) מיפוי מונחה פילוגניה של גנוטיפים היררכיים; 2) ניתוח מבוסס תדרים של גנוטיפים; 3) ניתוחי קרבה וקלונליות; 4) זיהוי של שושלת המבדילה בין לוקים לאביזר.
שימוש שגרתי ושיטתי בריצוף גנום שלם של חיידקים (WGS) משפר את הדיוק והרזולוציה של חקירות אפידמיולוגיות המבוצעות על ידי מעבדות לבריאות הציבור וסוכנויות רגולטוריות. ניתן להשתמש בכמויות גדולות של נתוני WGS הזמינים לציבור כדי לחקור אוכלוסיות פתוגניות בקנה מידה גדול. לאחרונה פורסמה פלטפורמה חישובית זמינה באופן חופשי בשם ProkEvo כדי לאפשר ניתוחים גנומיים של אוכלוסיות מבוססות היררכיה הניתנות לשחזור, אוטומטיות ומדרגיות באמצעות נתוני WGS של חיידקים. יישום זה של ProkEvo הדגים את החשיבות של שילוב מיפוי גנוטיפי סטנדרטי של אוכלוסיות עם כרייה של תוכן גנומי עזר להסקה אקולוגית. בפרט, העבודה המודגשת כאן השתמשה בתפוקות הנגזרות מ- ProkEvo עבור ניתוחים היררכיים בקנה מידה של אוכלוסייה באמצעות שפת התכנות R. המטרה העיקרית הייתה לספק מדריך מעשי למיקרוביולוגים, אקולוגים ואפידמיולוגים על ידי כך שיראו כיצד: 1) להשתמש במיפוי מונחה פילוגנזה של גנוטיפים היררכיים; 2) להעריך התפלגויות תדרים של גנוטיפים כמייצג לכושר אקולוגי; 3) לקבוע יחסי קרבה ומגוון גנטי באמצעות סיווגים גנוטיפיים ספציפיים; ו-4) שושלת מפה המבדילה בין מוקדי אביזר. כדי לשפר את יכולת השכפול והניידות, נעשה שימוש בקבצי R markdown כדי להדגים את כל הגישה האנליטית. מערך הנתונים לדוגמה הכיל נתונים גנומיים מ-2,365 מבודדים של הפתוגן הזואונוטי סלמונלה ניופורט. מיפוי מעוגן פילוגנזה של גנוטיפים היררכיים (Serovar -> BAPS1 -> ST -> cgMLST) חשף את המבנה הגנטי של האוכלוסייה, והדגיש את סוגי הרצפים (STs) כגנוטיפ המבדיל את אבן המפתח. בשלוש השושלות הדומיננטיות ביותר, ST5 ו-ST118 חלקו אב קדמון משותף לאחרונה יותר מאשר עם הפילוטיפ ST45 הקלוני ביותר. הבדלים מבוססי ST הודגשו עוד יותר על ידי התפלגות מוקדי ההתנגדות האנטי-מיקרוביאלית (AMR) של האביזרים. לבסוף, הדמיה מעוגנת פילוגנית שימשה לשילוב גנוטיפים היררכיים ותכולת AMR כדי לחשוף את מבנה הקרבה ואת החתימות הגנומיות הספציפיות לשושלת. בשילוב, גישה אנליטית זו מספקת כמה קווים מנחים לביצוע ניתוחים גנומיים של אוכלוסיית חיידקים היוריסטיים תוך שימוש במידע פאן-גנומי.
השימוש הגובר בריצוף גנום שלם של חיידקים (WGS) כבסיס למעקב שגרתי ולחקירה אפידמיולוגית על ידי מעבדות לבריאות הציבור וסוכנויות רגולטוריות שיפר באופן משמעותי את חקירותההתפרצות של פתוגנים 1,2,3,4. כתוצאה מכך, כמויות גדולות של נתוני WGS שלא זוהו זמינות כעת לציבור וניתן להשתמש בהן כדי לחקור היבטים של ביולוגיה של אוכלוסייה של מינים פתוגניים בקנה מידה חסר תקדים, כולל מחקרים המבוססים על: מבני אוכלוסייה, תדרי גנוטיפ ותדירויות גנים/אללים על פני מאגרים מרובים, אזורים גיאוגרפיים וסוגי סביבות5 . החקירות האפידמיולוגיות הנפוצות ביותר בהנחיית WGS מבוססות על ניתוחים המשתמשים רק בתוכן הליבה-גנומי המשותף, כאשר התוכן המשותף (המשומר) לבדו משמש לסיווג גנוטיפי (למשל, קריאת וריאנטים), וגרסאות אלה הופכות לבסיס לניתוח אפידמיולוגי ולמעקב אחר 1,2,6,7 . בדרך כלל, גנוטיפ מבוסס ליבה-גנום חיידקי מתבצע עם גישות הקלדת רצף רב-לוקוס (MLST) באמצעות שבעה עד כמה אלפי לוקוסים 8,9,10. אסטרטגיות מבוססות MLST אלה כוללות מיפוי של רצפים גנומיים שהורכבו מראש או הורכבו על גבי מסדי נתונים שנאספו במיוחד, ובכך משלבות מידע אלילי ליחידות גנוטיפיות הניתנות לשחזור לצורך ניתוח אפידמיולוגי ואקולוגי11,12. לדוגמה, סיווג מבוסס MLST זה יכול להפיק מידע גנוטיפי בשתי רמות של רזולוציה: סוגי רצף ברמה נמוכה יותר (STs) או ST שושלות (7 loci), וגרסאות גנום ליבה MLST (cgMLST) ברמה גבוהה יותר (~ 300-3,000 loci)10.
הסיווג הגנוטיפי מבוסס MLST הוא נייד מבחינה חישובית וניתן לשחזור רב בין מעבדות, מה שהופך אותו למקובל כגישת תת-הקלדה מדויקת מתחת לרמה של מיני החיידקיםברמה 13,14. עם זאת, אוכלוסיות חיידקים בנויות עם דרגות שונות ספציפיות למין של קלונליות (כלומר, הומוגניות גנוטיפית), דפוסים מורכבים של קרבה היררכית בין גנוטיפים 15,16,17, ומגוון רחב של וריאציות בהתפלגות התוכן הגנומי האביזרי18,19 . לפיכך, גישה הוליסטית יותר חורגת מעבר לסיווגים בדידים לגנוטיפים של MLST ומשלבת את היחסים ההיררכיים של גנוטיפים בקני מידה שונים של רזולוציה, יחד עם מיפוי של תוכן גנומי עזר לסיווגים גנוטיפיים, מה שמאפשר הסקה מבוססת אוכלוסייה 18,20,21 . יתר על כן, ניתוחים יכולים גם להתמקד בדפוסים משותפים של תורשה של לוקוסים גנומיים של אביזרים בין אפילו גנוטיפים הקשורים רחוק21,22. באופן כללי, הגישה המשולבת מאפשרת חקירה אגנוסטית של הקשרים בין מבנה האוכלוסייה לבין התפלגות הרכבים גנומיים ספציפיים (למשל, לוקוסים) בין גרדיאנטים גיאו-מרחביים או סביבתיים. גישה כזו יכולה להניב מידע בסיסי ומעשי כאחד על המאפיינים האקולוגיים של אוכלוסיות ספציפיות שעשויות, בתורן, להסביר את הטרופיזם ודפוסי הפיזור שלהן על פני מאגרים, כגון חיות מזון או בני אדם.
גישה היררכית מבוססת מערכות זו, המוכוונת אוכלוסייה, דורשת כמויות גדולות של נתוני WGS כדי לספק עוצמה סטטיסטית מספקת כדי לחזות חתימות גנומיות הניתנות לחיזוי. כתוצאה מכך, הגישה דורשת פלטפורמה חישובית המסוגלת לעבד אלפים רבים של גנומים חיידקיים בבת אחת. לאחרונה, ProkEvo פותחה והיא פלטפורמת ביואינפורמטיקה זמינה באופן חופשי, אוטומטית, ניידת ומדרגית המאפשרת ניתוחים אינטגרטיביים של אוכלוסיית חיידקים מבוססי היררכיה, כולל מיפוי פאן-גנומי20. ProkEvo מאפשרת לחקור מערכי נתונים חיידקיים בקנה מידה בינוני עד גדול תוך מתן מסגרת ליצירת השערות אפידמיולוגיות ואקולוגיות הניתנות לבדיקה ולהסקה ותחזיות פנוטיפיות שניתן להתאים אישית על ידי המשתמש. עבודה זו משלימה את הצינור הזה במתן מדריך כיצד להשתמש בקבצי פלט שמקורם ב- ProkEvo כקלט לניתוח ופרשנות של סיווגי אוכלוסייה היררכיים וכרייה גנומית אביזרים. מקרה הבוחן שהוצג כאן השתמש באוכלוסיית שושלת סלמונלה אנטריקה I זואונוטית סרובר S. ניופורט כדוגמה ונועדה במיוחד לספק קווים מנחים מעשיים למיקרוביולוגים, אקולוגים ואפידמיולוגים כיצד: 1) להשתמש בגישה אוטומטית התלויה בפילוגנזה כדי למפות גנוטיפים היררכיים; 2) להעריך את התפלגות התדירות של הגנוטיפים כמייצג להערכת כושר אקולוגי; 3) לקבוע דרגות ספציפיות לשושלת של קלונליות באמצעות גישות סטטיסטיות בלתי תלויות; ו-4) למפות מוקדי AMR מבדילי שושלת כדוגמה לאופן שבו ניתן לכרות תוכן גנומי של אביזרים בהקשר של מבנה האוכלוסייה. באופן רחב יותר, גישה אנליטית זו מספקת מסגרת הניתנת להכללה לביצוע ניתוח גנומי מבוסס אוכלוסייה בקנה מידה שניתן להשתמש בו כדי להסיק דפוסים אבולוציוניים ואקולוגיים ללא קשר למין הממוקד.
השימוש בניתוח מבנה אוכלוסייה היוריסטי והיררכי מבוסס מערכות מספק מסגרת לזיהוי חתימות גנומיות חדשניות במערכי נתונים חיידקיים שיש להם פוטנציאל להסביר דפוסים אקולוגיים ואפידמיולוגיים ייחודיים20. בנוסף, ניתן להשתמש במיפוי נתוני הגנום האביזרי על מבנה האוכלוסייה כדי להסיק תכונו?…
The authors have nothing to disclose.
עבודה זו נתמכה על ידי מימון שסופק על ידי חטיבת המחקר החקלאי של UNL-IANR והמכון הלאומי למחקר וחינוך נגד עמידות מיקרוביאלית ועל ידי מרכז המזון לבריאות של נברסקה במחלקת המדע והטכנולוגיה של המזון (UNL). ניתן היה להשלים מחקר זה רק על ידי שימוש במרכז המחשוב של הולנד (HCC) ב- UNL, המקבל תמיכה מיוזמת המחקר של נברסקה. אנו מודים גם על כך שיש לנו גישה, באמצעות HCC, למשאבים המסופקים על ידי רשת המדע הפתוחה (OSG), הנתמכת על ידי הקרן הלאומית למדע ומשרד המדע של משרד האנרגיה האמריקאי. עבודה זו השתמשה בתוכנת ניהול זרימת העבודה של פגסוס הממומנת על ידי הקרן הלאומית למדע (מענק #1664162).
amr_data_filtered | https://figshare.com/account/projects/116625/articles/14829225?file=28758762 | ||
amr_data_raw | https://figshare.com/account/projects/116625/articles/14829225?file=28547994 | ||
baps_output | https://figshare.com/account/projects/116625/articles/14829225?file=28548003 | ||
Core-genome phylogeny | https://figshare.com/account/projects/116625/articles/14829225?file=28548006 | ||
genome_sra | https://figshare.com/account/projects/116625/articles/14829225?file=28639209 | ||
Linux, Mac, or PC | any high-performance platform | ||
mlst_output | https://figshare.com/account/projects/116625/articles/14829225?file=28547997 | ||
sistr_output | https://figshare.com/account/projects/116625/articles/14829225?file=28548000 | ||
figshare credentials are required for login and have access to the files |