Summary

מידול מבנה רבעוני באמצעות ספקטרומטריית מסה מצטלבת כימית: הרחבת דוחות TX-MS Jupyter

Published: October 20, 2021
doi:

Summary

ספקטרומטריית מסה חוצה-קישור ממוקדת יוצרת מודלים של מבנה חלבונים רבעוניים באמצעות נתוני ספקטרומטריית מסה שנרכשו באמצעות עד שלושה פרוטוקולי רכישה שונים. כאשר התוצאות מבוצעות כזרימת עבודה פשוטה יותר בשרת האינטרנט של צ’יטה-MS, התוצאות מדווחות במחברת Jupyter. כאן, אנו מדגימים את ההיבטים הטכניים של האופן שבו ניתן להרחיב את מחברת Jupyter לניתוח מעמיק יותר.

Abstract

אינטראקציות חלבון-חלבון יכולות להיות מאתגרות לחקר, אך מספקות תובנות לגבי אופן תפקודן של מערכות ביולוגיות. ספקטרומטריית מסה צולבת ממוקדת (TX-MS), שיטה המשלבת מידול מבנה חלבונים רבעוניים וספקטרומטריית מסה מצטלבת כימית, יוצרת מודלים של מבנה ברמת דיוק גבוהה באמצעות נתונים המתקבלים מדגימות מורכבות ולא מופרדות. זה מסיר את אחד המכשולים העיקריים לניתוח מבנה מורכב חלבון כי החלבונים של עניין כבר לא צריך להיות מטוהר בכמויות גדולות. שרת האינטרנט של צ’יטה-MS פותח כדי להפוך את הגרסה הפשוטה של הפרוטוקול לנגישה יותר לקהילה. בהתחשב בנתוני MS/MS הדו-מושביים, Cheetah-MS מייצר מחברת Jupyter, דוח גרפי המסכם את תוצאות הניתוח החשובות ביותר. הרחבת מחברת Jupyter יכולה להניב תובנות מעמיקות יותר ולהבין טוב יותר את המודל ואת נתוני ספקטרומטריית המסה התומכים בו. הפרוטוקול הטכני המוצג כאן מדגים כמה מההרחבות הנפוצות ביותר ומסביר איזה מידע ניתן להשיג. הוא מכיל בלוקים המסייעים בניתוח נתוני רכישת MS/MS דו-מושביים וההשפעה הכוללת של ה- XLs שזוהו במודלים הרבעוניים המדווחים. ניתן להחיל את התוצאה של ניתוחים כאלה על מודלים מבניים המוטבעים במחברת באמצעות NGLView.

Introduction

אינטראקציות חלבון-חלבון מבססות את המבנה והתפקוד של מערכות ביולוגיות. גישה למבנים רבעוניים של חלבונים יכולה לספק תובנות לגבי האופן שבו שני חלבונים או יותר מתקשרים ויוצרים מבנים מסדר גבוה. למרבה הצער, השגת מבנים רבעוניים נותרה מאתגרת; זה בא לידי ביטוי במספר קטן יחסית של ערכי חלבון DataBank (PDB)1 המכיל יותר מפוליפפטיד אחד. אינטראקציות חלבון-חלבון ניתן ללמוד עם טכנולוגיות כגון קריסטלוגרפיה של קרני רנטגן, NMR, ו cryo-EM, אבל קבלת כמות מספקת של חלבון מטוהר בתנאים שבהם ניתן ליישם את השיטות יכול להיות זמן רב.

ספקטרומטריית מסה מצטלבת כימית פותחה כדי להשיג נתונים ניסיוניים על אינטראקציות חלבון-חלבון עם פחות הגבלות על הכנת מדגם כמו ספקטרומטריית מסה ניתן להשתמש כדי לרכוש נתונים על דגימות מורכבות שרירותיות 2,3,4,5,6,7,8,9 . עם זאת, האופי הקומבינטורי של ניתוח הנתונים ומספר קטן יחסית של פפטידים מקושרים דורשים שהדגימות יחולקו לפני הניתוח. כדי לטפל בחסרון זה, פיתחנו את TX-MS, שיטה המשלבת מידול חישובי עם ספקטרומטריית מסה מצטלבת כימית10. TX-MS ניתן להשתמש על דגימות מורכבות באופן שרירותי והוא רגיש באופן משמעותי יותר בהשוואה לשיטות קודמות10. היא משיגה זאת על ידי ניקוד כל הנתונים הקשורים לאינטראקציה נתונה של חלבון-חלבון כקבוצה במקום לפרש כל ספקטרום טרשת נפוצה באופן עצמאי. TX-MS משתמש גם בעד שלושה פרוטוקולי רכישה שונים של טרשת נפוצה: MS1 ברזולוציה גבוהה (hrMS1), רכישה תלוית נתונים (DDA) ורכישה בלתי תלוית נתונים (DIA), מה שמוסיף לספק הזדמנויות לזהות פפטיד מקושר על-ידי שילוב תצפיות מרובות. זרימת העבודה החישובית של TX-MS מורכבת מכמה סיבות. ראשית, הוא מסתמך על תוכנות ניתוח טרשת נפוצה מרובות 11,12,13 כדי ליצור מודלים של מבנה חלבון 14,15. שנית, כמות הנתונים יכולה להיות ניכרת. שלישית, שלב הדוגמנות יכול לצרוך כמויות משמעותיות של כוח עיבוד מחשב.

כתוצאה מכך, TX-MS משמש בצורה הטובה ביותר כזרימת עבודה חישובית אוטומטית ופשוטה באמצעות שרת האינטרנט Cheetah-MS16 הפועל על תשתיות חישוביות גדולות כגון ענני מחשב או אשכולות. כדי להקל על הפרשנות של התוצאות, הפקנו מחברת Jupyter אינטראקטיבית17. כאן, אנו מדגימים כיצד ניתן להרחיב את הדוח מחברת Jupyter כדי להניב ניתוח מעמיק יותר של תוצאה נתונה.

Protocol

1. שלח זרימת עבודה https://txms.org. עבור אל https://txms.org ולחץ על “השתמש בצ’יטה-טרשת נפוצה”. כדי לשלוח זרימת עבודה, עליך לספק שני קבצי PDB וקובץ mzML או MGF אחד של MS/MS/ MS. באפשרותך גם ללחוץ על “טען נתונים לדוגמה” כדי לראות את גירסת ההדגמה של זרימת העבודה.הערה: עיין בדף הידני של שרת האינטרנט לקבלת מידע מפורט אודות אופן השליחה של משימה. שרת האינטרנט תומך בסוכנים שונים שאינם ניתנים לחיתוך בין קישורים, עד 12 שינויים לאחר התרגום (PTMs), אפשרויות הקשורות למידול חישובי וניתוח נתוני MS. לחצני עזרה קטנים מתוכננים גם בדף השליחה כדי להציג מידע נוסף לגבי כל אפשרות. 2. הפעל צ’יטה-מ.ס. הערה: המר את התבניות הספציפיות לספק ל- mzML או MGF באמצעות תוכנת ProteoWizard MSConvert19. העלה את נתוני הטרשת הנפוצה https://txms.org. לאחר מכן, לחץ על “בחר קובץ” ובחר את נתוני MS, אשר חייב להיות בפורמטים נתונים mzML / MGF18.הערה: נתונים לדוגמה זמינים https://txms.org. נתונים אלה נגישים ישירות גם באמצעות zenodo.org, DOI 10.5281/zenodo.3361621. העלה שני קבצי PDB https://txms.org. לחץ על “בחר קובץ” ובחר את קבצי PDB להעלאה.הערה: אם לא קיימים מבנים ניסיוניים, צור מודלים באמצעות, לדוגמה, SWISS-MODEL20 אם מבנים הומולוגיים זמינים, או trRosetta21,22 או Robetta23,24 שרתי אינטרנט עבור תחזיות מבנה דה נובו. שלח זרימת עבודה חדשה. לחץ על “שלח” כדי לקבל תג מזהה משימה. לאחר מכן, בצע את הטופס למקטע התוצאות באמצעות תג זה.הערה: חישוב התוצאה לוקח זמן, לכן המתן עד שזרימת העבודה תסתיים, ואחסן את תג מזהה המשימה כדי לחזור לדף התוצאות. החישוב מתבצע על גבי תשתית חישובית מרחוק. אם ברצונכם להפעיל את TX-MS באופן מקומי, אנא עיינו בהורי ואח’ 10. בדוק את הדוח מחברת Jupyter באמצעות המציג המקוון. לאחר מכן, גלול מטה אל “דווח” במקטע התוצאות באמצעות תג מזהה המשימה. 3. להתקין JupyterHub. התקן את docker בהתאם להוראות https://docs.docker.com/install/. הורד את מיכל Docker JupyterHub עם הרחבת Jupyter openBIS25. הפקודה הכללית היא “docker pull malmstroem/jove:latest”, אך עשויה להיות שונה בפלטפורמות אחרות.הערה: לדיון כללי על אופן ההורדה של מכולות, עיין https://www.docker.com/get-started. ניתן גם להוריד את המכולה מ zenodo.org, DOI 10.5281/zenodo.3361621.הערה: קוד מקור ההרחבה של Jupyter openBIS זמין כאן: https://pypi.org/project/jupyter-openbis-extension/. התחל את מיכל docker: docker לרוץ -p 8178:8000 malmstroem / jove:latest.הערה: היציאה שבה JupyterHub משתמש כברירת מחדל היא 8000. יציאה זו ניתנת להגדרה, ויש להתאים את הפקודות לעיל בהתאם אם הן משתנות. יציאה 8178 היא בחירה שרירותית וניתן לשנותה. יש להתאים את כתובות ה- URL לדוגמה המפורטות להלן בהתאם. מעבר לכתובת הבאה: http://127.0.0.1:8178. היכנס באמצעות שם המשתמש “user” והסיסמה “user”.הערה: הכתובת http://127.0.0.1 מרמזת על כך שהגורם המכיל של Docker פועל במחשב המקומי. אם הגורם המכיל של Docker מופעל בשרת, השתמש בכתובת ה- IP או בכתובת ה- URL של השרת (לדוגמה, https://example.com). מיכל docker מבוסס על אובונטו ביוניק 18.04, JupyterHub 0.9.6, ו Jupyter openBIS הרחבה 0.2. ניתן להתקין זאת במערכות הפעלה אחרות, אך הדבר לא נבדק. 4. הורד את הדוח. צור מחברת חדשה על-ידי לחיצה על חדש| Python 3 באמצעות התפריט הממוקם ליד החלק השמאלי העליון של הדף. פעולה זו תפתח כרטיסיה חדשה עם מחברת בשם ללא כותרת (או משהו דומה). לחץ על “קביעת תצורה של חיבורי openBIS” בתפריט הכלים Jupyter. מלא את השם: txms; כתובת URL: https://txms.org; משתמש: אורח; סיסמה: guestpasswd. לחץ על “התחבר”. בחר את החיבור החדש ולחץ על “בחר חיבור”. חפש את תבנית הדוח (לדוגמה, /CHEETAH/WF70) ולחץ על הורד.הערה: עליך להתאים את תבנית הדוח בהתבסס על התוצאות והדיווח שקיבלת מהפעלת עבודתך בשרת האינטרנט של צ’יטה-MS. הפעל מחדש את הדוח על-ידי לחיצה על תא | תריץ הכל. 5. להאריך את הדוח. הוספת תא חדש בתחתית: תא | הוסף להלן. הקלד את הקוד המבוקש. לדוגמה, עיין בסעיף תוצאות מייצגות להלן. בצע את התא על-ידי הקשה על “Shift-Enter”.

Representative Results

TX-MS מספק יציאות מבניות הנתמכות על-ידי אילוצי ניסוי שמקורם ב- MS. זה עובד על ידי שילוב סוגים שונים של רכישת נתונים MS עם מידול חישובי. לכן, מומלץ לנתח כל נתוני MS בנפרד ולספק תצוגה חזותית של מבנה הפלט. נתונים משלימים 1 מכיל מחברת לדוגמה שיכולה לנתח נתוני DDA ו- DIA המיוצרים כפלט TX-MS. משתמשים יכולים לבחור את XL של עניין. על-ידי הפעלת המחשב הנייד, ספקטרום MS2 של אותו XL יוצג היכן שצבעים שונים מסייעים להפלות בין שברים הקשורים לפפטיד הראשון, לפפטיד השני וליוני הקטע הקומבינטורי. ניתן גם למפות את ה- XL למבנה באמצעות הווידג’ט NGLView המוטבע במחברת Jupyter. תא אחר במחברת זו יכול לסייע למשתמשים לנתח נתונים מסוג DIA ולהציג אותם באופן חזותי. עם זאת, הדמיה של נתוני DIA קשה יותר מכיוון שיש להכין את הנתונים המנותחים בתבנית הנכונה. איור 1 מציג מבנה לדוגמה של M1 ואלבומין עם רשימות XL מובילות הממופות על המבנה. TX-MS השיג את כל ה- XLs לאחר ניתוח נתוני hrMS1, DDA ו- DIA, ופרוטוקול RosettaDock סיפק את המודלים החישוביים. מכיוון שדוח זה הוא מחברת Jupyter, ניתן להוסיף כל קוד Python חוקי לתאי מחברת חדשים. לדוגמה, הקוד שלהלן ייצור היסטוגרמה על ספירות MS2, המציין עד כמה נתמך כל קישור צולב על-ידי הנתונים המשמשים כבסיס.לייבא seaborn כמו snssns.distplot(ms2[‘count’]); איור 1: מודל מבני של חלבון סטרפטוקוקוס פיוגנס M1 ואלבומין אנושי עם XLs ממופה על המבנה. חלבון M1 מוצג באפור ומהווה הומודימר. שש מולקולות האלבומין מוצגות כזוגות בגוונים שונים של כחול. קישורים מקושרים ומרחקים ניתנים באדום עם טקסט שחור. לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. קובץ משלים. נתוני מחברת ג’ופיטר. נא לחץ כאן כדי להוריד קובץ זה.

Discussion

זרימות עבודה חישוביות מודרניות הן לעתים קרובות מורכבות, עם כלים מרובים מספקים רבים ושונים, תלות הדדית מורכבת, נפחי נתונים גבוהים ותוצאות מרובות פנים. כתוצאה מכך, קשה יותר ויותר לתעד במדויק את כל הצעדים הנדרשים כדי להשיג תוצאה, מה שמקשה על שחזור התוצאה הנתונה. כאן, אנו מדגימים אסטרטגיה כללית המשלבת את האוטומציה והקלות של זרימת עבודה אוטומטית המפיקה דוח כללי, עם הגמישות להתאים אישית את הדוח באופן ניתן לשחזור.

שלוש דרישות צריכות להתממש כדי שהפרוטוקול יעבוד: ראשית, החלבונים שנבחרו לניתוח צריכים לקיים אינטראקציה באופן כזה שהניסוי הכימי של הצלבה יכול לייצר מינים מקושרים בריכוז גבוה מספיק כדי להיות מזוהים על ידי ספקטרומטר המסה; לספקטרומטרי מסה שונים יש רמות שונות של זיהוי והם תלויים גם בפרוטוקול הרכישה, כמו גם בבחירה של ריאגנט חוצה קישורים. הגרסה הנוכחית של פרוטוקול TX-MS מאפשרת רק DSS, ריאגנט הומוביfunctional ליזין-ליזין קישור צולב. ובכל זאת, מגבלה זו נובעת בעיקר מהאפשרות כי שלב למידת המכונה יצטרך להיות מותאם עבור ריאגנטים אחרים. מגבלה זו שופרה בשרת האינטרנט של צ’יטה-MS, שכן ניתן לשקול שני ריאגנטים מצטלבים נוספים, אך כל השלושה הם ריאגנטים שאינם ניתנים לסלילה. שנית, שני החלבונים צריכים להיות בעלי מבנה שנקבע באופן ניסיוני או להיות ממודלים באמצעות טכניקות מידול השוואתיות או טכניקות דה נובו . לא כל החלבונים ניתן לעצב, אבל שילוב של תוכנה משופרת ותצהיר מתמיד של מבנים ניסיוניים ב- PDB מרחיב את מספר החלבונים שניתן לדגמן. שלישית, החלבונים המקיימים אינטראקציה צריכים להישאר דומים מספיק במצבים הכבולים והלא מאוגדים שלהם, כך שאלגוריתמי העגינה הנמצאים בשימוש על ידי TX-MS וצ’יטה-MS יכולים ליצור מבנים רבעוניים באיכות נאותה כדי לאפשר ניקוד. דרישה זו מעורפלת יחסית, שכן האיכות המקובלת תלויה מאוד במערכת, שם בדרך כלל קל יותר להשוות חלבונים קטנים יותר בעלי מבנה ידוע מאשר חלבונים גדולים יותר בעלי מבנה לא ידוע.

במקרה של תוצאה שלילית, בדוק תחילה כי TX-MS מצא קישורים פנימיים, קישורים צולבים בין שאריות שהם חלק מאותה שרשרת פוליפפטידים. אם אף אחד מהם לא מתגלה, ההסבר הסביר ביותר הוא שמשהו השתבש בהכנת המדגם או ברכישת הנתונים. אם אילוצי מרחק מרובים אינם תומכים במודלים, בדוק באופן חזותי את המודלים כדי לוודא שההתאמה נתמכת על-ידי שאריות מקושרות. אין דרך ברורה לסובב את אחד האינטראקטיבים מבלי לשבש לפחות קישור צולב אחד. אם קיימים קישורים צולבים ארוכים יותר מהמרחק המותר עבור ריאגנט המקשר הצולב הנתון, נסה לשפר את המודלים של האינטראקטיביסטים על-ידי שילוב נתונים מקשרים צולבים.

ניתן להשתמש ביישומי תוכנה חלופיים כדי להשיג תוצאות שוות ערך בתנאי שהרגישות של התוכנה שנבחרה דומה לרגישות של TX-MS. לדוגמה, ישנן גרסאות מקוונות של RosettaDock, HADDOCK, ואחרים. ניתן גם לנתח נתונים כימיים מצטלבים באמצעות xQuest / xProphet 5,6, plink7, ו- SIM-XL26.

אנו מיישמים ללא הרף TX-MS ו- Cheetah-MS לפרויקטים חדשים 27,28,29, ובכך משפרים את הדוחות המיוצרים על ידי גישות אלה כדי לאפשר ניתוח מפורט יותר של התוצאות מבלי להגדיל את הדוחות.

Disclosures

The authors have nothing to disclose.

Acknowledgements

עבודה זו נתמכה על ידי קרן קנוט ואליס ולנברג (מענק מס ‘ 2016.0023) והקרן הלאומית השוויצרית למדע (מענק לא. P2ZHP3_191289). בנוסף, אנו מודים ל- S3IT, אוניברסיטת ציריך, על התשתית החישובית והתמיכה הטכנית שלה.

Materials

Two Protein DataBank files of the proteins of interest. N/A N/A Example files available on txms.org and zenodo.org, DOI 10.5281/zenodo.3361621
An mzML data file acquired on a sample where the proteins of interest were crosslinked. N/A N/A Example files available on txms.org or zenodo.org, DOI 10.5281/zenodo.3361621

References

  1. Berman, H. M., et al. The Protein Data Bank. Acta Crystallographica Section D: Biological Crystallography. 58 (6), 899-907 (2002).
  2. Herzog, F., et al. Structural Probing of a Protein Phosphatase 2A Network by Chemical Cross-Linking and Mass Spectrometry. Science. 337 (6100), 1348-1352 (2012).
  3. Hoopmann, M. R., et al. Kojak: efficient analysis of chemically cross-linked protein complexes. Journal of Proteome Research. 14 (5), 2190-2198 (2015).
  4. Seebacher, J., et al. Protein cross-linking analysis using mass spectrometry, isotope-coded cross-linkers, and integrated computational data processing. Journal of Proteome Research. 5 (9), 2270-2282 (2006).
  5. Rinner, O., et al. Identification of cross-linked peptides from large sequence databases. Nature Methods. 5 (4), 315-318 (2008).
  6. Walzthoeni, T., et al. False discovery rate estimation for cross-linked peptides identified by mass spectrometry. Nature Methods. 9 (9), 901-903 (2012).
  7. Yang, B., et al. Identification of cross-linked peptides from complex samples. Nature Methods. 9 (9), 904-906 (2012).
  8. Chu, F., Baker, P. R., Burlingame, A. L., Chalkley, R. J. Finding Chimeras: a Bioinformatics Strategy for Identification of Cross-linked Peptides. Molecular & Cellular Proteomics. 9 (1), 25-31 (2010).
  9. Holding, A. N., Lamers, M. H., Stephens, E., Skehel, J. M. Hekate: Software Suite for the Mass Spectrometric Analysis and Three-Dimensional Visualization of Cross-Linked Protein Samples. Journal of Proteome Research. 12 (12), 5923-5933 (2013).
  10. Hauri, S., et al. Rapid determination of quaternary protein structures in complex biological samples. Nature Communications. 10 (1), 192 (2019).
  11. Röst, H. L., et al. OpenSWATH enables automated, targeted analysis of data-independent acquisition MS data. Nature Biotechnology. 32 (3), 219-223 (2014).
  12. Röst, H. L., et al. OpenMS: a flexible open-source software platform for mass spectrometry data analysis. Nature Methods. 13 (9), 741-748 (2016).
  13. Quandt, A., et al. Using synthetic peptides to benchmark peptide identification software and search parameters for MS/MS data analysis. EuPA Open Proteomics. 5, 21-31 (2014).
  14. Bradley, P., et al. Free modeling with Rosetta in CASP6. Proteins: Structure, Function, and Bioinformatics. 61 (S7), 128-134 (2005).
  15. Gray, J. J. High-resolution protein-protein docking. Current Opinion in Structural Biology. 16 (2), 183-193 (2006).
  16. Khakzad, H., et al. Cheetah-MS: a web server to model protein complexes using tandem cross-linking mass spectrometry data. Bioinformatics. , (2021).
  17. Malmström, L. Chapter 15: Computational Proteomics with Jupyter and Python. Methods in Molecular Biology. 15, 237-248 (1977).
  18. Martens, L., et al. mzML–a community standard for mass spectrometry data. Molecular & Cellular Proteomics. 10 (1), (2011).
  19. Chambers, M. C., et al. A cross-platform toolkit for mass spectrometry and proteomics. Nature Biotechnology. 30 (10), 918-920 (2012).
  20. Waterhouse, A., et al. SWISS-MODEL: homology modelling of protein structures and complexes. Nucleic Acids Research. 46 (W1), W296-W303 (2018).
  21. Yang, J., et al. Improved protein structure prediction using predicted interresidue orientations. Proceedings of the National Academy of Sciences. 117 (3), 1496-1503 (2020).
  22. Koehler Leman, J., et al. Macromolecular modeling and design in Rosetta: recent methods and frameworks. Nature Methods. 17 (7), 665-680 (2020).
  23. Chivian, D., et al. Prediction of CASP6 structures using automated Robetta protocols. Proteins: Structure, Function, and Bioinformatics. 61 (S7), 157-166 (2005).
  24. Chivian, D., et al. Automated prediction of CASP-5 structures using the Robetta server. Proteins: Structure, Function, and Bioinformatics. 53 (S6), 524-533 (2003).
  25. Bauch, A., et al. openBIS: a flexible framework for managing and analyzing complex data in biology research. BMC Bioinformatics. 12, 468 (2011).
  26. Lima, D. B., et al. SIM-XL: A powerful and user-friendly tool for peptide cross-linking analysis. Journal of Proteomics. 129, 51-55 (2015).
  27. Happonen, L., et al. A quantitative Streptococcus pyogenes-human protein-protein interaction map reveals localization of opsonizing antibodies. Nature Communications. 10, 2727 (2019).
  28. Khakzad, H., et al. Structural determination of Streptococcus pyogenes M1 protein interactions with human immunoglobulin G using integrative structural biology. PLOS Computational Biology. 17 (1), E1008169 (2021).
  29. Khakzad, H., et al. In vivo cross-linking MS of the complement system MAC assembled on live Gram-positive bacteria. Frontiers in Genetics. 11, (2020).

Play Video

Cite This Article
Khakzad, H., Vermeul, S., Malmström, L. Quaternary Structure Modeling Through Chemical Cross-Linking Mass Spectrometry: Extending TX-MS Jupyter Reports. J. Vis. Exp. (176), e60311, doi:10.3791/60311 (2021).

View Video