ספקטרומטריית מסה חוצה-קישור ממוקדת יוצרת מודלים של מבנה חלבונים רבעוניים באמצעות נתוני ספקטרומטריית מסה שנרכשו באמצעות עד שלושה פרוטוקולי רכישה שונים. כאשר התוצאות מבוצעות כזרימת עבודה פשוטה יותר בשרת האינטרנט של צ’יטה-MS, התוצאות מדווחות במחברת Jupyter. כאן, אנו מדגימים את ההיבטים הטכניים של האופן שבו ניתן להרחיב את מחברת Jupyter לניתוח מעמיק יותר.
אינטראקציות חלבון-חלבון יכולות להיות מאתגרות לחקר, אך מספקות תובנות לגבי אופן תפקודן של מערכות ביולוגיות. ספקטרומטריית מסה צולבת ממוקדת (TX-MS), שיטה המשלבת מידול מבנה חלבונים רבעוניים וספקטרומטריית מסה מצטלבת כימית, יוצרת מודלים של מבנה ברמת דיוק גבוהה באמצעות נתונים המתקבלים מדגימות מורכבות ולא מופרדות. זה מסיר את אחד המכשולים העיקריים לניתוח מבנה מורכב חלבון כי החלבונים של עניין כבר לא צריך להיות מטוהר בכמויות גדולות. שרת האינטרנט של צ’יטה-MS פותח כדי להפוך את הגרסה הפשוטה של הפרוטוקול לנגישה יותר לקהילה. בהתחשב בנתוני MS/MS הדו-מושביים, Cheetah-MS מייצר מחברת Jupyter, דוח גרפי המסכם את תוצאות הניתוח החשובות ביותר. הרחבת מחברת Jupyter יכולה להניב תובנות מעמיקות יותר ולהבין טוב יותר את המודל ואת נתוני ספקטרומטריית המסה התומכים בו. הפרוטוקול הטכני המוצג כאן מדגים כמה מההרחבות הנפוצות ביותר ומסביר איזה מידע ניתן להשיג. הוא מכיל בלוקים המסייעים בניתוח נתוני רכישת MS/MS דו-מושביים וההשפעה הכוללת של ה- XLs שזוהו במודלים הרבעוניים המדווחים. ניתן להחיל את התוצאה של ניתוחים כאלה על מודלים מבניים המוטבעים במחברת באמצעות NGLView.
אינטראקציות חלבון-חלבון מבססות את המבנה והתפקוד של מערכות ביולוגיות. גישה למבנים רבעוניים של חלבונים יכולה לספק תובנות לגבי האופן שבו שני חלבונים או יותר מתקשרים ויוצרים מבנים מסדר גבוה. למרבה הצער, השגת מבנים רבעוניים נותרה מאתגרת; זה בא לידי ביטוי במספר קטן יחסית של ערכי חלבון DataBank (PDB)1 המכיל יותר מפוליפפטיד אחד. אינטראקציות חלבון-חלבון ניתן ללמוד עם טכנולוגיות כגון קריסטלוגרפיה של קרני רנטגן, NMR, ו cryo-EM, אבל קבלת כמות מספקת של חלבון מטוהר בתנאים שבהם ניתן ליישם את השיטות יכול להיות זמן רב.
ספקטרומטריית מסה מצטלבת כימית פותחה כדי להשיג נתונים ניסיוניים על אינטראקציות חלבון-חלבון עם פחות הגבלות על הכנת מדגם כמו ספקטרומטריית מסה ניתן להשתמש כדי לרכוש נתונים על דגימות מורכבות שרירותיות 2,3,4,5,6,7,8,9 . עם זאת, האופי הקומבינטורי של ניתוח הנתונים ומספר קטן יחסית של פפטידים מקושרים דורשים שהדגימות יחולקו לפני הניתוח. כדי לטפל בחסרון זה, פיתחנו את TX-MS, שיטה המשלבת מידול חישובי עם ספקטרומטריית מסה מצטלבת כימית10. TX-MS ניתן להשתמש על דגימות מורכבות באופן שרירותי והוא רגיש באופן משמעותי יותר בהשוואה לשיטות קודמות10. היא משיגה זאת על ידי ניקוד כל הנתונים הקשורים לאינטראקציה נתונה של חלבון-חלבון כקבוצה במקום לפרש כל ספקטרום טרשת נפוצה באופן עצמאי. TX-MS משתמש גם בעד שלושה פרוטוקולי רכישה שונים של טרשת נפוצה: MS1 ברזולוציה גבוהה (hrMS1), רכישה תלוית נתונים (DDA) ורכישה בלתי תלוית נתונים (DIA), מה שמוסיף לספק הזדמנויות לזהות פפטיד מקושר על-ידי שילוב תצפיות מרובות. זרימת העבודה החישובית של TX-MS מורכבת מכמה סיבות. ראשית, הוא מסתמך על תוכנות ניתוח טרשת נפוצה מרובות 11,12,13 כדי ליצור מודלים של מבנה חלבון 14,15. שנית, כמות הנתונים יכולה להיות ניכרת. שלישית, שלב הדוגמנות יכול לצרוך כמויות משמעותיות של כוח עיבוד מחשב.
כתוצאה מכך, TX-MS משמש בצורה הטובה ביותר כזרימת עבודה חישובית אוטומטית ופשוטה באמצעות שרת האינטרנט Cheetah-MS16 הפועל על תשתיות חישוביות גדולות כגון ענני מחשב או אשכולות. כדי להקל על הפרשנות של התוצאות, הפקנו מחברת Jupyter אינטראקטיבית17. כאן, אנו מדגימים כיצד ניתן להרחיב את הדוח מחברת Jupyter כדי להניב ניתוח מעמיק יותר של תוצאה נתונה.
זרימות עבודה חישוביות מודרניות הן לעתים קרובות מורכבות, עם כלים מרובים מספקים רבים ושונים, תלות הדדית מורכבת, נפחי נתונים גבוהים ותוצאות מרובות פנים. כתוצאה מכך, קשה יותר ויותר לתעד במדויק את כל הצעדים הנדרשים כדי להשיג תוצאה, מה שמקשה על שחזור התוצאה הנתונה. כאן, אנו מדגימים אסטרטגיה כללית המשלבת את האוטומציה והקלות של זרימת עבודה אוטומטית המפיקה דוח כללי, עם הגמישות להתאים אישית את הדוח באופן ניתן לשחזור.
שלוש דרישות צריכות להתממש כדי שהפרוטוקול יעבוד: ראשית, החלבונים שנבחרו לניתוח צריכים לקיים אינטראקציה באופן כזה שהניסוי הכימי של הצלבה יכול לייצר מינים מקושרים בריכוז גבוה מספיק כדי להיות מזוהים על ידי ספקטרומטר המסה; לספקטרומטרי מסה שונים יש רמות שונות של זיהוי והם תלויים גם בפרוטוקול הרכישה, כמו גם בבחירה של ריאגנט חוצה קישורים. הגרסה הנוכחית של פרוטוקול TX-MS מאפשרת רק DSS, ריאגנט הומוביfunctional ליזין-ליזין קישור צולב. ובכל זאת, מגבלה זו נובעת בעיקר מהאפשרות כי שלב למידת המכונה יצטרך להיות מותאם עבור ריאגנטים אחרים. מגבלה זו שופרה בשרת האינטרנט של צ’יטה-MS, שכן ניתן לשקול שני ריאגנטים מצטלבים נוספים, אך כל השלושה הם ריאגנטים שאינם ניתנים לסלילה. שנית, שני החלבונים צריכים להיות בעלי מבנה שנקבע באופן ניסיוני או להיות ממודלים באמצעות טכניקות מידול השוואתיות או טכניקות דה נובו . לא כל החלבונים ניתן לעצב, אבל שילוב של תוכנה משופרת ותצהיר מתמיד של מבנים ניסיוניים ב- PDB מרחיב את מספר החלבונים שניתן לדגמן. שלישית, החלבונים המקיימים אינטראקציה צריכים להישאר דומים מספיק במצבים הכבולים והלא מאוגדים שלהם, כך שאלגוריתמי העגינה הנמצאים בשימוש על ידי TX-MS וצ’יטה-MS יכולים ליצור מבנים רבעוניים באיכות נאותה כדי לאפשר ניקוד. דרישה זו מעורפלת יחסית, שכן האיכות המקובלת תלויה מאוד במערכת, שם בדרך כלל קל יותר להשוות חלבונים קטנים יותר בעלי מבנה ידוע מאשר חלבונים גדולים יותר בעלי מבנה לא ידוע.
במקרה של תוצאה שלילית, בדוק תחילה כי TX-MS מצא קישורים פנימיים, קישורים צולבים בין שאריות שהם חלק מאותה שרשרת פוליפפטידים. אם אף אחד מהם לא מתגלה, ההסבר הסביר ביותר הוא שמשהו השתבש בהכנת המדגם או ברכישת הנתונים. אם אילוצי מרחק מרובים אינם תומכים במודלים, בדוק באופן חזותי את המודלים כדי לוודא שההתאמה נתמכת על-ידי שאריות מקושרות. אין דרך ברורה לסובב את אחד האינטראקטיבים מבלי לשבש לפחות קישור צולב אחד. אם קיימים קישורים צולבים ארוכים יותר מהמרחק המותר עבור ריאגנט המקשר הצולב הנתון, נסה לשפר את המודלים של האינטראקטיביסטים על-ידי שילוב נתונים מקשרים צולבים.
ניתן להשתמש ביישומי תוכנה חלופיים כדי להשיג תוצאות שוות ערך בתנאי שהרגישות של התוכנה שנבחרה דומה לרגישות של TX-MS. לדוגמה, ישנן גרסאות מקוונות של RosettaDock, HADDOCK, ואחרים. ניתן גם לנתח נתונים כימיים מצטלבים באמצעות xQuest / xProphet 5,6, plink7, ו- SIM-XL26.
אנו מיישמים ללא הרף TX-MS ו- Cheetah-MS לפרויקטים חדשים 27,28,29, ובכך משפרים את הדוחות המיוצרים על ידי גישות אלה כדי לאפשר ניתוח מפורט יותר של התוצאות מבלי להגדיל את הדוחות.
The authors have nothing to disclose.
עבודה זו נתמכה על ידי קרן קנוט ואליס ולנברג (מענק מס ‘ 2016.0023) והקרן הלאומית השוויצרית למדע (מענק לא. P2ZHP3_191289). בנוסף, אנו מודים ל- S3IT, אוניברסיטת ציריך, על התשתית החישובית והתמיכה הטכנית שלה.
Two Protein DataBank files of the proteins of interest. | N/A | N/A | Example files available on txms.org and zenodo.org, DOI 10.5281/zenodo.3361621 |
An mzML data file acquired on a sample where the proteins of interest were crosslinked. | N/A | N/A | Example files available on txms.org or zenodo.org, DOI 10.5281/zenodo.3361621 |