Summary

חקירת חלבון רצף-מבנה-דינמיקה יחסים עם Bio3D-web

Published: July 16, 2017
doi:

Summary

פרוטוקול לחקירה המקוונת של מבנה רצף החלב-מבנה דינמי באמצעות Bio3D- האינטרנט מוצג.

Abstract

אנו מדגימים את השימוש של Bio3D-Web לניתוח אינטראקטיבי של נתוני המבנה biomolecular. יישום Bio3D- Web מספק פונקציונליות מקוונת עבור: (1) זיהוי של מבנה חלבון קשור קובע למשתמש סף שצוין של דמיון; (2) יישור מרובים שלהם סופרפוזיציה המבנה; (3) ניתוח שימור רצף ומבנה; (4) מיפוי היחסים בין קונפורמיזציה עם ניתוח רכיב ראשי, ו (5) השוואה של הדינמיקה הפנימית החזוי באמצעות אנסמבל ניתוח מצב רגיל. פונקציונליות משולבת זו מספקת זרימת עבודה מקוונת מלאה לבדיקת יחסי רצף-מבנה דינמי בתוך משפחות חלבון ו superfamilies.

Introduction

בנק הנתונים חלבון (PDB) עכשיו מכיל יותר מ 120,000 מבנים חלבון – רבים מהם של אותה חלבון המשפחה אך נפתרה בתנאים ניסויים שונים. מבנים מרובים אלה מייצגים משאב רב ערך להבנת המורכבות של צורת החלבון ותפקודו. לדוגמה, השוואה קפדנית של הרכבים אלה המבנה יכול לחשוף מנגנונים מולקולריים חשובים 1 , 2 , 3 ו להודיע ​​על דינמיקה קונפורמטיבי מעורב בתהליכים כולל ליגנד מחייב, קטליזה אנזימטית והכרה דו מולקולרית 4 , 5 , 6 , 7 . תובנות חדשות לעיתים קרובות ניתן להשיג מן הניתוח מפורט בקנה מידה גדול של רצף, מבנה ודינמיקה של משפחות חלבון. עם זאת, זה בדרך כלל דורש bioinf ניכראורמטיקה ומומחיות תכנות מחשבים יחד עם היכרות עם מערכות חלבון תחת מחקר. לדוגמה, חבילות תוכנה כגון Bio3D, ProDy ו- Maven דורשות תכנות ב- R, python ו- Matlab, בהתאמה 8 , 9 , 10 . לעומת זאת, כלים מקוונים לניתוח גמישות מבנית מוגבלים בדרך כלל החקירה של מבנים בודדים 11 , 12 . חריג בעניין זה הוא השרת @ WebNM שפותח לאחרונה, אשר מאפשר את ההשוואה של דפוסי גמישות המתקבלת מניתוח במצב רגיל (NMA) של מספר משתמש שצוין מראש מיושר מבנים 13. עם זאת, שרת זה חסר הליך אוטומטי עבור זיהוי מבנים להשוואה, יישור שלהם או ניתוח נוסף מעבר NMA. תרומה נוספת לאחרונה הוא מסד הנתונים PDBFlex באינטרנט, אשר מציג מראש cניתוח Oputed של מבנים PDB שיתוף 95% או רצף זהות גבוהה יותר 14 . עם זאת, ניתוח של ערכות מבנה מגוונות יותר אינו זמין כעת.

יש לנו בעבר הציג Bio3D- אינטרנט – קל לשימוש יישום אינטרנט לניתוח של רצף רצף מבנה יחסים דינמיים 15 . Bio3D-Web הוא ייחודי במתן פונקציונליות קלה לשימוש משולבת לזיהוי, השוואה וניתוח מפורט של מבנה מבנים הומולוגיים גדולים באינטרנט. כאן אנו מציגים פרוטוקול מפורט עבור החקירה המקוונת של מבנה רצף חלבון-דינמיקה היחסים באמצעות Bio3D- האינטרנט. Bio3D- האינטרנט מספק מגוון של פונקציות כדי לתמוך בחמישה שלבים עיקריים של ניתוח נתונים שמוצג באיור 1 ו דנו בפירוט להלן. שלבים אלה מהווים זרימת עבודה המשתרעת מרצף שאילתות או קלט מבנה, דרך רמות מרובות של ניתוח רצף-מבנה דינמי, לסיכוםY דור הדו"ח. התוצאות זמינות באופן מיידי באמצעות הדמיה נרחבת בדפדפן והתקני זומם, וכן באמצעות הורדת קבצי תוצאות בפורמטים נפוצים. בנוסף נוח וקל לשימוש ממשק דינמי לחקר ההשפעות של פרמטר ו בחירות בחירה, Bio3D- האינטרנט גם רשומות את קלט המשתמש המלא ואת התוצאות הגרפיות הבאים של הפגישה של המשתמש כמו לשחזור לשחזור הדו"ח בפורמט PDF, DOC ו- HTML. הפעלות המשתמש עשוי להישמר ו לטעון מחדש בזמנים עתידיים ואת התוצאות המלאות שהורדו ופרש נוספת על ידי החבילה Bio3D R על המחשב המקומי של המשתמש.

Bio3D-Web הוא מופעל על ידי החבילה Bio3D R לניתוח של המבנה biomolecular, רצף נתונים סימולציה מולקולארית 8 , 16 . בפרט, אלגוריתמים Bio3D לזיהוי נוקשה הליבה 8 , סופרפוזיציה, ניתוח מרכיב עיקרי(PCA) 8 , אנסמבל מצב רגיל ניתוח (eNMA) 16 טופס הבסיס של היישום. אנו גם לנצל פרוטוקולים Bio3D התלויים pHMMER 17 לזיהוי של מבנים חלבונים קשורים, ו 18 MUSCL עבור רצף יישור מרובים. מבנה ורצף הסברים נגזרים באמצעות כלי עזר Bio3D מן RCSB PDB 19 ו- PFAM מסדי נתונים 20 . Bio3D-web יכול להיות מופעל מהשרת המקוון שלנו או מותקן באופן מקומי על כל מחשב פועל R. Bio3D- האינטרנט פתוח לכל המשתמשים והוא מסופק ללא תשלום תחת רישיון קוד פתוח של GPL-3 מ: http: // thegrantlab. Org / bio3d / webapps

Protocol

הערה: הפגישה הטיפוסית של Bio3D-web נמשכת באמצעות חמישה שלבים עוקבים ותלויים (ראה איור 1 עבור ייצוג סכמטי). כל צעד מיושם כמו הכרטיסייה ניווט רצופים של יישום אינטרנט כלומר חיפוש, ALIGN, FIT, PCA, ו eNMA. 1. מבנה חיפוש ובחירה (חיפוש) מבנה קלט השג את מזהה PDB של adenylate קינאז (Adk), למשל על ידי חיפוש PDB [http://www.rcsb.org/pdb]. לחלופין, השג את רצף חומצות האמינו של החלבון, למשל מ- UniProt [http://uniprot.org]. הזן את ארבע התווים PDB ארוך עבור Adk ( למשל 1AKE), או להדביק רצף החלבון, אל תיבת הטקסט של "מבנה קלט או רצף" לוח. בחירה פגע לחץ על הכפתור "הבא" (הכה בחירה) בחלונית הראשונה או פשוט לגלול למטה לחלונית ב) "הבחירה להיט"לניתוח נוסף. ודא שמספר "הגבלת המספר הכולל של מבנים כלולים" מוגדר לערך המרבי שלו, כך שיכלול את כל המבנים שמעל לחיתוך. הנמך את האפשרות "התאם את הקטע הכלול ב- BitScore" כדי לכלול התאמות נוספות מרוחקות יותר, או להגדיל אותו כדי לא לכלול. סינון אופציונלי של התאמה לחץ על הכפתור "הבא" (הכה) בחירה בחלונית הראשונה או פשוט לגלול למטה ללוח C) "סינון אופציונלי של מבנים קשורים לניתוח נוסף". ודא שההתאמות שנבחרו מייצגות מבנים רלוונטיים על ידי בדיקת פרטי הטבלה, למשל שם PDB, מינים וגידים קשורים. לחדד ידנית את קבוצת המשנה שנבחרה במידת הצורך על ידי לחיצה על שורות הטבלה. הערה: שורות מודגשות בצבע כחול מתארות מזהי PDB שנבחרו לניתוח נוסף בלשוניות עוקבות. 2. ניתוח יישור רצף מרובה (ALIGN) לחץ על הכרטיסייה ALIGN כדי לבצע יישור רצף של המבנים שנבחרו מהכרטיסייה חיפוש. סיכום המערך עיין בסיכום היישור בחלונית A) "סיכום המערך". ודא כי אזורים של עניין מיושרים ולא רעולי פנים על ידי פערים במבנה אחד או יותר. אם יש צורך, להחליף את "הצג אפשרויות עריכה יישור" ולהסיר זיהויי PDB לא רצויים, למשל PDBs עם שאריות חסרים. ניתוח יישור רצף לחץ על הכפתור "הבא" (כחול) הכחול כדי לבצע ניתוח אשכולות מבוסס רצף של המבנים שנאספו. בחר באפשרות מגרש Dendrogram. התאם את האשכול לקבוצות של מחוון K כדי לחלק את המבנים לקבוצות k. לחלופין, שנה את שיטת אשכולות אם תרצה בכך על-ידי מעבר בין תיבת הסימון אשכולות נוספים ואפשרויות פלט. </oL> שאריות ניתוח שימור לחץ על הכפתור "הבא" ("שימור") הכחול כדי לחשב את שימור שאריות הטור. בחר את מבנה המערך קובע ליצור חלקה של שימור שאריות בכל מיקום יישור. בחר מבנים מיושרים עם יישור זרע PFAM להראות שימור מחושב ביחס יושר זרע PFAM הקשורים המכילים נציג חברי המשפחה. תצוגת יישור רצף לחץ על הכפתור "הבא" הכחול (הבא) כדי להציג את יישור הרצף המלא עם הכלי להדמיה ביישור הדפדפן. 3. מבנה וניתוח FIT (FIT) בצע את המבנה על ידי כניסה לכרטיסייה FIT. מבנה סופרפוזיציה החלף את "הצג PDBs" תיבת סימון כדי לדמיין את protei מיושרN מבנים בדפדפן. ודא מבנים החלבון הם על גבי באזורים המתאימים הרלוונטיים על ידי בדיקות חזותיים. לחץ וגרור את העכבר מעל המבנים לסובב וגלול כדי להתקרב. להתאים את גוון המבנים על ידי לחיצה על "אפשרויות צבע". אפשרויות הצביעה כוללות מיקום יישור, השתנות מבנית למיקום, קבוצות אשכול RMSD, קבוצות אשכולות רצף, אזורים מתואמים ומבנה משני. הורד את מבנים superposed כמו גם קבצי PDB קונבנציונאלי או כקובץ הפעלה יחיד PyMOL להדמיה בתוכנית הצופה מולקולרית מיוחדים. ניתוח מבנה לחץ על הכפתור "הבא" (כחול) הכחול כדי לבצע קיבוץ מבוסס מבנה של מבני PDB שנאספו. החלף את ה- RMSD Heatmap בתפריט הנפתח אפשרויות מגרש. התאם את אפשרויות ההקבלה, כולל שיטת האשכולות עצמה, על-ידי מעבר בין תיבת הסימון "אפשרויות אשכולות ותפוקות נוספות". הערה: נתונים RMSD Pairwise יכול גם להיות דמיינו כמו dendrogram, היסטוגרמה או מפת חום. שאריות תנודות לחץ על הכפתור "הבא" (RMSF) הכחול כדי להציג את השונות המבנית של כל שאריות (המוצגות כרצף RMSF) עם אלמנטים מרכזיים של מבנה משני שמוצגים באזורים השוליים של ציר ה- x. החלף את תיבת הסימון הצג B- גורמים כדי לכסות ב B- גורמים קריסטלוגרפיים של מבנה התייחסות על העלילה RMSF. 4. ניתוח רכיב ראשי (PCA) בצע ניתוח רכיב עיקרי על ידי הזנת הכרטיסייה "PCA". ויזואליזציה של המרכיבים העיקריים החלף את תיבת הסימון "הצג את מסלול המחשב" כדי להציג תנועות המתוארות על-ידי המחשבים באמצעות הכלי להדמיה בתוך הדפדפן. ודא "PrinCipal Component 1 "נבחר מהתפריט הנפתח הראשון. כדי להמחיש את התנועות המתוארות על ידי מחשבים אישיים אחרים, בחר את המחשב הרצוי מהתפריט הנפתח "בחר רכיב ראשי". שנה את הצביעה של המסלול מהתפריט הנפתח 'אפשרויות צבע'. בחר "משתנות למיקום" מתוך "אפשרויות צבע" לצבע לפי גודל תזוזה. לחץ על הלחצן 'הורד את מסך ה- PDB' בחלון 'הדמיה של רכיב ראשי' כדי לקבל תצוגת מסלול של התנועה המתוארת על-ידי המחשבים האישיים. לחץ על הלחצן "הורד את PymOL" קובץ הפגישה כדי ליצור קובץ הפעלה של PyMOL המספק את התנועות כשדה וקטורי. ניתוח Conformer פרוייקט מבנים בודדים על שני מחשבים נבחרים על ידי לחיצה על כפתור "הבא" (כחול) כחול. ודא "PC על ציר X" מוגדר 1, ו – "PC oN ציר "כדי 2. כדי להקרין את המבנים על מחשבים אחרים, להתאים את מספר המחשב בהתאם. בחר "אשכול על ידי שטח משנה למחשב" כדי לצבוע את המבנים במגרש על ידי אשכולות מבוססי מחשב; "RMSD" צבע על ידי "RMSD מבוסס" אשכולות; ו "רצף" צבע על ידי אשכולות מבוסס רצף. לחץ על נקודות בודדות בחלקה כדי לסמן את המבנים. לחלופין, להדגיש אחד או יותר מבנים בטבלה "PCA התואמות העלילה ביאור" מתחת למגרש. החלק את המחשבים במחוון המשנה כדי לכלול יותר / פחות מחשבים עבור אלגוריתם אשכולות. תרומות שאריות חישוב תרומות שאריות על מחשבים אישיים על ידי לחיצה על כפתור "הבא" (שאריות תרומות). לתכנן את התרומות עבור מחשבים נוספים על ידי הוספת מספר המחשב בתיבת הטקסט "בחר רכיב ראשי". החלף את "לפרוש לי"נס "תיבת הסימון להימנע מתוויית שאריות התרומות על גבי אחד את השני. החלף את תיבת הסימון "Multiline plot" כדי לשרטט את שאריות התרומות בחלקים נפרדים. החלף את "הצג RMSF" כדי לכלול את ערכי RMSF (מתוך הכרטיסייה FIT). 5. אנסמבל ניתוח מצב רגיל (eNMA) לחץ על הכרטיסייה eNMA כדי להפעיל את מצב המצבים הרגילים (NM). מבנה מסנן התאם את מספר המבנים על ידי הורדת או הגדלה של "Cutoff" עבור הכללת מבנה / אי הכללה. לחץ על ירוק "Run אנסמבל NMA" כדי להתחיל את החישוב NMA. מצבי תצוגה חזותית רגילה גלול מטה אל הפאנל השני של הכרטיסייה eNMA (מצבי הצגה רגילה) להדמיה של NM. הערה: כברירת מחדל, ה- NM עם החפיפה הגבוהה ביותר (הדמיון) ל- PC-1 מוצג בתצוגה החזותיתIz חלון. כדי לדמיין את התנועות שתוארו על ידי NMs אחרים או מבנים PDB אחרים, לבחור את NM הרצוי ואת המבנה מתוך "בחר מצב" ו "הצג NMs עבור מבנה" תפריטים, בהתאמה. שאריות תנודות לחץ על הכפתור "הבא" (תנודות) כחול כדי לחשב את התנודות שאריות חכם של מבנים שנבחרו עבור eNMA. החלף את "Cluster by RMSD" כדי לצבוע את פרופילי התנודה לפי אשכולות מבוססי RMSD. החלף את "Cluster by RMSIP" כדי לצבוע את פרופילי התנודה לפי אשכולות מבוססי RMSIP. החלף את תיבת הסימון "התפשטות שורות" כדי לשרטט את פרופילי התנודתיות המקובצים זה מזה. השוואת NMA ו- PCA לחץ על הכפתור "הבא" (PCA-vs-NMA) הכחול כדי לחשב את הדמיון בין ה- NM השונים למחשבים אישיים. בחר PID DB מתוך "השווה NMs של מבנה" בתפריט למטה כדי לחשב את הדמיון בין NMs של מבנה זה למחשבים המחושבים בכרטיסייה PCA. ניתוח חפיפה לחץ על הכפתור "הבא" (ניתוח חפיפה) כחול כדי לחשב את החפיפה בין NMs מחושבים לבין וקטור ההפרש בין שני מבנים נבחרים. בחר 'מזהה' PDB מזהה מתוך "השווה NMs מבנה" התפריט הנפתח או אחד או יותר IDB IDS בטבלה המבנה עבור השוואה pairwise עם PDB הפניה. ניתוח אשכולות לחץ על הכפתור " Next" (אשכולות) הכחול כדי לבצע קיבוץ אשכולות המבוסס על הדמיון בין זוגות נם (RMSIP).

Representative Results

Adenylate קינאז (Adk) הוא אנזים בכל מקום הפועל כדי לשמור על שיווי המשקל בין נוקליאוטידים ציטופלסמיים חיוניים לתהליכים סלולריים רבים. אדק פועלת על ידי הקטליזציה של הפיכה הפיך של קבוצת phosphoryl מ ATP ל- AMP. תגובה זו מלווה בשיעור נחקר היטב הגבלת מעברים קונפורמיציוניים 3 , 21 . כאן אנו מנתחים את כל המבנים הקיימים כיום Adk עם Bio3D- האינטרנט כדי לחשוף תכונות מפורטות עקרונות מכניסטיים של מעברים אלה חיוני. אנחנו יכולים להתחיל את Bio3D-Web ניתוח של Adk על ידי הזנת קוד PDSB PDSB של כל מבנה Adk ידוע. לדוגמה, הזנת מזהה ה- PDB 1AKE בחלונית A של הכרטיסייה 'חיפוש' מחזירה 167 מבנים דומים ברצף שממנו נבחרו 26 הפריטים שנבחרו באופן אוטומטי לניתוח נוסף (ראה לוח ב '). ההערה הנוכחיתאד בחלונית C עולה כי המבנים שנבחרו הם כולם מ E. coli, נפתרו על ידי עקיפה קרני רנטגן בטווח של קבוצות החלל; יש טווח רזולוציה של 1.63 עד 2.8 Å, והם היו במשותף עם מגוון של ligands שונים (כולל לא ligands, AMP, ADP, MG ו מעכב AP5). שים לב שניתן להציג פרטים נוספים על ידי לחיצה על "הצג / הסתר עמודות" בחלונית C. יישור רצף מרובה מבוצע עם הכניסה לכרטיסייה ALIGN. החלונית הראשונה של הכרטיסייה ALIGN מציגה סיכום של היישור המספק פרטים על מספר שורות רצף (שווה ערך למספר מבנים PDB), כמו גם את מספר עמדות ( כלומר עמודות יישור). זה כולל מפרט של מספר פערים פערים שאינם מכילים עמודות. הדמות בצד ימין של השורה הראשונה מספקת ייצוג סכמטי של רצף היישור. הנה האזורים אפורים e מייצגים עמדות שאינן פערים, בעוד שטחים לבנים ביישור תואמים את הפערים. ייצוג של שימור רצף מוצג מעל היישור עם אזורים אדומים המציין היטב משומר עמדות, לבן המציין פחות משומר. שים לב כי רצפים נתון זה מסודרות על סמך הדמיון שלהם בתנאי dendrogram אשכולות בצד שמאל. הפאנל השני של הכרטיסייה הזו מאפשר גם קיבוץ באשכולות של PDBs נבחרים המבוססים על זוגיות שלהם רצף הדמיון, אשר יכול להיות דמיינו גם כמו dendrogram או מפת חום. כברירת מחדל, dendrogram (או תרשים עץ) המייצג את הסדר של אשכולות מוצג. ציר ה- dendrogram מייצג את המרחק (במונחים של זהות רצף) בין האשכולות. מבנה סופרפוזיציה מבוצע באופן אוטומטי עם כניסתו לכרטיסייה FIT. מבנים על גבי, מוצגים אינטראקטיבית בלוח א, אינדיקאTe נוכחות של אזור ליבה קשיח יחסית (שאריות מקיפה 1-29, 68-117, ו 161-214, לראות את "הליבה אופציונלי RMSD פרטים" פאנל בתחתית הכרטיסייה FIT לפרטים). שני אזורים משתנים אחרים מחייב נוקליאוטידים (שאריות 30-67 ו 118-167) נראים גם בבירור ( איור 2 ). אשכולות מבוססי RMSD מקבצים מבנים אלה לשני קונפורמציות שונות. לחיצה על הכרטיסייה PCA בצורה ברורה יותר מראה את הקשר בין המבנים במונחים של עקורים של אזורים אלה, כי למעשה לסגור את מינים נוקליאוטידים כבול במבנים קשורים ( איור 2 ב ו 2 ג ). רוב המבנים הם בצורת "סגור" (כחול בתרשים 2C ) וקשורים ליגנד קשורה או מעכב. לעומת זאת יותר "פתוח" קונפורמציות הם נוקליאוטידים ומעכב חינם. זה עולה בקנה אחד עםאת גוף נרחב של מחקר על מבנה ADK ודינמיקה המעידים על כך תצורה פתוחה של אזורים אלה נדרשת מחייב נוקליאוטידים קונפורמציה סגור להעברת phosphoryl יעיל ודיכוי של אירועים הידרוליזה מזיקה. זה ראוי לציון כי מחשב אחד לוכדת 97% מכלל תזוזה ריבוע מתכוון במבנה זה Adk מבנה מספק תיאור ברור ומשכנעת של המעבר פתוח סגור יחד עם תרומות שאריות בודדים זו תזוזה פונקציונלית (פאנל C של האפליקציה ו איור 2 ). ביקור בכרטיסייה NMA והגדלת מספר המבנים הנחשבים לצורך חישוב (באמצעות הקטנת החיתוך לסינון מבנים דומים) מצביע על כך שהמבנים הפתוחים של המדינה מציגים דינמיקה מקומית וגלובלית משופרת בהשוואה למבני צורה סגורים ( איור 2 ופאנל C של היישום) . השוואת PCA ו NMA תוצאות עבורמבנים בודדים (פאנל D) מציינים שהמצב הראשון של כל מבני הטופס הפתוח מציג חפיפה גבוהה יחסית ל- PC1 (עם ערך ממוצע של 0.37 ± 0.04). לעומת זאת, מבני צורה סגורים מציגים ערכים נמוכים יותר (עם ממוצע של 0.30 ± 0.01). ערכי RMSIP למבני צורה פתוחים (0.62 ± 0.003) גבוהים אף יותר מאלה של מבנים סגורים (0.56 ± 0.008). בנוסף, ניתוח חפיפה מראה כי המצבים הראשונים של המדינה הפתוחה נמצאים בהסכמה טובה עם השינוי קונפורמציה המתאר את ההבדל של המדינות הפתוחות והסגורות (פאנל E). קיבוץ באשכולות המבוסס על ערכי RMSIP מציג שוב מחיצות עקביות של מבנים ציבוריים פתוחים וסגורים (לוח F). תוצאות קולקטיביות אלה מצביעות על קיומן של שתי מצבים קונפורמטיביים מובהקים עבור Adk. אלה נבדלים על ידי תזוזה קולקטיבית בתדירות נמוכה של שני אזורים אתר מחייב נוקליאוטידים המציגים flexibi נפרדיםעם מחייב נוקליאוטידים. איור 1: סקירה של Bio3D-Web עם צילומי מסך של הכרטיסיות PCA ו- NMA. Bio3D-web לוקח משתמש בתנאי חלבון המבנה או רצף כמו קלט בכרטיסייה חיפוש ( 1 ). השרת מספק רשימה של מבנים קשורים, אשר ניתן לבחור לניתוח נוסף. ( 2 ) הכרטיסייה ALIGN מספקת יישור רצף וניתוח של המבנים שנבחרו בכרטיסייה 'חיפוש'. ( 3 ) בכרטיסייה FIT כל המבנים הם superimposed ו דמיינו ב 3D יחד עם התוצאות של ניתוח קונבנציונאלי זוג ניתוח מבנה. ( 4 ) ניתוח המרכיבים העיקריים של מבנה המבנה מתבצע בכרטיסייה PCA כדי לאפיין את היחסים בין המתאמים. ( 5 ) ניתוח מצב רגיל על כל מבנה יכול להתבצע בכרטיסייה eNMAכדי לחקור מגמות דינמיות למצבים המבניים הזמינים. אנא לחץ כאן כדי להציג גרסה גדולה יותר של דמות זו. איור 2: תוצאות של Bio3D- ניתוח האינטרנט של adenylate קינאז. ( א ) מבנים PDB זמין של קינאז adenylate על גבי הליבה invariant מזוהה. מבנים צבועים על פי אשכולות מבוססי RMSD המסופקים בכרטיסייה FIT. ( ב ) ויזואליזציה של המרכיבים העיקריים זמין מהכרטיסייה PCA כדי לאפיין את השינויים העיקריים קונפורמציה במערך הנתונים. כאן, המסלול המתאים למרכיב העיקרי הראשון מוצג בייצוג הצינור המראה את תנועת הסגירה בקנה מידה גדול של החלבון. ( ג ) מבנים הם יחסי ציבורנדחף אל שני המרכיבים העיקריים הראשונים שלהם בתוך העלילה קונפורמר המציג ייצוג מימדי נמוך של השתנות קונפורמציה. כל נקודה (או מבנה) צבועה לפי קריטריונים שנקבעו על ידי המשתמש, במקרה זה תוצאות אשכולות מבוססות PCA. ( D ) ניתוח מצב רגיל בכרטיסייה eNMA מציע דינמיקה מקומית וגלובלית משופרת עבור מבנים במצב פתוח (אדום) לעומת מבנים סגורים (כחול) מבנים. אנא לחץ כאן כדי להציג גרסה גדולה יותר של דמות זו.

Discussion

Bio3D- האינטרנט ניתן להשתמש כדי לחקור באופן אינטראקטיבי למפות את המצב המבני, דינמי ופונקציונלי של חלבונים מן מבנים קריסטלוגרפיים זמין. יתר על כן, NMA ו PCA מבוסס אשכולות התוצאות, יחד עם ההערות ואת ניתוח מבוסס רצף, יכול להיות שימושי במיוחד בבחירת מבנים נציג עבור ניתוח זמן רב יותר כגון עגינה קטנה מולקולה עגינה או סימולציות דינמיקה מולקולרית. Bio3D- אינטרנט ובכך מאפשר ניתוח ביואינפורמטיקה מבנית מתקדמים עבור מגוון רחב יותר של חוקרים על ידי הפחתת רמת הנדרשת של מומחיות טכנית. העיצוב הנוכחי של Bio3D-Web מדגיש פשטות על הכללת ממצה של שיטות ניתוח רבות הזמינות החבילה Bio3D העצמאי לחלוטין. במקרים רבים זה צפוי כי החוקרים ישתמשו Bio3D- האינטרנט כדי להבין מגמות כלליות במשפחה חלבון שלהם או של superfamily של עניין, אשר עשוי לאחר מכן ליידע יותר ניתוחים מיוחדים. Bio3D- האינטרנט הואRefore מתוכנן במהירות לחקור datasets מבנה biomolecular ולפעול ככלי לייצר היפותזה. אנו מעודדים משתמשים להמשיך לחקור את הנתונים שלהם על ידי מתן קוד Bio3D לדוגמה בדו"ח לשחזור כי גם מאחסן את כל פרטי השאילתה ותוצאות הניתוח.

בפרוטוקול לדוגמה נציג לעיל, אנו מראים את היכולת של Bio3D-Web כדי לחשוף את התכונות המבניות של מעברים קונפורציונלי פונקציונלי של Adk. יישומים נוספים של Bio3D-Web כוללים ניתוח מבני ודינמי של מבני PDB שהועלו על ידי המשתמש. לדוגמה, המשתמש יכול להעלות מבנים חדשים או רצפים חלבון אכן לניתוח. שלבי הניתוח שהוזכרו קודם לכן, ובמיוחד צעד ה- eNMA, יכולים לחשוף מגמות מקומיות וגלובליות בתנועות חלבונים, כאשר תנועות קולקטיביות הן בעלות משמעות תפקודית. השוואה עם מבנים apo יכול גם לחשוף מאפיינים של מעברים קונבנציונאליים מאוגדים. דוגמאות נוספות ליישוםמגוון של משפחות חלבונים שונים מסופקים באינטרנט.

למרות שכל החלבונים הם ישויות גמישות ודינאמיות, לא לכל החלבונים יש מבנים ברזולוציה אטומית הזמינים במגוון מדינות שונות ( למשל , מדינות פעילות ולא פעילות). ההשקפה שלנו על חלל מבנה חלבונים היא לפיכך אחת מוגבלת ולכן התובנה המתקבלת בכלים כגון Bio3D-web היא בהכרח מוגבלת גם עבור חלבונים מסוימים. עם זאת, עם ההתקדמות הטכנולוגית הנוכחית יוזמות חדשות עבור גנומיקה מבנית הפרוטוקול המוצג כאן יהיה יותר ויותר להיות נתיב חשוב עבור השגת תובנה היחסים מבנה תפקוד חשוב. צעד קריטי, אשר חשוב במיוחד בעת ניתוח חלבונים קשורים יותר רחוק, הוא פוטנציאל הופעתה של שגיאות יישור בכרטיסייה ALIGN. שגיאות המערך יהיו בהכרח להתרחש כאשר רצף רצף טיפות מתחת 30% ואת המשתמש חייב במקרים כאלה לבדוק פעמיים לתקן את רצף היישורבכרטיסייה ALIGN. שגיאות המערך יגרמו למבנה שגוי של תאים בכרטיסייה FIT, ויסגנו את השינויים הסטנדרטיים הרלוונטיים ביותר עבור ה- PCA הבא. בנוסף, המשתמש צריך להיות מודע שאריות חסרים במבנים PDB שנבחרו כמו ביישום הנוכחי PCA יכול להתבצע רק על שאריות חלבון שבו כל המבנים יש אטום אלפא פחמן המתאים שלהם נפתרה. כתוצאה מכך, אם PDB שנבחר יש שאריות שלא נפתרו עבור אזור מסוים של החלבון באזור זה יושמט מ PCA.

Bio3D-Web מוגבל כרגע לניתוח של מבנים בודדים שרשרת PDB. כתוצאה מכך, תנועות פונקציונליות המתרחשים ברמה הרביעית לא ניתן לחקור באמצעות הפרוטוקול הנוכחי. למרות שאנו מפתחים כיום אלגוריתמים חדשים כדי לכלול ניתוח כזה Bio3D- האינטרנט, האפשרות הנוכחית היחידה היא באמצעות שימוש ביו 3D קונבנציונאלי.

Bio3D-Web הוא יישום מקוון בלבדיון המאפשר לשאילתה ולזהות ערכות מבנה, לפרש את דפוסי הרצף שלהם ואת השונות המבנית, וכן לחלץ מידע מכניסטי מניתוח והן חיזוי של הפלסטיות המבנית שלהם. מגוון רחב של כלים להדמיה מולקולרית ושרתים מקוונים מאפשרים לחוקרים לחקור ולנתח מבנים biomolecular הפרט. עם זאת, כלים קיימים לניתוח של רצף, מבנה ודינמיקה של משפחות חלבון הטרוגניות גדולות דורשים לעתים קרובות מומחיות חישובית משמעותית, ובדרך כלל נשארים נגישים רק למשתמשים עם מיומנויות תכנות רלוונטיות. לדוגמה, החבילה Bio3D דורש R 8 , ProDy דורש פיתון ו Maven דורש ידע Matlab 9 , 10 . Bio3D-web לעומת זאת אינו דורש ידע בתכנות ובכך מגדיל את הנגישות ומקטין את מחסום הכניסה לביצוע רצף השוואתי מתקדם, מבנה ו dyניתוח namic. יתר על כן, הכנה, אוצרות, ביאור וניקוי של מבנים מולקולריים כי הוא הכרחי לעתים קרובות לניתוח יעיל כלול בשירות Bio3D- אינטרנט. בנוסף, המגבלה לבצע ניתוח כזה על משאבי החישוב המסוגלים היא הקלה על ידי מופע השרת שלנו המאפשר ניתוח בקנה מידה גדול של מבנים רבים שיכולים להיות יזום ומבוקר מכל דפדפן אינטרנט מודרני.

פיתוח פתוח של Bio3D- האינטרנט הוא הולך (ראה https://bitbucket.org/Grantlab/bio3d). אנו ממשיכים להוסיף פונקציונליות ניתוח חדשה ולשפר את השיטות הקיימות. הפיתוח העתידי יתמקד בהוספת PCA המבוססת על מטריצות המבוססות על PCA ו- PCA פיתוליים, גישות שימור רחבות יותר, הכוללות רכיב פילוגנטי, זיהוי אתר זיהוי מחייב וגישות חדשות לניתוח רשת דינמי על פני משפחות חלבונים. מבחינה זו יישום האינטרנט הנוכחי מייצג את נקודת ההתחלהT עבור רבים אחרים שיתופית מבניים מבניים ניתוח workflows על ידי הפעלת צעדים לשחזור ו shareable על המשתמש מוגדר מבנה הניסוי קובע. כמו כן, אנו מתכננים תמיכה עתידית של יחידות ביולוגיות משוחזרות של יחידות ביולוגיות בנוסף לרשתות בודדות ורבות מהיחידה הא-סימטרית של מבני PDB. תכונות נוספות יכללו חיסכון משופר וטעינה של שטחי עבודה משותפים יחד עם אפשרות לבטל.

Bio3D-Web הוא יישום מקוון לניתוח אינטראקטיבי של נתוני המבנה biomolecular. Bio3D-web פועל על כל דפדפן אינטרנט מודרני ומספק פונקציונליות עבור: (1) זיהוי של מבנה חלבון קשור קובע למשתמש סף שצוין של דמיון; (2) יישור מרובים שלהם סופרפוזיציה המבנה; (3) ניתוח שימור רצף ומבנה; (4) מיפוי היחסים בין תאימות עם ניתוח המרכיבים העיקריים, וכן (5) השוואה של הדינמיקה הפנימית החזוי באמצעות אנסמבל ולאניתוח מצב mal. פונקציונליות משולבת זו מספקת זרימת עבודה מלאה לחקר יחסי רצף-מבנה דינמי בתוך משפחות חלבון ו superfamilies. בנוסף נוח וקל לשימוש ממשק דינמי לחקר ההשפעות של פרמטר ושיטות בחירה, Bio3D-web גם רשומות קלט המשתמש המלא ואת התוצאות הגרפיות הבאות של הפגישה של המשתמש. זה מאפשר למשתמשים לשתף בקלות לשכפל את רצף של שלבי ניתוח שיצר results.Bio3D האינטרנט מיושם לחלוטין בשפה R והוא מבוסס על חבילות Bio3D ו R מבריק. זה יכול להיות מופעל מתוך השרת המקוון שלנו או מותקן באופן מקומי על כל מחשב פועל R. זה כולל התקנת שרת מקומי לספק מופע משתמש מותאם אישית מרובה עם גישה למערכי נתונים מבניים עדיפות כגון אלה נפוצים בתעשיית התרופות. קוד המקור המלא ומסמכים נרחבים מסופקים תחת רישיון קוד פתוח של GPL-3 מתוך: http://thegrantlab.org/ Bio3d / webapps

Disclosures

The authors have nothing to disclose.

Acknowledgements

אנו מודים לד"ר Guido Scarabelli והונגיאנג לי על בדיקות מקיפות לאורך כל הפיתוח, כמו גם את קהילת המשתמשים Bio3D ואת אוניברסיטת ברגן מבניים ביואינפורמטיקה המשתתפים בסדנה עבור משוב והערות ששיפרו את היישום הזה.

Materials

Bio3D-web
Web-site http://thegrantlab.org/bio3d-web/
Requirements Web browser

References

  1. Kornev, A. P., Taylor, S. S. Dynamics-Driven Allostery in Protein Kinases. Trends Biochem. Sci. 40 (11), 628-647 (2015).
  2. Yao, X. -. Q., Grant, B. J. Domain-opening and dynamic coupling in the α-subunit of heterotrimeric G proteins. Biophys. J. 105 (2), L08-L10 (2013).
  3. Henzler-Wildman, K. A., et al. Intrinsic motions along an enzymatic reaction trajectory. Nature. 450 (7171), 838-844 (2007).
  4. Boehr, D., Nussinov, R., Wright, P. The role of dynamic conformational ensembles in biomolecular recognition. Nat. Chem. Biol. 5 (11), 789-796 (2009).
  5. Teilum, K., Olsen, J. G., Kragelund, B. B. Functional aspects of protein flexibility. Cell Mol Life Sci. 66 (14), 2231-2247 (2009).
  6. Henzler-Wildman, K., Kern, D. Dynamic personalities of proteins. Nature. 450 (7172), 964-972 (2007).
  7. Grant, B. J., Gorfe, A. A., McCammon, J. A. Large conformational changes in proteins: signaling and other functions. Curr. Opin. Struct. Biol. 20 (2), 142-147 (2010).
  8. Grant, B. J., Rodrigues, A. P. C., ElSawy, K. M., McCammon, J. A., Caves, L. S. D. Bio3d: an R package for the comparative analysis of protein structures. Bioinformatics. 22 (21), 2695-2696 (2006).
  9. Bakan, A., Meireles, L. M., Bahar, I. ProDy: protein dynamics inferred from theory and experiments. Bioinformatics. 27 (11), 1575-1577 (2011).
  10. Zimmermann, M. T., Kloczkowski, A., Jernigan, R. L. MAVENs: motion analysis and visualization of elastic networks and structural ensembles. BMC Bioinformatics. 12 (1), 264 (2011).
  11. Yang, L. -. W., et al. oGNM: online computation of structural dynamics using the Gaussian Network Model. Nucleic Acids Res. 34, 24-31 (2006).
  12. Suhre, K., Sanejouand, Y. -. H. ElNemo: a normal mode web server for protein movement analysis and the generation of templates for molecular replacement. Nucleic Acids Res. 32, W610-W614 (2004).
  13. Tiwari, S. P., et al. WEBnm@ v2.0: Web server and services for comparing protein flexibility. BMC Bioinformatics. 15 (1), 427 (2014).
  14. Hrabe, T., et al. PDBFlex: exploring flexibility in protein structures. Nucleic Acids Res. 44, D423-D428 (2016).
  15. Skjærven, L., Jariwala, S., Yao, X. -. Q., Grant, B. J. Online interactive analysis of protein structure ensembles with Bio3D-web. Bioinformatics. , (2016).
  16. Skjærven, L., Yao, X., Scarabelli, G., Grant, B. J. Integrating protein structural dynamics and evolutionary analysis with Bio3D. BMC Bioinformatics. 15 (399), 1-11 (2014).
  17. Eddy, S. R. Accelerated Profile HMM Searches. PLoS Comput. Biol. 7 (10), (2011).
  18. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  19. Berman, H. M. The Protein Data Bank. Nucleic Acids Res. 28 (1), 235-242 (2000).
  20. Finn, R. D., et al. Pfam: the protein families database. Nucleic Acids Res. 42, D222-D230 (2014).
  21. Kerns, S. J., et al. The energy landscape of adenylate kinase during catalysis. Nat. Struct. Mol. Biol. 22 (2), 124-131 (2015).

Play Video

Cite This Article
Jariwala, S., Skjærven, L., Yao, X., Grant, B. J. Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web. J. Vis. Exp. (125), e55640, doi:10.3791/55640 (2017).

View Video