כאן אנו מציגים את הכלי proteogenomic פוגו ופרוטוקולים עבור שינוי מהיר, כמותי, post-translational ו- variant מופעלת מיפוי של פפטידים מזוהה באמצעות ספקטרומטר מסה על גבי הגנום הפניה. כלי זה הוא השימוש כדי לשלב והמחש proteogenomic ומחקרים פרוטיאומיה מבנית אישי התממשקות עם נתונים גנומיקה אורתוגונלית.
צולבות לדבר בין גנים, תעתיקים חלבונים היא המפתח תגובות הסלולר; לפיכך, להיות מורחב ניתוח של רמות מולקולרית כישויות נפרדות לאט ללימודים אינטגרטיבית כדי לשפר את ההבנה של דינמיקה מולקולרית בתוך התאים. כלים הנוכחי ויזואליזציה של שילוב החלבונים עם datasets טכנולוגיות אחרות לא מתאימים ללימודי בקנה מידה גדול. יתר על כן, הם רק ללכוד בסיסי רצף לזהות, השמטת כימות והערכה שינויים post-translational. כדי לטפל בבעיות אלה, פיתחנו פוגו למפות פפטידים עם שינויים post-translational המשויך, כימות להפנות הגנום ביאור. בנוסף, הכלי פותח כדי לאפשר את המיפוי של פפטידים מזוהה ממסדי רצף מותאם אישית, שילוב גרסאות חומצה אמינית בודדת. בעוד פוגו הוא כלי שורת פקודה, הממשק הגרפי PoGoGUI מאפשר לחוקרים שאינם-ביואינפורמטיקה למפות בקלות פפטידים 25 מינים נתמך על ידי ביאור הגנום Ensembl. הפלט שנוצר במחילות תבניות קובץ מהשדה גנומיקה ו, לכן, ויזואליזציה נתמך ברוב הדפדפנים הגנום. ללימודים בקנה מידה גדול, פוגו נתמך על ידי TrackHubGenerator ליצירת מאגרים אינטרנט נגיש של נתונים ממופה הגנום גם לאפשר שיתוף קל של נתונים proteogenomics. עם מעט מאמץ, כלי זה ניתן למפות את מיליוני פפטידים להפנות הגנום בתוך דקות ספורות בלבד, outperforming כלים זמינים רצף-זהות מבוסס אחרים. פרוטוקול זה מדגים את הגישות הטוב ביותר עבור מיפוי proteogenomics דרך פוגו עם datasets זמין לציבור של כמותיים, phosphoproteomics, כמו גם מחקרים בקנה מידה גדול.
בתאים, הגנום transcriptome, פרוטאום משפיעים אחד על השני כדי לווסת את תגובה לגירויים פנימיים וחיצוניים, לתקשר אחד עם השני כדי לבצע פונקציות ספציפיות שמוביל מחלה ובריאות. לכן, אפיון וכימות גנים תעתיקים, חלבונים חיוני להבנת תהליכים תאיים באופן מלא. הדור הבא רצפי (הגדרות) היא אחת האסטרטגיות הנפוצות יישומית כדי לזהות ולכמת ג’ין והביטוי תעתיק. עם זאת, ביטוי חלבונים מוערך בדרך כלל באמצעות ספקטרומטר מסה (MS). התקדמות משמעותית בטכנולוגיה MS בעשור האחרון אפשרה יותר מלאה וכימות של proteomes, שהופך את הנתונים דומה עם transcriptomics1. Proteogenomics מולטי-טכנולוגיות כמו דרכים לשלב נתונים המיתרים ו- MS הפכו גישות עוצמה להעריך תהליכים תאיים על פני מספר רמות מולקולרית, זיהוי תתי סוגים של סרטן, המוביל אל הרומן פוטנציאלים סמים סרטן2 , 3. חשוב לציין proteogenomics הזה שימש במקור כדי לספק ראיות פרוטיאומיה מבנית ביאורים ג’ין, התעתיק4. מספר גנים בעבר חשבו להיות ללא קידוד לאחרונה עברו הערכה מחדש בהתחשב רקמות אנושיות בקנה מידה גדול datasets5,6,7. בנוסף, נתונים פרוטיאומיה מבנית בהצלחה משמשים כדי לתמוך במאמצים ביאור אורגניזמים שאינם-דגם8,9. עם זאת, שילוב של נתונים proteogenomic אפשר לנצל יותר האר ביטוי חלבון ביחס תכונות גנומית, להבהיר צולבות לדבר בין תעתיקים חלבונים על-ידי אספקת מערכת הפניה משולב ושיטות ויזואליזציה משותף.
על מנת לספק הפניה נפוצות פרוטאומיקס, transcriptomics ונתונים גנומיקה, יושמו כלים רבים עבור מיפוי פפטידים מזוהה באמצעות MS לתוך הגנום הציון10,11,12 ,13,14,15,16,17. גישות נבדלים היבטים כגון מיפוי סימוכין, התמיכה של דפדפנים הגנום, ואת מידת שילוב עם כלים אחרים פרוטאומיקס, כפי שמוצג באיור1. בעוד כמה כלים למפות פפטידים מתורגם הפוכה על גבי הגנום16, אחרים להשתמש עמדה מבואר מנוע חיפוש בתוך לביאור חלבון וג’ין לשחזר את רצף נוקלאוטיד של פפטיד15. עדיין אחרים להשתמש תרגום 3 או 6-מסגרת של הגנום למפות פפטידים נגד11,13. לבסוף, מספר כלים לדלג את רצפי ולהשתמש חומצת אמינו רצף תרגומים מן הרנ א-רצף ממופה תעתיקים כמתווך אליו יש למפות הגנום המשויך הציון10,12, פפטידים 14,17. עם זאת, התרגום של רצפי הוא תהליך איטי, מסדי נתונים מותאם אישית נוטים שגיאות המופצות למיפוי פפטיד. למיפוי מהיר, תפוקה גבוהה, הפניה קטן ומקיף היא קריטית. לכן, הפניה חלבון סטנדרטית עם הגנום המשויך הקואורדינטות הוא חיוני עבור פפטיד מדויק מיפוי הגנום. היבטים חדשניים proteogenomics, כגון שילוב של משתנים, שינויים post-translational (PTMs)2,3, אתה צובר תאוצה דרך מחקרים שנעשו לאחרונה. עם זאת, אלו בדרך כלל אינם נתמכים הנוכחי proteogenomic מיפוי כלי כמוצג באיור1. כדי לשפר את המהירות והאיכות של מיפוי, פוגו פותחה, כלי המאפשר את המיפוי המהיר, כמותית של פפטידים כדי הגנום18. בנוסף, פוגו מאפשר המיפוי של פפטידים עם עד שתי גרסאות רצף והשינויים post-translational המבואר.
פוגו פותחה כדי להתמודד עם העלייה המהירה של כמותיים datasets ברזולוציה גבוהה לכידת proteomes ושינויים הכללית ומספק כלי מרכזי עבור ניתוחים בקנה מידה גדול כמו וריאציה אישית ורפואה דיוק. מאמר זה מתאר את היישום של כלי זה כדי להמחיש את הנוכחות של שינוי post-translational ביחס תכונות גנומית. יתר על כן, מאמר זה מדגיש את הזיהוי של אירועים splicing חלופיים באמצעות פפטידים ממופה ומיפוי של פפטידים זיהו דרך מסדי נתונים variant מותאם אישית כדי הגנום הפניה. פרוטוקול זה מעסיקה datasets זמין לציבור שהורדו מ- ארכיון גאווה19 כדי להדגים את פונקציות אלה של פוגו. בנוסף, פרוטוקול זה מתאר את היישום של TrackHubGenerator להקמת מרכזי נגיש באינטרנט של פפטידים למפות את הגנום ללימודי proteogenomics בקנה מידה גדול.
פרוטוקול זה מתאר איך הכלי תוכנות פוגו וממשק משתמש גרפי שלו PoGoGUI מאפשרים מיפוי מהיר של פפטידים על גבי הגנום קואורדינטות. הכלי מציע תכונות ייחודיות כגון שינוי כמותי, post-translational, התומכים ב- variant מיפוי הגנום באמצעות הפניה ביאור. מאמר זה מדגים את השיטה על מחקר proteogenomic בקנה מידה גדול, מדגיש את יעילותו זיכרון ומהירות לעומת אחרים בכלים הזמינים18. בשילוב עם הכלי TrackHubGenerator, אשר יוצר רכזות נגיש באינטרנט של גנומית ומקושרים הגנום נתונים, פוגו, עם ממשק משתמש גרפי שלו, מאפשר לימודים proteogenomics בקנה מידה גדול במהירות להמחיש את הנתונים שלהם בהקשר גנומית. יתר על כן, נדגים את המאפיינים הייחודיים של פוגו עם datasets חיפוש מול מסדי נתונים variant ל-22,phosphoproteomics כמותיים29.
קבצים בודדים, כגון קובץ GCT, מספקים ויזואליזציה ערך וקישורים בין פפטיד תכונות לוקוסים גנומית. עם זאת, חשוב לציין כי פרשנות המבוססת על אלה לבד יכול להיות קשה או מטעה עקב הגבלה שלהם להיבטים יחיד של proteogenomics כגון הייחודיות, שינויים post-translational ערכים כמותיים. לכן, חשוב לבחור בקפידה את קבצי פלט, האפשרויות והשילובים אשר מתאימות השאלה proteogenomic בהישג יד ולשנות את השילובים. לדוגמה, מידע על ייחודה של המיפוי לוקוס גנומית ספציפי יכול להיות בעל ערך רב עבור הביאור של תכונה גנומית7, תוך כימות מדגמים שונים יכול להיות מתאים יותר עבור מחקרים הנוגעים תכונות גנומית לשינויים חלבון שפע29. הפלט אמור להיווצר על-ידי פוגו עבור כל הגדרה. במקרה אין פלט נוצר, או קבצים ריקים מוצגים בו תיקיית הפלט, מומלץ לבדוק את קבצי קלט עבור התוכן הרצוי ותבנית הקובץ הדרוש. במקרים שבהם תבנית הקובץ או את התוכן תבצע את הציפיות של פוגו (למשל, הקובץ FASTA כביכול המכיל את רצפי תרגום התמליל מכיל את רצפי של התרשימים), הודעות שגיאה יבקש מהמשתמש בדוק את קבצי קלט.
ההגבלות של הפרוטוקול והכלי מתבססים בעיקר על שימוש חוזר של תבניות קובץ נפוץ גנומיקה. שינוי פורמטים גנומיקה ליישומים proteogenomic מלווה מגבלות מסוימות. אלה נובעים ערכות שונות של דרישות הגנום ממורכז ויזואליזציה של גנומית proteogenomic נתונים, כגון הצורך לדמיין post-translational שינויים מהנתונים פרוטאומיקס. זה הוא מוגבל בתבניות קבצים גנומיקה על-ידי שימוש תכונה אחת. גישות וכלים רבים פותחו עבור פרוטאומיקס למקם בביטחון post-translational שינויים בתוך פפטיד רצפים31,32,33,34. עם זאת, הפריט החזותי של שינויים מרובים באופן ייחודי ניכרת על הגנום מתעכבת על ידי המבנה של תבניות קובץ גנומית. לכן, הפריט החזותי מגוש אחד של PTMs מרובים מאותו סוג אינו מהווה כל המשמעיות של האתרים שינוי אך הוא התוצאה של הדרישה שונות מהקהילה גנומיקה רק לדמיין תכונות בודד בכל פעם. למרות זאת, פוגו יש את היתרון של מיפוי שינויים post-translational על גבי קואורדינטות גנומית כדי לאפשר מחקרים התמקדו השפעת תכונות גנומית כגון גרסאות נוקלאוטיד יחיד על שינויים post-translational. מיפוי variant באמצעות פוגו, מגדילה את מספר הכולל מיפויים. אולם, קידוד צבע ייחודי של פפטידים ממופה מדגיש מיפויים אמין מכל אלה לא אמין. המיפוי של פפטידים variant מזוהה ממשתני ידוע נוקלאוטיד יחיד יכול להיות מלווה להמחיש את פפטידים ממופה לצד גרסאות בתבנית VCF. בדרך זו קוד צבע המציין של מיפוי לא אמין של פפטיד variant נדחית על ידי הנוכחות של variant נוקלאוטיד ידוע.
שלב קריטי עבור השימוש פוגו הוא השימוש של הקבצים הנכונים ותבניות. השימוש של רצפי התעתיק מתורגמים כמו חלבון רצפים ללוות את הביאור בתבנית GTF הוא הקריטריון העיקרי. עוד אלמנט קריטי כאשר שוקלים שימוש פוגו למפות פפטידים עם חומצת אמינו אי-התאמות הוא זיכרון. בעוד זיכרון-יעילה במיוחד עבור יישום תקן, באופן משמעותי, אקספוננציאלית הגדלת מספר מיפויים אפשרי עם אחד או שניים אי-התאמות מוביל עלייה אקספוננציאלית דומה זיכרון השימוש18. אנו מציעים בשלבים מיפוי כפי שמתואר פרוטוקול זה קודם למפות את פפטידים ללא אי-התאמות ולהסיר אותם מן הסט. פפטידים בעבר שלא מופו עוקבות אז הניתנות למיפוי באמצעות התאמה אחת, ניתן לחזור על התהליך עם שני אי התאמות עבור פפטידים הנותרים שאינם ממופים.
מאז גדל באופן משמעותי התפוקה של ספקטרומטר מסה התממשקות גנומית מחקרים ונתונים פרוטיאומיה מבנית נעשים תכופים יותר בשנים האחרונות, כלים ברצון לאפשר התממשקות סוגים אלה של הנתונים באותה מערכת קואורדינטות נמצאים יותר ויותר הכרחי. הכלי המובאת כאן יסייעו את הצורך לשלב גנומית והנתונים פרוטיאומיה מבנית לשיפור הבנה טובה יותר של לימודים אינטגרטיבית מעבר datasets קטנים וגדולים על-ידי מיפוי פפטידים על גבי לביאור הפניה. . Encouragingly, פוגו הוחל למיפוי פפטידים מועמדים הגן הניתנים באותה התבנית כמו הביאור אסמכתא לתמיכה ביאור המאמצים של הרומן גנים ביטוי אנושי testis35. הגישה המוצגת כאן היא עצמאית של מסדי נתונים המשמש לזיהוי פפטיד. הפרוטוקול שעשויים לסייע בזיהוי, ויזואליזציה של תרגום הרומן מוצרים באמצעות הותאם שקבצי קלט מן תרגום רצפי ומקושרת GTF קבצים מ- RNA-seq ניסויים.
מספר גישות וכלים עם מגוון רחב של תרחישים יישום מיוחד כדי למפות פפטידים קואורדינטות גנומית, החל מיפוי פפטידים ישירות על רצף הגנום ל RNA-רצף מונחית מיפוי, כבר הציג10, 11 , 12 , 13 , 14 , 15 , 16 , 17. עם זאת, אלה עלולים לגרום כשל למפות כהלכה פפטידים כאשר שינויים post-translational קיימות שגיאות המיפוי כבסיס הקריאות רצפי RNA עשוי להיות מופצות לשלב פפטיד. פוגו פותחה במיוחד להתגבר על המכשולים הללו, כדי להתמודד עם העלייה המהירה של datasets כמותיים פרוטיאומיה מבנית ברזולוציה גבוהה להשתלב עם פלטפורמות גנומיקה אורתוגונלית. הכלי המתוארים כאן ניתן לשלב זרימות עבודה תפוקה גבוהה. באמצעות ממשק גרפי PoGoGUI, הכלי הוא פשוט לשימוש ואינה מצריכה כל הכשרה ביואינפורמטיקה מומחה.
The authors have nothing to disclose.
עבודה זו מומן על ידי טרסט (WT098051) ואת המענק NIH (U41HG007234) לפרויקט GENCODE.
PoGo (software) | NA | NA | https://github.com/cschlaffner/PoGo |
PoGoGUI (software) | NA | NA | https://github.com/cschlaffner/PoGoGUI |
TrackHubGenerator (software) | NA | NA | https://github.com/cschlaffner/TrackHubGenerator |
Integrative Genomics Viewer (software) | NA | NA | http://software.broadinstitute.org/software/igv/ |
UCSC genome browser (website) | NA | NA | https://genome.ucsc.edu/ |
GENCODE (website) | NA | NA | http://gencodegenes.org |
Ensembl (website) | NA | NA | http://ensembl.org |
bedToBigBed (software) | NA | NA | http://hgdownload.soe.ucsc.edu/admin/exe/ |
fetchChromSizes.sh (software) | NA | NA | http://hgdownload.soe.ucsc.edu/admin/exe/ |