Summary

שיטה כמותית ומהירה השינוי Post-translational וגרסא מופעלת מיפוי של פפטידים כדי הגנום

Published: May 22, 2018
doi:

Summary

כאן אנו מציגים את הכלי proteogenomic פוגו ופרוטוקולים עבור שינוי מהיר, כמותי, post-translational ו- variant מופעלת מיפוי של פפטידים מזוהה באמצעות ספקטרומטר מסה על גבי הגנום הפניה. כלי זה הוא השימוש כדי לשלב והמחש proteogenomic ומחקרים פרוטיאומיה מבנית אישי התממשקות עם נתונים גנומיקה אורתוגונלית.

Abstract

צולבות לדבר בין גנים, תעתיקים חלבונים היא המפתח תגובות הסלולר; לפיכך, להיות מורחב ניתוח של רמות מולקולרית כישויות נפרדות לאט ללימודים אינטגרטיבית כדי לשפר את ההבנה של דינמיקה מולקולרית בתוך התאים. כלים הנוכחי ויזואליזציה של שילוב החלבונים עם datasets טכנולוגיות אחרות לא מתאימים ללימודי בקנה מידה גדול. יתר על כן, הם רק ללכוד בסיסי רצף לזהות, השמטת כימות והערכה שינויים post-translational. כדי לטפל בבעיות אלה, פיתחנו פוגו למפות פפטידים עם שינויים post-translational המשויך, כימות להפנות הגנום ביאור. בנוסף, הכלי פותח כדי לאפשר את המיפוי של פפטידים מזוהה ממסדי רצף מותאם אישית, שילוב גרסאות חומצה אמינית בודדת. בעוד פוגו הוא כלי שורת פקודה, הממשק הגרפי PoGoGUI מאפשר לחוקרים שאינם-ביואינפורמטיקה למפות בקלות פפטידים 25 מינים נתמך על ידי ביאור הגנום Ensembl. הפלט שנוצר במחילות תבניות קובץ מהשדה גנומיקה ו, לכן, ויזואליזציה נתמך ברוב הדפדפנים הגנום. ללימודים בקנה מידה גדול, פוגו נתמך על ידי TrackHubGenerator ליצירת מאגרים אינטרנט נגיש של נתונים ממופה הגנום גם לאפשר שיתוף קל של נתונים proteogenomics. עם מעט מאמץ, כלי זה ניתן למפות את מיליוני פפטידים להפנות הגנום בתוך דקות ספורות בלבד, outperforming כלים זמינים רצף-זהות מבוסס אחרים. פרוטוקול זה מדגים את הגישות הטוב ביותר עבור מיפוי proteogenomics דרך פוגו עם datasets זמין לציבור של כמותיים, phosphoproteomics, כמו גם מחקרים בקנה מידה גדול.

Introduction

בתאים, הגנום transcriptome, פרוטאום משפיעים אחד על השני כדי לווסת את תגובה לגירויים פנימיים וחיצוניים, לתקשר אחד עם השני כדי לבצע פונקציות ספציפיות שמוביל מחלה ובריאות. לכן, אפיון וכימות גנים תעתיקים, חלבונים חיוני להבנת תהליכים תאיים באופן מלא. הדור הבא רצפי (הגדרות) היא אחת האסטרטגיות הנפוצות יישומית כדי לזהות ולכמת ג’ין והביטוי תעתיק. עם זאת, ביטוי חלבונים מוערך בדרך כלל באמצעות ספקטרומטר מסה (MS). התקדמות משמעותית בטכנולוגיה MS בעשור האחרון אפשרה יותר מלאה וכימות של proteomes, שהופך את הנתונים דומה עם transcriptomics1. Proteogenomics מולטי-טכנולוגיות כמו דרכים לשלב נתונים המיתרים ו- MS הפכו גישות עוצמה להעריך תהליכים תאיים על פני מספר רמות מולקולרית, זיהוי תתי סוגים של סרטן, המוביל אל הרומן פוטנציאלים סמים סרטן2 , 3. חשוב לציין proteogenomics הזה שימש במקור כדי לספק ראיות פרוטיאומיה מבנית ביאורים ג’ין, התעתיק4. מספר גנים בעבר חשבו להיות ללא קידוד לאחרונה עברו הערכה מחדש בהתחשב רקמות אנושיות בקנה מידה גדול datasets5,6,7. בנוסף, נתונים פרוטיאומיה מבנית בהצלחה משמשים כדי לתמוך במאמצים ביאור אורגניזמים שאינם-דגם8,9. עם זאת, שילוב של נתונים proteogenomic אפשר לנצל יותר האר ביטוי חלבון ביחס תכונות גנומית, להבהיר צולבות לדבר בין תעתיקים חלבונים על-ידי אספקת מערכת הפניה משולב ושיטות ויזואליזציה משותף.

על מנת לספק הפניה נפוצות פרוטאומיקס, transcriptomics ונתונים גנומיקה, יושמו כלים רבים עבור מיפוי פפטידים מזוהה באמצעות MS לתוך הגנום הציון10,11,12 ,13,14,15,16,17. גישות נבדלים היבטים כגון מיפוי סימוכין, התמיכה של דפדפנים הגנום, ואת מידת שילוב עם כלים אחרים פרוטאומיקס, כפי שמוצג באיור1. בעוד כמה כלים למפות פפטידים מתורגם הפוכה על גבי הגנום16, אחרים להשתמש עמדה מבואר מנוע חיפוש בתוך לביאור חלבון וג’ין לשחזר את רצף נוקלאוטיד של פפטיד15. עדיין אחרים להשתמש תרגום 3 או 6-מסגרת של הגנום למפות פפטידים נגד11,13. לבסוף, מספר כלים לדלג את רצפי ולהשתמש חומצת אמינו רצף תרגומים מן הרנ א-רצף ממופה תעתיקים כמתווך אליו יש למפות הגנום המשויך הציון10,12, פפטידים 14,17. עם זאת, התרגום של רצפי הוא תהליך איטי, מסדי נתונים מותאם אישית נוטים שגיאות המופצות למיפוי פפטיד. למיפוי מהיר, תפוקה גבוהה, הפניה קטן ומקיף היא קריטית. לכן, הפניה חלבון סטנדרטית עם הגנום המשויך הקואורדינטות הוא חיוני עבור פפטיד מדויק מיפוי הגנום. היבטים חדשניים proteogenomics, כגון שילוב של משתנים, שינויים post-translational (PTMs)2,3, אתה צובר תאוצה דרך מחקרים שנעשו לאחרונה. עם זאת, אלו בדרך כלל אינם נתמכים הנוכחי proteogenomic מיפוי כלי כמוצג באיור1. כדי לשפר את המהירות והאיכות של מיפוי, פוגו פותחה, כלי המאפשר את המיפוי המהיר, כמותית של פפטידים כדי הגנום18. בנוסף, פוגו מאפשר המיפוי של פפטידים עם עד שתי גרסאות רצף והשינויים post-translational המבואר.

פוגו פותחה כדי להתמודד עם העלייה המהירה של כמותיים datasets ברזולוציה גבוהה לכידת proteomes ושינויים הכללית ומספק כלי מרכזי עבור ניתוחים בקנה מידה גדול כמו וריאציה אישית ורפואה דיוק. מאמר זה מתאר את היישום של כלי זה כדי להמחיש את הנוכחות של שינוי post-translational ביחס תכונות גנומית. יתר על כן, מאמר זה מדגיש את הזיהוי של אירועים splicing חלופיים באמצעות פפטידים ממופה ומיפוי של פפטידים זיהו דרך מסדי נתונים variant מותאם אישית כדי הגנום הפניה. פרוטוקול זה מעסיקה datasets זמין לציבור שהורדו מ- ארכיון גאווה19 כדי להדגים את פונקציות אלה של פוגו. בנוסף, פרוטוקול זה מתאר את היישום של TrackHubGenerator להקמת מרכזי נגיש באינטרנט של פפטידים למפות את הגנום ללימודי proteogenomics בקנה מידה גדול.

Protocol

1. הכנה ההורדה, ההתקנה הערה: הדוגמאות נתיב התיקיה והקובץ מוצגות בתבנית Windows כדי להקל על גישה עבור משתמשים רגילים. פוגו, PoGoGUI זמינים גם עבור macOS מערכות ההפעלה לינוקס. להוריד פוגו, PoGoGUI GitHub לפתוח דפדפן אינטרנט ונווטו פוגו על GitHub (http://github.com/cschlaffner/PoGo/). בחירת משחרר ולהוריד האחרון שחרור zip הקובץ הדחוס. לחלץ את הקובץ הדחוס לתוך התיקיה ‘ הפעלה ‘ (למשל, C:\PoGo\executables\). נווט בדפדפן אינטרנט כדי PoGoGUI על GitHub (http://github.com/cschlaffner/PoGoGUI/). בחירת משחרר ולהוריד את האחרון שחרור צנצנת הקובץ (למשל, “PoGoGUI-v1.0.2.jar”). אחסן את קובץ jar בתיקיה קבצי הפעלה. הורד את הגנום ביאור של רצפי חלבונים מתורגםהערה: הורד את הגנום ביאור של רצפי חלבונים מתורגם הנתמכים מינים GENCODE7 (www.gencodegenes.org) או Ensembl20 (www.ensembl.org) את כללי העברה תבנית (GTF), את רצפי חלבונים FASTA תבנית. בדפדפן האינטרנט, נווט אל www.gencodegenes.org ובחר ‘ נתונים | האדם | שחרור הנוכחי. להוריד את ביאור מקיף גן דרך הקישור GTF וחלץ את הקובץ דחוס-gz לתוך תיקיית הנתונים (לדוגמה, C:\PoGo\Data\) באמצעות תוכנית unzipping (למשל, 7-Zip). להוריד את החלבון-קידוד תעתיק תרגום רצפי באמצעות הקישור FASTA ולחלץ את קובץ דחוס-gz לתוך התיקיה data שנוצר בשלב הקודם. לחלופין, נווט בדפדפן אינטרנט כדי www.ensembl.org ובחר הורדות ואחריו להוריד נתונים באמצעות FTP. למצוא זן נתמכים (למשל, אדם). הורד את הקובץ שחרור העדכנית ביותר עבור ביאור התעתיק באמצעות הקישור GTF בעמודה ג’ין להגדיר . לבחור את הקובץ עם שם מבנה “species.release.gtf.gz”, לחלץ את הקובץ דחוס-gz לתוך התיקיה data. הורד את המהדורה האחרונה חלבונים תעתיק תרגום רצפי באמצעות FASTA את הקישור בעמודה רצף חלבונים (FASTA) . לבחור את הקובץ עם המבנה בשם “species.release.pep.all.fa.gz”, לחלץ את הקובץ דחוס-gz לתוך התיקיה data. להכין פפטיד תיקי זיהויהערה: פוגו תומך רק בעיצוב 4 עמודות המכילה מדגם המזהה, רצף פפטיד, מספר פפטיד-ספקטרום-גפרורים (PSMs), ואת ערך כמותי. עם זאת, PoGoGUI תומך מתוקננת זיהוי קובץ תבניות mzIdentML, mzid, mzTab, וממירה אותם לפורמט 4 עמודות של פוגו באמצעות ms-נתונים-core-api מסגרת זמין לציבור21. ניתן להוריד קבצים ב- mzIdentML, mzid או mzTab תבנית ארכיון19הגאווה. לחלופין, ניתן לספק נתונים בתבנית קובץ מופרד באמצעות טאבים עם סיומת .tsv או .pogo. התבנית מכילה 4 טורים עם כותרות העמודות הבאות: מדגם המזהה (דוגמה), פפטיד רצפים (פפטיד), מספר פפטיד-ספקטרום-גפרורים (PSMs), כימות פפטיד (חשבים). לדוגמה מוצג באיור2. הורד קובץ דוגמא בתבנית mzTab מ מחקר פרוטאומיקס testis אנושי בין גאווה ארכיון19 (https://www.ebi.ac.uk/pride/archive/projects/PXD006465/files22). להציל ולחלץ את קובץ דחוס-gz לתוך התיקיה data שנוצר בשלב 1.2.1.הערה: לחלופין, להוריד נתוני לדוגמה עבור האדם phosphoproteomics חיפוש עם MaxQuant מתוך ארכיון גאווה (קובץ “Traktman_2013_MaxQuantOutput-full.zip” מ https://www.ebi.ac.uk/pride/archive/projects/PXD005246/files23). להציל ולחלץ את קובץ בדחיסת zip בספריה data שנוצר בשלב 1.2.1. פתח את גיליון אלקטרוני ריק ו לייבא את הקובץ peptides.txt בתיקייה c: / פוגו/נתונים/Traktman_2013_MaxQuantOutput-מלא/משולב/txt/באמצעות האפשרות נתונים | מן הטקסט/CSV. בחלון ‘ פתיחה ‘, לחץ על ערוך. הסר את כל העמודות פרט “רצף”, “ניסוי BR1”, “ניסוי BR2”, “ניסוי BR3”, “יחס H/L מנורמל BR1”, “יחס H/L מנורמל BR2” ו- “H/L יחס מנורמל BR3”. בחר את העמודות “יחס H/L מנורמל BR1”, “יחס H/L מנורמל BR2” ו- “H/L יחס מנורמל BR3” ולחץ על ‘ ‘ המרה ‘ | Unpivot עמודות. בחר את העמודות “ניסוי BR1”, “ניסוי BR2” ו- “ניסוי BR3” וחזור על הפעולה unpivot. בחר את העמודה הנוצרת “תכונה”, לפצל את התוכן באמצעות המרה | לפצל עמודה | על-ידי מפריד. בחר שטח המפריד בתפריט הנפתח. חזור על הפעולה עבור עמודה “Attribute.1”. להסיר את העמודות וכתוצאה מכך “Attribute.1.1”, “Attribute.2”, “Attribute.3” ו- “Attribute.1.1.1”. הוספת עמודה על-ידי שימוש של הוספת עמודה | עמודות מותאם אישית אפשרות. להתאים את הנוסחה עמודות מותאם אישית כדי לייצג את הדברים הבאים: “= [Attribute.4]=[Attribute.1.2]”. להחיל מסנן על העמודה מותאם אישית שנוצר לסנן את כל השורות המכילות “שקר”; קווים היחיד המכיל “אזעקת אמת” יישאר. להסיר את העמודות “Attribute.1.2” ו- “Custom” ולשנות את סדר העמודות הנותרים לגורמים הבאים: “Attribute.4”, “רצף”, “Value.1”, “ערך”. שנה את שמות העמודות כדי “ניסוי”, “פפטיד”, “PSMs” ו- “חשבים”, בהתאמה. לטעון את הקובץ באמצעות הבית | סגור & לטעון. שמור את הקובץ כקובץ המופרד באמצעות קובץ | שמירה בשם , בחר בסוג ‘טקסט (מופרד באמצעות טאבים) (*. txt)’. לשנות את השם ל “peptides_pogo.txt” ולשמור אותו בתיקייה c: / פוגו/נתונים. 2. מיפוי פפטידים עם שינויים Post-translational מוערת והדמיה לרבות כימות הערה: ניתן לטעון את קובץ הפלט המתקבל בכל דפדפן הגנום תמיכה בתבנית הדפדפן להרחבה נתונים (מיטה). מבחר של הדפדפנים היא את igv אינטגרטיבית הגנום דפדפן (ב)24 (אשר משמש במקורות הבאים), דפדפן הגנום UCSC25, דפדפן הגנום Ensembl20. חשוב לציין כי ביאור GTF וחלבון FASTA הגירסאות שנמצאות בשימוש למיפוי פוגו להתאים לגירסה של הגנום של הדפדפן הגנום. כדי להפוך את Ensembl האדם משחרר 57-75 GENCODE גירסאות 3d-19, להשתמש GRCh37/hg19; עבור גירסאות Ensembl 76 ומעלה ו GENCODE 20 ומעלה, להשתמש GRCh38/hg38. עבור גירסאות Ensembl העכבר 74 ומעלה ו- GENCODE M2 או גבוה יותר, להשתמש GRCm38. מפת פפטידים באמצעות PoGoGUI (ראה איור 3). נווט אל התיקיה הרצה. הפעלת התוכנית על-ידי לחיצה כפולה על סמל PoGoGUI-vX.X.X.jar.הערה: ממשק המשתמש הגרפי להתניע ולאפשר קלה וחזותית מבחר אפשרויות. השתמש בלחצן בחירת לצד ההפעלה”פוגו”. לאחר מכן, לנווט בתוך תיקיית קבצי הפעלה לתיקיית המשנה הרלוונטיים מערכות ההפעלה (לדוגמה, C:\PoGo\Executables\Windows\). בחר קובץ ההפעלה של פוגו (למשל, PoGo.exe), לאשר את הבחירה על ידי לחיצה על לחצן פתח . בחר קובץ הקלט הפניה עבור רצפי חלבונים על ידי לחיצה על בחר. נווט אל התיקיה נתונים, בחר את הקובץ FASTA תרגום. לאשר את הבחירה על ידי לחיצה על לחצן פתח . בחר את הקובץ ביאור התעתיק באמצעות הלחצן ‘ בחר ‘. נווט אל התיקיה נתונים, בחר את הקובץ GTF ביאור. לאשר את הבחירה על ידי לחיצה על לחצן פתח . להוסיף את הקובץ זיהוי פפטיד – בחירת קבצים מרובים מאופשרת — באמצעות לחצן הוסף ליד “פפטיד קבצים”. בחר קובץ בתבנית נתמכת mzTab, mzIdentML, או mzid, או בתבנית המופרד 4 עמודות הורדת והכינו בשלב 1.3. Untick את תיבות הסימון לצד המיטה GTF בבחירה תבניות הפלט. רק השאירו PTM המיטה ואת GCT בדק. בחר את המין המתאים עבור הנתונים מהרשימה הנפתחת. זה חיוני כי הקובץ FASTA, הקובץ GTF הבחירה הנפתחת הן עבור בני אותו מין. הפעל מיפוי על-ידי לחיצה על לחצן התחל .הערה: אם יש צורך, PoGoGUI להמיר קובץ הקלט לפורמט פוגו, מספקים פוגו הקבצים באותה תיקיה לנוחות בעתיד, להתחיל תהליך המיפוי. ההמרה של קובץ יחיד mzTab להוריד בשלב 1.3.1 יימשך בין 10-20 דקות לפני המיפוי מתחילה. להמחיש במציג גנומיקה אינטגרטיביתהערה: ראה איור 4. לטעון את קובץ הפלט פוגו המסתיימת ב- “_ptm.bed” ב- igv ב דרך קובץ | עומס מקובץ ובחר את הקובץ.הערה: עקב גודל, קבצים מסוימים עשויים לדרוש את הדור של אינדקס כדי לאפשר טעינה מהירה מחדש של האזורים גנומית. Igv ב יבקש את המשתמש באופן אוטומטי הדור. בצע את ההוראות שצוינו. חזור על השלב טעינה עבור הקובץ המסתיימת ב- “_noptm.bed”. קובץ זה מכיל כל פפטידים נמצאו ללא כל שינוי. שים לב כי כל קובץ טעון יוצגו כמו מסלולים נפרדים עם שם הקובץ בזיהוי המסלול. סידור מחדש של מסלולים על-ידי גרירתם ושחרורם למיקום הרצוי ברשימה. שימו לב כי כל מסלול מוצג בתחילה באופן מצומצם. כדי להרחיב אותם, לחץ לחיצה ימנית על שם מסלול ובחר המורחב לקבלת תצוגה מלאה של פפטידים כולל את רצפי או מחוצה עבור תצוגת מוערם. חזור על השלב טעינה עבור הקובץ המסתיימת ב- “.gct”. קובץ זה מכיל את כימות פפטיד לדגימה המבואר. בניגוד עבור הקבצים נטען לעיל, כל מדגם המבואר ייטען כמו מסלול נפרד. לארגן מחדש את הדגימות באמצעות גרור ושחרר פעולות. לנווט בתוך הגנום על ידי בחירת כרומוזום בתפריט הנפתח, הקלד בקואורדינטות גנומית, חפש את סמל הגן, או לחץ והחזק כדי לבחור קטע של כרומוזום להתקרבות. 3. מיפוי פפטידים מזוהה באמצעות מסד נתונים Variant מותאם אישית כדי הגנום הפניה הערה: פוגו מיפוי יכולות להתבצע באמצעות ממשק המשתמש הגרפי (GUI) או באמצעות ממשק שורת פקודה. . הם להחלפה. בחלק זה של הפרוטוקול, ממשק שורת פקודה משמש לסימון חליפות. החלק השני של סעיף זה פרוטוקול מחייב תוכנה כלי R26. נא ודא כי החבילה מותקנת. מפה של פפטידים הפניה הגנום הפניה. פתח שורת פקודה (. cmd) ונווט אל התיקיה הרצה של פוגו (למשל, C:\PoGo\Executables\). הקלד את הפקודה שלהלן:PoGo.exe – gtf \PATH\TO\GTF – fasta \PATH\TO\FASTA-ב \PATH\TO\IN-עיצוב המיטה-מינים MYSPECIES להחליף את \PATH\TO\GTF, \PATH\TO\FASTA ו- \PATH\TO\IN עם נתיבים ביאור GTF, חלבון רצף FASTA ופפטיד זיהוי קובץ (בפורמט 4 עמודות עם קובץ “.tsv” או “.pogo”) בהתאמה. גם תחליף MYSPECIES עם המין בקנה אחד עם הנתונים (למשל, אדם). לאשר את הביצוע על-ידי הקשה על מקש “Enter”. חכה עד הביצוע הסתיימה לפני מתקדם יותר בהמשך.הערה: פעולה זו עשויה להימשך מספר דקות. הקובץ שיתקבל יאוחסן באותה תיקיה שבה נמצא קובץ הקלט של פפטיד, תיחשב \PATH\TO\OUT.pogo.bed במקורות הבאים. לחלץ רק variant פפטידים קובץ הקלט. R ופתוחה עומס הקלט קובץ \PATH\TO\IN באמצעות הפקודה הבאה:inputdata <-read.table("PATH/TO/IN",header=TRUE,sep="\t") לטעון את פפטידים כבר ממופה באמצעות הפקודה:mappedpeptides <-read.table("PATH/TO/OUT.pogo.bed",sep="\t",header=FALSE) פפטידים כבר מופו להסיר inputdata:peptidesnotmapped <-inputdata [! ( inputdata$ פפטיד % mappedpeptides % $V4)] להדפיס את פפטידים שלא מופו לתוך קובץ הקלט חדש:write.table (peptidesnotmapped, “PATH\TO\IN.notmapped.pogo”, כותרת = FALSE, ספטמבר = “\t”, col.names=TRUE,row.names=FALSE,quote=FALSE) מפה של פפטידים הנותרים הגנום הפניה המאפשר אי התאמות. כמו צעד 3.1, פתח את שורת הפקודה, נווט אל התיקיה הרצה של פוגו. הקלד את הפקודה מטה ומאפשר התאמה חומצת אמינו 1 ולהחליף את \PATH\TO\GTF, \PATH\TO\FASTA ו- \PATH\TO\IN.notmapped.pogo עם נתיבים ביאור GTF, חלבון רצף FASTA ופפטיד זיהוי קובץ שנוצר בשלב 3.2. גם תחליף MYSPECIES עם המין בקנה אחד עם הנתונים (למשל, אדם). PoGo.exe – gtf \PATH\TO\GTF – fasta \PATH\TO\FASTA-ב \PATH\TO\IN-עיצוב המיטה-מינים MYSPECIES – מ מ 1 לאשר הביצוע של הפקודה על-ידי הקשה על מקש “Enter”. חכה עד הביצוע הסתיימה לפני מתקדם יותר בהמשך.הערה: פעולה זו עשויה להימשך מספר דקות. הקובץ שיתקבל יאוחסן באותה תיקיה שבה נמצא קובץ הקלט של פפטיד, תיחשב \PATH\TO\OUT.pogo_1MM.bed במקורות הבאים. דמיינו את פפטידים ממופה ללא ועם התאמה igv ב כפי שמתואר בשלב 2.2. 4. מיפוי באמצעות קבצים מרובים, יצירת מסלול רכזות עבור אלגוריתמית מיפוי פפטידים של קבצים מרובים באמצעות PoGoGUI נווט אל התיקיה הרצה, להפעיל את תוכנית GUI על-ידי הפעלת PoGoGUI-vX.X.X.jar. בחר קובץ ההפעלה פוגו עבור מערכת ההפעלה בשימוש (לינוקס כאן), כמו גם את הקובץ FASTA הפניה רצפי חלבונים קלט את הקובץ GTF ביאור כמתואר בצעדים פרוטוקול 2.1.2 – 2.1.4. הוסף את הקבצים זיהוי פפטיד באמצעות לחצן הוסף ליד “פפטיד Files”; בחירת קבצים מרובים זמין, כמו גם גרור-ושחרר לתוך השדה ריק מתחת “פפטיד קבצים”. Untick את תיבות הסימון לצד המיטה PTM, GTF ו- GCT במקטע תבניות פלט ולהשאיר רק את המיטה בדק. בחר את האפשרות למזג קבצי קלט מרובים לתוך פלט יחיד.הערה: התוצאה תהיה קובץ פלט יחיד המשלב פפטידים כל הקבצים קלט. להשאיר אפשרות זו לא מסומנת תגרום ביצוע רציפים של התוכנית עבור כל קובץ הקלט בנפרד. בחר את המין המתאים עבור הנתונים מהרשימה הנפתחת עקבית עם הקבצים FASTA ו GTF. הפעל מיפוי על-ידי לחיצה על לחצן התחל . במידת הצורך, התוכנית יהיה להמיר את קבצי קלט לפורמט פוגו. . זה עלול לקחת קצת זמן לביצוע. בינתיים, הורד את הכלים הדרושים של קבצי script עבור הדור רכזת מסלול. הכנת המסלול רכזת דור לפתוח דפדפן אינטרנט, נווט אל https://github.com/cschlaffner/TrackHubGenerator ולהוריד את הקובץ “TrackHubGenerator.pl”. שמור את הקובץ אל התיקייה הפעלה. בדפדפן האינטרנט, נווט אל www.hgdownload.soe.ucsc.edu/admin/exe/ ובחר את התיקיה עבור מערכת ההפעלה בשימוש (לינוקס כאן). הורידו את כלי bedToBigBed את התסריט fetchChromSizes לתוך תיקיית קבצי הפעלה27. יצירת רכזת מסלול של פפטידים ממופההערה: אחרי PoGoGUI סיים מיפוי של פפטידים, רכזת המסלול ניתן אוטומטית להפיק עבור כל הקבצים שנוצרים בתבנית מיטה מאוחסן באותה תיקיה. פתח חלון מסוף והקלד את הפקודה הבאה:Perl TrackHubGenerator.pl נתיב/ל/שם הרכבה FBED UCSC דוא תחליף שם/אל/נתיב עם נתיב קובץ ותנו שם עבור ה-hub מעקב אחר (למשל, ~/PoGo/Data/Mytrackhub), הרכבה עם מכלול הגנום שעליו הביאור הוא מבוסס (למשל, hg38 של האדם), FBED עם הנתיב התיקיה המכילה מיטה קבצים על אשר תהיה מבוססת ה-hub מעקב אחר (למשל, ~/PoGo/Data/), UCSC עם התיקיה בה מאוחסנים בכלים שהורדו מ- UCSC (למשל, ~/PoGo/Executables/), ודואר אלקטרוני עם כתובת דואר אלקטרוני עבור האדם האחראי על המסלול רכזת. לאשר את הביצוע על ידי הקשה על מקש “Enter”; ההוצאה להורג ייקח רק זמן קצר כדי לסיים. העברת מרכז המסלול שנוצר (קרי, ~/PoGo/Data/Mytrackhub/ את התיקיות שנוצר) עם כל התוכן שלה לשרת FTP אינטרנט נגישים.הערה: שרת FTP עם שרת האינטרנט המשויך המאפשר גישה לבסיס המסלול באמצעות פרוטוקול ftp ו- http היא המועדפת. ממאגרי github (github.com) figshare (figshare.com) תומך בסוג זה של גישה, ניתן להשתמש במקום לשרת FTP. רכזת מסלול בדפדפן הגנום UCSC להמחיש בדפדפן אינטרנט, נווט אל https://genome.ucsc.edu/ ובחר MyData | מעקב אחר רכזות. לחץ על הכרטיסיה רכזות שלי. להעתיק כתובת ה-URL לרכזת ה-המסלול בשדה הטקסט.הערה: כתובת ה-URL כוללת את כתובת השרת, המיקום רכזת מסלול שם, ואת הקובץ hub.txt (למשל, http://ngs.sanger.ac.uk/production/proteogenomics/WTSI_proteomics_PandeyKusterCutler_tissues_hi/hub.txt). לטעון את ה-hub המסלול על ידי לחיצה על הוספת רכזת.הערה: ה-hub ייטענו, תופיע הודעה קצרה, וקבע בפרטי הרכזת המסלול כגון שמו, פרטי איש הקשר של האדם האחראי על מרכז המסלול, המשמש מכלול הגנום. האתר יחזור לעמוד הראשי. בחר GenomeBrowser כדי להזין את תצוגת הדפדפן.הערה: ה-hub מסלול מותאם אישית יוצגו בחלק העליון של הרשימה. אם קבצים מרובים המיטה בנוי על בסיס ה-hub המסלול, כל הקבצים יהיה מיוצג מסלול נפרד בתוך ה-hub.

Representative Results

תיאור גרפי הדגשת שבו הוחל שלב של זרימת עבודה רגיל פרוטיאומיה מבנית פוגו18 , כמו גם אפשרויות במורד הזרם להדמיות מוצג באיור5. רובה פרוטאומיקס (קרי, העיכול הפרוטאוליטי של חלבונים ואחריו כרומטוגרפיה נוזלית בשילוב עם טנדם ספקטרומטר מסה) היא צעד אחד precursory של מיפוי proteogenomic. ספקטרום המוני טנדם וכתוצאה מכך הם בדרך כלל לעומת ספקטרה תיאורטי נגזר חלבון רצף מסדי נתונים. מחקרים Proteogenomics להציג תרגום רצפים של הפרוטוקולים הרומן עם קידוד גרסאות הפוטנציאלי ואת שם נרדף נוקלאוטיד יחיד (SNVs) לתוך מסד הנתונים, מקשה להתייחס בקלות אלה בחזרה הגנום של הפניה8. ממשק המשתמש הגרפי של פוגו (PoGoGUI) תומך בתבניות קובץ לדיווח מתוקננת של פפטיד ההזדהויות של ניסויים ספקטרומטר מסה וממיר אותם לפורמט פוגו 4 עמודות פשוטה. PoGoGUI עוטפת את כלי שורת הפקודה פוגו, ובכך מאפשר את המיפוי של פפטידים על גבי הגנום קואורדינטות ניצול הביאור הפניה של חלבונים גנים בדרך כלל לספק את GTF או את רצפי מתורגם התעתיק בתבנית FASTA. תבניות פלט שונים הנוצרים על-ידי פוגו כדי לאפשר את החזיית היבטים שונים של פפטידים מזוהה באמצעות ספקטרומטר מסה, לרבות שינויים post-translational, פפטיד כימות ברמה. קבצי פלט במיטה יכול עוד להיות המרה ושולבו מדריכים מקוונים נגיש שנקרא מסלול רכזות. קבצי פלט יחיד, וכן מעקב אחר רכזות, ואז ניתן לאבחן בדפדפנים כגון דפדפן הגנום UCSC25, דפדפן הגנום Ensembl20, igv ב24, ו Biodalliance28 (ראה איור 5 למטה). אנחנו שהוחל פוגו בצמחייה הטיוטה פרוטאום האנושי מפות מסונן-חשיבות גבוהה כפי שמתואר רייט. et al. 7 לעומת זאת שני כלים אחרים עבור מיפוי proteogenomic, כלומר iPiG14 ו- PGx10. ערכת הנתונים מורכבת פפטידים ייחודי 233,055 על פני 59 רקמות למבוגרים ו עוברית וכתוצאה מכך סכום כולל של מעל 3 מיליון רצפים. פוגו ביצועים טובים יותר-כלים אלה שני ב זמן ריצה (6.9 x ו- x 96.4 מהר יותר, בהתאמה) ואת השימוש בזיכרון (20% ל 60% פחות זיכרון, בהתאמה) כפי שמוצג באיור 6-18. דוגמה של פפטיד בהצלחה ממופה מוצג איור7. בעוד פוגו ביצועים טובים משמעותית יותר כלים אחרים בזיכרון ומהירות, גם הוא מסוגל של שינויים post-translational מיפוי ומידע כמותי המשויך פפטידים על גבי הגנום. 8A איור סכמטי מתארת את הפריט החזותי של הפורמט מיטה בדפדפן הגנום עבור פפטידים מיפוי כדי אקסון אחד ועל -פני אחוי צמתי. פוגו מנצל את האפשרות צביעה לספק עזר חזותי קל ביחס הייחודיות של המיפוי פפטיד בתוך הגנום. מיפויי באדום מציינים יחודיות תעתיק יחיד, תוך הבהרה שחור מיפוי גן יחיד. עם זאת, פפטיד משותף בין תעתיקים שונים. מיפויי אפור להראות פפטיד משותף בין גנים מרובים. אלה הם, לדוגמה, פחות אמין עבור כימות של הגן או לא ראוי לאמון לקרוא את הביטוי של גנים. אפשרות לינה PTM פוגו מגדירה מחדש את קוד צבע כדי להכיל סוגים שונים של שינויים post-translational, כפי שמוצג איור 8 ב’. בנוסף, PTMs מסומנים באמצעות בלוקים עבה (ראה איור 8 ב’). PTM יחיד מסוג מודגשת על ידי גוש עבה במיקום של השאריות ששונה חומצת אמינו, בעוד PTMs מרובים מאותו סוג הם חוצים בלוק בעובי של חומצת אמינו ששונה ביותר הראשון האחרון. אנחנו להחיל פוגו ובעקבות כך TrackHubGenerator על dataset של 50 שורות תאים של סרטן המעי הגס, כולל כל פרוטאום phosphoproteome29. בעוד ה-hub המסלול נטען בדפדפן הגנום UCSC מראה של פפטידים למפות את הגנום מדגיש את הייחודיות של המיפויים והאתרים זרחון (ראה איור 9), נתונים נוספים ניתנים בתיקיה משלימה. הקבצים GCT ואחר כך תפעיל את החזיית כימות פפטיד, phosphopeptide בהקשר גנומית. עם זאת, קבצים GCT אינם מספקים ויזואליזציה קל של פפטידים פורש על פני צמתים אחוי (ראה איור 10 למעלה). פפטידים מעבר splice צמתי שמוזגו מופרדים החלקים המתאימים שלהם מיפוי exons. אמנם זה ניתן לזהות פפטידים splice דרך אותם ערכים כמותיים של מיפויי אקסון, טעינת מבוססי רצף מיפוי קבצים כגון מיטה או GTF המחברים את exons על ידי אינטרון דק פורש קו תמיכה הפרשנות (ראה איור 10 למטה). כדי להבליט את התועלת של variant מופעלת מיפוי, והגשנו בקשה פוגו בשתי תצורות הנתונים (dataset) של פרוטאום testis האדם חיפשו נגד neXtProt לצוד חסרים חלבונים באמצעות אסטרטגיה מרובה אנזים22. NeXtProt כוללת מלבד התייחסות חלבון רצפים משתנים של חומצה אמינית בודדת מעל 5 מיליון30. מיפוי פפטידים מזוהה עם וריאציה חומצה אמינית בודדת אינו נתמך על-ידי כלי מיפוי אחרים. סך של פפטידים ייחודי 177,012 זוהו. אלה, פפטידים 99.8% (176,694) הראשון בהצלחה מופו מבלי לאפשר אי התאמות. הסרת אלו מהרשימה פפטיד מזוהה הביא פפטידים 0.2% (318) שהיו לאחר מכן ממופה המאפשר החלפת חומצת אמינו אחת. כתוצאה מכך 3,446 מיפויים של פפטידים 162 לא מופו כדי הגנום הפניה עם כל כלי זמין אחר. בעוד המספר הממוצע של מיפויי כולל אי-התאמה הוא גבוה, פפטידים 62 מופו רק לוקוס בודד, המציין רצפים חלופה אמיתית. דוגמה של פפטיד ממופה עם חומצה אמינית בודדת החלפה מודגש עם רצף שלו, את רצף גנומית מתורגם באיור11. איור 1. השוואה חזותית של כלים שונים מיפוי פפטיד-כדי-הגנום. ההשוואה מוצגת לגבי היבטים שונים. היבטים אלה כוללים הפניה מיפוי, הרמה של השתלבות במסגרות התמיכה של דפדפנים מקוון ולא מקוון. בנוסף, היבטים חדשניים של proteogenomics ועל תמיכתם תכונה מודגשת בנפרד. פוגו רק חסרה את היכולת למפות ישירות רצף הגנום לעומת כלים אחרים. עם זאת, הוא תומך כל התכונות רומן רוב הכלים שאינם תומכים. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת. באיור 2. דוגמה קובץ הקלט עבור מיפוי פפטידים. פוגו מקבל קלט נתונים בתבנית הפרדת תווי טאב עם 4 עמודות. כותרות עמודות בשורה הראשונה הן ‘ניסוי’ ‘פפטיד’, ‘PSMs’, “חשבים”, המציינת בשורות הבאות הניסוי או מדגם המזהה את רצף פפטיד, מספר התאמות ספקטרום פפטיד, ערך כמותי פפטיד, בהתאמה. סיומות שמות הקבצים הנתמכים הם *. txt, *.tsv ו- *.pogo. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת. איור 3. PoGoGUI ממשק עם השלבים המסומנים עבור קובץ בחירות ואפשרויות פרמטר. האיור מציג את השלבים לבחירה ולהעברה של העלאת הקבצים הנדרשים הכל, המבחר של אפשרויות עבור מיפוי פפטידים עם שינויים post-translational על גבי הגנום האנושי הפניה. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת. באיור 4. הליך להעלות צילום מסך של הנתונים מציג גנומיקה אינטגרטיבית (igv ב). הדמות מדגיש את השלבים עבור העלאת קבצי פלט פוגו בדפדפן igv. יתר על כן, היא מציגה את האפשרות של הרחבת המסלול של פפטידים ממופה כדי להדגיש את המיפוי ואת רצף. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת. איור 5. פשוטה זרימת העבודה של צעדים מ LC-MS/MS ויזואליזציה בדפדפנים הגנום. מיפוי פוגו בעקבות הזיהוי של פפטידים ספקטרה המוני טנדם. כדי להשיג את מיפוי הגנום, פוגו מנצל ביאור הפניה סיפק הגנום ביאור (GTF), תעתיק תרגום רצפי (FASTA). פלט שונה תבניות נוצרים, ניתן לטעון בנפרד בדפדפנים הגנום. בנוסף, ניתן לשלב קבצים בפורמט מיטה לרכזות מסלול תמיכה ויזואליזציה של נתונים (datasets) בקנה מידה גדול. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת. איור 6. תפעול פוגו נגד PGx, iPiG. פוגו outperforms כלי אחר תפעול. מיפוי פפטידים ייחודי 233,055 על פני 59 רקמות למבוגרים ו עוברית וכתוצאה מכך רצפים של מעל 3 מיליון, פוגו היה 6.9 x ו- x 96.4 מהיר יותר PGx ו- iPiG, בהתאמה. יתר על כן, נדרש פוגו 20% ל 60% פחות זיכרון לעומת PGx ו- iPiG, בהתאמה. בעוד פוגו, PGx הסתיימה בהצלחה, iPiG הביא שגיאת זיכרון 16 ג’יגה-בתים. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת. איור 7. תצוגה לדוגמה דפדפן UCSC הגנום של פפטידים ממופה. האיור מציג פפטידים למפות את mTOR ג’ין. בעוד המסלול המשולב מראה של פפטידים פורש על פני splice צמתי ומיפוי רק כדי אקסון אחד עם הרצפים משויך, המסילה רקמות ספציפיות להדגיש רק את המיפוי בפורמט דחוס. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת. איור 8. סכמטי של מיפוי חזותי וקודי צבע. (א) בקובץ הפלט מיטה רגילה, פפטידים מיפוי אקסון מוצגים בלוקים יחיד (משמאל), ואילו פפטידים מיפוי ברחבי האר exons מרובים של אקסון מכסות את החלקים כאבני (מימין). אינטרונים מופיעים רזה שרשור שורות. פוגו מקודד בצבע הייחודיות של מיפוי או פפטידים גנים ולאחר תעתיקים באמצעות מערכת מ- 3 רמות. (B) בנוסף למבנה בלוק של התבנית מיטה, מיטה PTM פלט מדגיש את המיקום של שינויים post-translational כאבני עבה. נוכחות PTM יחיד מסוג מדגיש את שאריות חומצה אמינית שהשתנתה עם בלוק עבה, בעוד אתרים מרובים של PTM זהה משולבים בלוקים ארוכים פורש מהרגע הראשון ועד לאחרון השינוי באתר. פפטיד מיפויים מחולקים נוסף מאת PTM סוג וצבע codec בהתבסס על השינוי. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת. איור 9. מעקב אחר רכזת תצוגה בדפדפן הגנום UCSC של סרטן המעי הגס פרוטאום ונתונים phosphoproteome. ה-hub המסלול כוללת פרוטאום כל הנתונים, כמו גם phosphoproteome. בעוד צבע אדום על הפסים פרוטאום ו- phosphoproteome לציין את הייחודיות של המיפוי התעתיק יחיד של SFN, רצועות המסתיימת ב- _ptm להראות את אתרי זירחון תוך פפטידים. כאן, צבע אדום מציין סוג השינוי כפי זירחון. רק שני פפטידים זוהו עם כל מראה של זרחון יחיד (קוביות עבות). אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת. איור 10. נוף של סרטן המעי הגס phosphopeptides, כימות המשויך ב igv ב. האיור מציג תת-ערכה של שורות תאים סרטן 50. זה יתר על כן מציג ארבעה טורים של בלוקים שונים גוונים של אור אדום. הצבע מציין את השפע היחסי של נמוך (לבן) גבוהה (אדום). בעוד ארבע העמודות עלול להוביל בתחילה מאמינים כי ישנם פפטידים 4, מתברר עם המשויך המבוססת על רצף GTF בקובץ הפלט שאלו למעשה שני פפטידים, כל המתפרסות על-פני צומת אחוי. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת. איור 11. תצוגה של פפטיד עם חומצה אמינית משתנה ב igv ב. האיור מציג פפטיד בווריאציה חומצה אמינית בודדת למפות את הגנום ההפניה בתחילת התרגום של הגן GPSM1. Variant ממוקם בבית שאריות חומצה אמינית 8 ותוצאות ההחלפה של אלנין כדי ולין (A→V). רצפי תרגום של התרשימים המבואר (כחול) להדגיש את הווריאציה בהשוואה הרצף פפטיד. אנא לחץ כאן כדי להציג גירסה גדולה יותר של הדמות הזאת.

Discussion

פרוטוקול זה מתאר איך הכלי תוכנות פוגו וממשק משתמש גרפי שלו PoGoGUI מאפשרים מיפוי מהיר של פפטידים על גבי הגנום קואורדינטות. הכלי מציע תכונות ייחודיות כגון שינוי כמותי, post-translational, התומכים ב- variant מיפוי הגנום באמצעות הפניה ביאור. מאמר זה מדגים את השיטה על מחקר proteogenomic בקנה מידה גדול, מדגיש את יעילותו זיכרון ומהירות לעומת אחרים בכלים הזמינים18. בשילוב עם הכלי TrackHubGenerator, אשר יוצר רכזות נגיש באינטרנט של גנומית ומקושרים הגנום נתונים, פוגו, עם ממשק משתמש גרפי שלו, מאפשר לימודים proteogenomics בקנה מידה גדול במהירות להמחיש את הנתונים שלהם בהקשר גנומית. יתר על כן, נדגים את המאפיינים הייחודיים של פוגו עם datasets חיפוש מול מסדי נתונים variant ל-22,phosphoproteomics כמותיים29.

קבצים בודדים, כגון קובץ GCT, מספקים ויזואליזציה ערך וקישורים בין פפטיד תכונות לוקוסים גנומית. עם זאת, חשוב לציין כי פרשנות המבוססת על אלה לבד יכול להיות קשה או מטעה עקב הגבלה שלהם להיבטים יחיד של proteogenomics כגון הייחודיות, שינויים post-translational ערכים כמותיים. לכן, חשוב לבחור בקפידה את קבצי פלט, האפשרויות והשילובים אשר מתאימות השאלה proteogenomic בהישג יד ולשנות את השילובים. לדוגמה, מידע על ייחודה של המיפוי לוקוס גנומית ספציפי יכול להיות בעל ערך רב עבור הביאור של תכונה גנומית7, תוך כימות מדגמים שונים יכול להיות מתאים יותר עבור מחקרים הנוגעים תכונות גנומית לשינויים חלבון שפע29. הפלט אמור להיווצר על-ידי פוגו עבור כל הגדרה. במקרה אין פלט נוצר, או קבצים ריקים מוצגים בו תיקיית הפלט, מומלץ לבדוק את קבצי קלט עבור התוכן הרצוי ותבנית הקובץ הדרוש. במקרים שבהם תבנית הקובץ או את התוכן תבצע את הציפיות של פוגו (למשל, הקובץ FASTA כביכול המכיל את רצפי תרגום התמליל מכיל את רצפי של התרשימים), הודעות שגיאה יבקש מהמשתמש בדוק את קבצי קלט.

ההגבלות של הפרוטוקול והכלי מתבססים בעיקר על שימוש חוזר של תבניות קובץ נפוץ גנומיקה. שינוי פורמטים גנומיקה ליישומים proteogenomic מלווה מגבלות מסוימות. אלה נובעים ערכות שונות של דרישות הגנום ממורכז ויזואליזציה של גנומית proteogenomic נתונים, כגון הצורך לדמיין post-translational שינויים מהנתונים פרוטאומיקס. זה הוא מוגבל בתבניות קבצים גנומיקה על-ידי שימוש תכונה אחת. גישות וכלים רבים פותחו עבור פרוטאומיקס למקם בביטחון post-translational שינויים בתוך פפטיד רצפים31,32,33,34. עם זאת, הפריט החזותי של שינויים מרובים באופן ייחודי ניכרת על הגנום מתעכבת על ידי המבנה של תבניות קובץ גנומית. לכן, הפריט החזותי מגוש אחד של PTMs מרובים מאותו סוג אינו מהווה כל המשמעיות של האתרים שינוי אך הוא התוצאה של הדרישה שונות מהקהילה גנומיקה רק לדמיין תכונות בודד בכל פעם. למרות זאת, פוגו יש את היתרון של מיפוי שינויים post-translational על גבי קואורדינטות גנומית כדי לאפשר מחקרים התמקדו השפעת תכונות גנומית כגון גרסאות נוקלאוטיד יחיד על שינויים post-translational. מיפוי variant באמצעות פוגו, מגדילה את מספר הכולל מיפויים. אולם, קידוד צבע ייחודי של פפטידים ממופה מדגיש מיפויים אמין מכל אלה לא אמין. המיפוי של פפטידים variant מזוהה ממשתני ידוע נוקלאוטיד יחיד יכול להיות מלווה להמחיש את פפטידים ממופה לצד גרסאות בתבנית VCF. בדרך זו קוד צבע המציין של מיפוי לא אמין של פפטיד variant נדחית על ידי הנוכחות של variant נוקלאוטיד ידוע.

שלב קריטי עבור השימוש פוגו הוא השימוש של הקבצים הנכונים ותבניות. השימוש של רצפי התעתיק מתורגמים כמו חלבון רצפים ללוות את הביאור בתבנית GTF הוא הקריטריון העיקרי. עוד אלמנט קריטי כאשר שוקלים שימוש פוגו למפות פפטידים עם חומצת אמינו אי-התאמות הוא זיכרון. בעוד זיכרון-יעילה במיוחד עבור יישום תקן, באופן משמעותי, אקספוננציאלית הגדלת מספר מיפויים אפשרי עם אחד או שניים אי-התאמות מוביל עלייה אקספוננציאלית דומה זיכרון השימוש18. אנו מציעים בשלבים מיפוי כפי שמתואר פרוטוקול זה קודם למפות את פפטידים ללא אי-התאמות ולהסיר אותם מן הסט. פפטידים בעבר שלא מופו עוקבות אז הניתנות למיפוי באמצעות התאמה אחת, ניתן לחזור על התהליך עם שני אי התאמות עבור פפטידים הנותרים שאינם ממופים.

מאז גדל באופן משמעותי התפוקה של ספקטרומטר מסה התממשקות גנומית מחקרים ונתונים פרוטיאומיה מבנית נעשים תכופים יותר בשנים האחרונות, כלים ברצון לאפשר התממשקות סוגים אלה של הנתונים באותה מערכת קואורדינטות נמצאים יותר ויותר הכרחי. הכלי המובאת כאן יסייעו את הצורך לשלב גנומית והנתונים פרוטיאומיה מבנית לשיפור הבנה טובה יותר של לימודים אינטגרטיבית מעבר datasets קטנים וגדולים על-ידי מיפוי פפטידים על גבי לביאור הפניה. . Encouragingly, פוגו הוחל למיפוי פפטידים מועמדים הגן הניתנים באותה התבנית כמו הביאור אסמכתא לתמיכה ביאור המאמצים של הרומן גנים ביטוי אנושי testis35. הגישה המוצגת כאן היא עצמאית של מסדי נתונים המשמש לזיהוי פפטיד. הפרוטוקול שעשויים לסייע בזיהוי, ויזואליזציה של תרגום הרומן מוצרים באמצעות הותאם שקבצי קלט מן תרגום רצפי ומקושרת GTF קבצים מ- RNA-seq ניסויים.

מספר גישות וכלים עם מגוון רחב של תרחישים יישום מיוחד כדי למפות פפטידים קואורדינטות גנומית, החל מיפוי פפטידים ישירות על רצף הגנום ל RNA-רצף מונחית מיפוי, כבר הציג10, 11 , 12 , 13 , 14 , 15 , 16 , 17. עם זאת, אלה עלולים לגרום כשל למפות כהלכה פפטידים כאשר שינויים post-translational קיימות שגיאות המיפוי כבסיס הקריאות רצפי RNA עשוי להיות מופצות לשלב פפטיד. פוגו פותחה במיוחד להתגבר על המכשולים הללו, כדי להתמודד עם העלייה המהירה של datasets כמותיים פרוטיאומיה מבנית ברזולוציה גבוהה להשתלב עם פלטפורמות גנומיקה אורתוגונלית. הכלי המתוארים כאן ניתן לשלב זרימות עבודה תפוקה גבוהה. באמצעות ממשק גרפי PoGoGUI, הכלי הוא פשוט לשימוש ואינה מצריכה כל הכשרה ביואינפורמטיקה מומחה.

Offenlegungen

The authors have nothing to disclose.

Acknowledgements

עבודה זו מומן על ידי טרסט (WT098051) ואת המענק NIH (U41HG007234) לפרויקט GENCODE.

Materials

PoGo (software) NA NA https://github.com/cschlaffner/PoGo
PoGoGUI (software) NA NA https://github.com/cschlaffner/PoGoGUI
TrackHubGenerator (software) NA NA https://github.com/cschlaffner/TrackHubGenerator
Integrative Genomics Viewer (software) NA NA http://software.broadinstitute.org/software/igv/
UCSC genome browser (website) NA NA https://genome.ucsc.edu/
GENCODE (website) NA NA http://gencodegenes.org
Ensembl (website) NA NA http://ensembl.org
bedToBigBed (software) NA NA http://hgdownload.soe.ucsc.edu/admin/exe/
fetchChromSizes.sh (software) NA NA http://hgdownload.soe.ucsc.edu/admin/exe/

Referenzen

  1. Aebersold, R., Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature. 537 (7620), 347-355 (2016).
  2. Mertins, P., et al. Proteogenomics connects somatic mutations to signalling in breast cancer. Nature. 534 (7605), 55-62 (2016).
  3. Zhang, H., et al. Integrated proteogenomic characterization of human high-grade serous ovarian cancer. Cell. 166 (3), 755-765 (2016).
  4. Jaffe, J. D., Berg, H. C., Church, G. M. Proteogenomic mapping as a complementary method to perform genome annotation. Proteomics. 4 (1), 59-77 (2004).
  5. Wilhelm, M., et al. Mass-spectrometry-based draft of the human proteome. Nature. 509 (7502), 582-587 (2014).
  6. Kim, M. S., et al. A draft map of the human proteome. Nature. 509 (7502), 575-581 (2014).
  7. Wright, J. C., et al. Improving GENCODE reference gene annotation using a high-stringency proteogenomics workflow. Nature Communications. 7, 11778 (2016).
  8. Nesvizhskii, A. I. Proteogenomics: concepts, applications and computational strategies. Nature Methods. 11 (11), 1114-1125 (2014).
  9. Armengaud, J., et al. Non-model organisms, a species endangered by proteogenomics. Journal of Proteomics. 105, 5-18 (2014).
  10. Askenazi, M., Ruggles, K. V., Fenyo, D. PGx: putting peptides to BED. Journal of Proteome Research. 15 (3), 795-799 (2016).
  11. Choi, S., Kim, H., Paek, E. ACTG: novel peptide mapping onto gene models. Bioinformatics. 33 (8), 1218-1220 (2017).
  12. Ghali, F., et al. ProteoAnnotator-open source proteogenomics annotation software supporting PSI standards. Proteomics. 14 (23-24), 2731-2741 (2014).
  13. Has, C., Lashin, S. A., Kochetov, A. V., Allmer, J. PGMiner reloaded, fully automated proteogenomic annotation tool linking genomes to proteomes. Journal of Integrative Bioinformatics. 13 (4), 293 (2016).
  14. Kuhring, M., Renard, B. Y. iPiG: integrating peptide spectrum matches into genome browser visualizations. PLoS One. 7 (12), e50246 (2012).
  15. Pang, C. N., et al. Tools to covisualize and coanalyze proteomic data with genomes and transcriptomes: validation of genes and alternative mRNA splicing. Journal of Proteome Research. 13 (1), 84-98 (2014).
  16. Sanders, W. S., et al. The proteogenomic mapping tool. BMC Bioinformatics. 12 (115), (2011).
  17. Wang, X., et al. ProBAMsuite, a bioinformatics framework for genome-based representation and analysis of proteomics data. Molecular & Cellular Proteomics. 15 (3), 1164-1175 (2016).
  18. Schlaffner, C. N., Pirklbauer, G. J., Bender, A., Choudhary, J. S. Fast, quantitative and variant enabled mapping of peptides to genomes. Cell Systems. 5 (2), 152-156 (2017).
  19. Vizcaino, J. A., et al. The PRoteomics IDEntifications (PRIDE) database and associated tools: status in 2013. Nucleic Acids Research. 41, D1063-D1069 (2013).
  20. Aken, B. L., et al. Ensembl 2017. Nucleic Acids Research. 45 (D1), D635-D642 (2017).
  21. Perez-Riverol, Y., et al. Ms-data-core-api: an open-source, metadata-oriented library for computational proteomics. Bioinformatics. 31 (17), 2903-2905 (2015).
  22. Wang, Y., et al. Multi-protease strategy identifies three PE2 missing proteins in human testis tissue. Journal of Proteome Research. , (2017).
  23. Greseth, M. D., Carter, D. C., Terhune, S. S., Traktman, P. Proteomic screen for cellular targets of the vaccinia virus F10 protein kinase reveals that phosphorylation of mDia regulates stress fiber formation. Molecular & Cellular Proteomics. 16 (4 Suppl 1), S124-S143 (2017).
  24. Thorvaldsdottir, H., Robinson, J. T., Mesirov, J. P. Integrative genomics viewer (IGV): high-performance genomics data visualization and exploration. Briefings in Bioinformatics. 14 (2), 178-192 (2013).
  25. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  26. The R Development Core Team. . R: A Language and Environment for Statistical Computing. , (2008).
  27. Kent, W. J., Zweig, A. S., Barber, G., Hinrichs, A. S., Karolchik, D. BigWig and BigBed: enabling browsing of large distributed datasets. Bioinformatics. 26 (17), 2204-2207 (2010).
  28. Down, T. A., Piipari, M., Hubbard, T. J. Dalliance: interactive genome viewing on the web. Bioinformatics. 27 (6), 889-890 (2011).
  29. Roumeliotis, T. I., et al. Genomic determinants of protein abundance variation in colorectal cancer cells. Cell Reports. 20 (9), 2201-2214 (2017).
  30. Gaudet, P., et al. The neXtProt knowledgebase on human proteins: 2017 update. Nucleic Acids Research. 45, D177-D182 (2017).
  31. Fermin, D., Walmsley, S. J., Gingras, A. C., Choi, H., Nesvizhskii, A. I. LuciPHOr: algorithm for phosphorylation site localization with false localization rate estimation using modified target-decoy approach. Molecular & Cellular Proteomics. 12 (11), 3409-3419 (2013).
  32. Fermin, D., Avtonomov, D., Choi, H., Nesvizhskii, A. I. LuciPHOr2: site localization of generic post-translational modifications from tandem mass spectrometry data. Bioinformatics. 31 (7), 1141-1143 (2015).
  33. Hansen, T. A., Sylvester, M., Jensen, O. N., Kjeldsen, F. Automated and high confidence protein phosphorylation site localization using complementary collision-activated dissociation and electron transfer dissociation tandem mass spectrometry. Analytical Chemistry. 84 (22), 9694-9699 (2012).
  34. Taus, T., et al. Universal and confident phosphorylation site localization using phosphoRS. Journal of Proteome Research. 10 (12), 5354-5362 (2011).
  35. Weisser, H., Wright, J. C., Mudge, J. M., Gutenbrunner, P., Choudhary, J. S. Flexible data analysis pipeline for high-confidence proteogenomics. Journal of Proteome Research. 15 (12), 4686-4695 (2016).

Play Video

Diesen Artikel zitieren
Schlaffner, C. N., Pirklbauer, G. J., Bender, A., Steen, J. A., Choudhary, J. S. A Fast and Quantitative Method for Post-translational Modification and Variant Enabled Mapping of Peptides to Genomes. J. Vis. Exp. (135), e57633, doi:10.3791/57633 (2018).

View Video