Summary

ניתוח ביטוי גנים הגידול גורמים עם פורטל האינטרנט של CorExplorer

Published: October 11, 2019
doi:

Summary

אנו מציגים את פורטל האינטרנט של CorExplorer, משאב לחקר הגידול של גורמים ברצף RNA שנמצאו על ידי אלגוריתם למידה מחשב Corexplorer (הסבר מתאם), ולהראות כיצד ניתן לנתח את הגורמים ביחס להישרדות, מסד נתונים ביאורים, האינטראקציות חלבון חלבון, ואחד את השני כדי לקבל תובנה בביולוגיה הגידול והתערבויות טיפוליות.

Abstract

אנליזה של ביטוי גנים דיפרנציאלי היא טכניקה חשובה להבנת מצבי מחלות. אלגוריתם למידה מחשב CorEx הראה את השירות בניתוח ביטוי דיפרנציאלי של קבוצות של גנים בגידול RNA-seq באופן שעשוי להועיל לקידום אונקולוגיה דיוק. עם זאת, CorEx מייצרת גורמים רבים שיכולים להיות מאתגרת לנתח ולהתחבר להבנה הקיימת. כדי להקל על הקשרים האלה, בנינו אתר אינטרנט, CorExplorer, המאפשר למשתמשים לחקור באופן אינטראקטיבי את הנתונים ולענות על שאלות נפוצות הקשורות לאנליזה שלו. התאמנו CorEx על RNA-seq ביטוי גנים נתונים עבור ארבעה סוגי גידולים: השחלות, ריאות, מלנומה, ו המעי הגס. לאחר מכן שולבו הישרדות המקביל, חלבון חלבונים אינטראקציות, ג’ין אונטולוגיה (GO) ו קיוטו האנציקלופדיה של גנים Genomes (KEGG) המסלול enrichments, ו מפות החום לתוך אתר האינטרנט עבור שיוך עם הדמיית הגרף גורם. כאן אנו מעסיקים פרוטוקולים לדוגמה כדי להמחיש את השימוש במסד הנתונים לצורך ההבנה של משמעות גורמי הגידול הנלמדים בהקשר של נתונים חיצוניים אלה.

Introduction

מאז המבוא שלה רק לפני כעשור, RNA-seq הפך לכלי בכל מקום למדידת ביטוי גנטי1. זה משום שהוא מאפשר פרופיל דה נובו מהיר וזול של ההמרה כולה של דגימה. עם זאת, הנתונים הסרטניים RNA-seq משקף את הביולוגיה הבסיסית כי הוא מורכב מיסודה ולעתים קרובות תחת שנדגמו, בעוד הנתונים עצמם הוא גבוה מימדי רועש. זה מציג אתגר משמעותי עבור חילוץ אותות אמינים. האלגוריתם corex ממנף מידע הדדי מרובה כדי למצוא דפוסים עדינים במצבים כאלה2,3 . טכניקה זו הותאמה בעבר לניתוח השחלות גידול RNA-seq דגימות של סרטן הגנום אטלס (TCGA) ובהקשר זה נראה כי יש יתרונות משמעותיים על שיטות ניתוח נפוץ יותר4.

למרות שהשימוש ב-RNA-seq נפוץ מאוד ביישומי מחקר, כולל באונקולוגיה, מאמצים אלה לא הובילו לניצול רחב למטרות של התערבויות קליניות5. חלק מהסיבה לכך הוא חוסר באלגוריתמים ותוכנות ידידותיים למשתמש המיועדים לבעיות ספציפיות אלה. כדי לסייע בגישור פער זה, עיצבנו את פורטל האינטרנט של CorExplorer כדי לאפשר לחוקרים מתוך מגוון רקעים לחקור גורמי ביטוי גנים של הגידול RNA-seq דגימות כפי שנמצא על ידי אלגוריתם למידה מכונת Corexplorer. פורטל קוראקספלורר תומך בהדמיה אינטראקטיבית ובביצוע שאילתות על גורמים ממספר סוגי גידולים שונים כולל ריאה, נקודתיים, מלנומה והשחלות6,7,8,9, 10, עם כוונה לסייע לחוקרים לנפות באמצעות הנתונים תאמים ולזהות מסלולים המועמדים לחולים stratify למטרות טיפוליות.

אנו מצפים שפורטל CorExplorer יהיה שימושי למספר סוגים של משתמשים. הפורטל תוכנן עם המשתמש בראש מי רוצה להבין את הגורמים הרחבים נהיגה מוסרית גנים ביטוי הבדלים במסדי נתונים ציבוריים ואולי גם מקום פרופילים ביטוי גנים בודדים בהקשר של גידולים עם דומה מאפייני. בנוסף לפרוטוקולים הנציגים המפורטים כאן, חקירות CorExplorer עשויים לשמש נקודת התחלה להציע השערות לבדיקות נוספות, להשוות ולניגודיות ממצאים Corexplorer על מערכות נתונים מחוץ ל-CorExplorer, ולהתחבר ביטוי פתולוגי חתימות של אחד או כמה גנים בגידול בודד לקבוצות גדולות יותר שעלולות להיות coordinately מושפעות. לבסוף, זה יכול לשמש כמבוא ידידותי למשתמש ליישום של למידה מחשב ל-RNA-seq עבור אלה שהתחילו בתחום.

Protocol

1. חקר גורמים המכילים גן מעניין פתח דפדפן אינטרנט ועבור אל http://corex.isi.edu, דף הבית של CorExplorer. בצד ימין תחת קישורים מהירים, לחץ על כפתור + הרחב ליד השחלות (tcga-OV) כדי לראות תקציר של הגרף גורם corex כי היה מאומן על הנתונים סרטן השחלות tcga (מוצג באיור 1). לחלופין, לחץ על אחרים כדי להשוות. לאחר סיום בדיקת תרשימי הגורם, לחץ עלריאה (TGA-LUAD)כדי לגשת לעמוד CorExplorer עבור סרטן ריאות RNA-seq.לחקור את הגרף גורם CorEx עבור גן של עניין באמצעות החלון ‘ מקדם גרף של Corex ‘. הזז את סמן העכבר מעל חלון התצוגה של גרף הפקטור. התקרבות לגרף הפקטור באמצעות גלגל הגלילה של העכבר או משטח העקיבה כדי לראות פרטים של הגרף כגון הגנים החשובים ביותר בכל גורם והחיבורים בין צמתים בשכבות שונות. לחילופין, לחץ וגרור כדי להזיז את אזור התצוגה או צומת כלשהו. כדי למצוא גן יעד (כאן אנחנו נשתמש BRCA1), לחץ על התפריט הנפתח הגן בחלק העליון של החלון מקדם גרף. Type ‘ BRCA1 ‘ כדי לבחור אותו ברשימה הנפתחת ולאחר מכן הקש Return כדי להפוך את התצוגה זום לגורם 26, הפקטור שבו BRCA1 הוא בקורלציה מאוד. מקם מחדש את העכבר מעל תצוגת הגרף וגלול כדי להקטין את התצוגה כדי לראות את הצומת Level 2, L2_8, ואת הגורמים המשויכים לו כי הם שכנים פקטור 26. שים לב כי רק גנים עם משקל גדול יותר מסף המצוין על מחוון משקל הקישור Min מוצגים. כדי לראות את כל הגנים המשויכים לפקטור, לחץ על הצומת L1_26 ובחר טען גנים נוספים בחלון המוקפץ. כאשר המילה ‘ Done ‘ מופיעה, סגור את החלון המוקפץ. כעת חזור אל מקטע הכותרת העליונה מעל חלון הגרף של הפקטור וגרור את מציין המשקל של קישור מזערי . עכשיו, כמו המחוון משקל הקישור מועבר למטה ל 0.05, גנים אחרים בפקטור L1_26, כולל BRCA2, יופיעו בסדר משקל. לחלופין, מקם מחדש את הצמתים על-ידי גרירה וגרירה כדי לשפר את הפריסה. לקבוע כיצד ריבוד של חולים ביחס לגורם משפיע על הישרדות על ידי שאילתות בחלון ההישרדות. בחלון ההישרדות, בטל מיון על ידי p-val, ולאחר מכן בחר פקטור 26 בתפריט הנפתח פקטור יחיד כדי להראות עקומות הישרדות עבור פקטור 26. גלול למטה את גרף ההישרדות כדי להראות את מספר החולים בסיכון לאורך ציר ה-x. חפש שיוכים עם פונקציה ביולוגית על-ידי שאילתות בתוך חלון הביאור. בחלון הביאור, כדי למיין את התפריט הנפתח של הפקטור לפי מספר פקטור במקום בקצב גילוי שווא (רוזוולט), בטל את מיוןה-רוזוולט. גלול ולחץ כדי לבחור פקטור 26 בחלון הביאור הנפתח כדי להציג ביאורים העשרה עבור הפקטור. גלול למטה את רשימת הביאור עד תיקון הדנ א גלוי ולחץ על זה מיד לראות את הגנים המשויכים מודגש בצהוב על תצוגת גרף. ראה את הלוח האמצעי של איור 2. שים לב כי גורמים נעלמים או מופיעים כתנאי GO שונים נבחרים, על פי אם הם מועשר עבור גנים עם הביאור הנבחר, למשל, מסלול פנימי איתות מאשר בתגובה נזק DNA. חקור את הגורמים הנוספים על-ידי הוספת חלונות עם פונקציונליות שונה. מתוך שורת התפריטים העליונה, הוסף חלון של רשת אינטראקציה חלבון-חלבון (PPI) על-ידי בחירת PPI מהרשימה הנפתחת הוסף חלון , ולאחר מכן לחץ על לחצן הוסף כדי להוסיף חלון גרף PPI לאזור התצוגה. בחלון הגרף של PPI, בחר את הפקטור ‘ ל-layer1:26 ‘ כדי להציג את האינטראקציות של חלבון חלבון. שים לב לצפיפות החיבורים. משורת התפריטים העליונה, במקום PPI, בחר באפשרות מפת החום מהרשימה הנפתחת הוסף חלון ולאחר מכן לחץ על לחצן הוסף כדי להוסיף חלון של מפת החום לאזור התצוגה. בחלון מפת החום, בחר את הפקטור ‘ ל-layer1:26 ‘ כדי להציג את דפוסי ביטוי הגנים. לתפוס ולמקם מחדש את חלון מפת החום כך שחלון ההישרדות יהיה גם גלוי. לאורך החלק העליון של מפת החום, לראות כיצד הכתום/כחול/אפור בר מתאים לשכבות סיכון החולה על גרף הישרדות. התוצאות מוצגות בתחתית האיור 2. 2. סינון ופענוח גורמי CorEx באמצעות משקל גנטי, הישרדות ונתוני ביאור סינון גורמי עניין באמצעות איכות הישרדות ואשכול. מהתפריט הנפתח Dataset בחלק העליון, בחר TCGA_OVCA כדי לעבור לעמוד corexplorer עבור סרטן השחלות TCGA RNA-seq. ברגע שהעמוד טעון, הערה מחלון ההישרדות שהפקטור עם הדיפרנציאל ההישרדות הגדול ביותר עבור רבדים שונים הוא 114. בחלק העליון של חלון המארז לבחור ‘ ל-layer1:114 ‘ מתוך הרשימה הנפתחת פקטור . תפוס את המחוון משקל הקישור עם העכבר ולהעביר אותו עד 0.5. שים לב כי המספר הגדול של גנים בפקטור 114 (1609), ללא משקל > 0.35, מציין קיבוץ באשכולות חלש יחסית. הבא, להרחיב את רשימת הגורמים בחלון ההישרדות ולבחור את הגורם הטוב ביותר הבא בחלון ההישרדות הנפתח, פקטור 39, כדי להציג את עקומות ההישרדות הקשורות שלה. בחר בפקטור 39 בחלון הביאור על-ידי לחיצה עליו. הביאורים המשמעותיים של GO ו-KEGG מוצגים. כדי לקבל הבנה טובה יותר של התפקיד הביולוגי של גנים בפקטור 39, לפרש את הגורמים באמצעות מידע ביאור השכונה כדלקמן. בחלק העליון של חלון המארז, בחר את הפקטור ‘ ל-layer1:39 ‘ ברכיב הנפתח. לאחר מכן, להזיז את העכבר מעל החלון מקדם הגרף ולהקטין את הזום כדי לחשוף את האשכול L2_14 כולו עם 6 גורמים: 14, 32, 39, 42, 52, ו-82 (מוצג באיור 3). כדי להבין את המשמעות היחסית של הגורמים המקושרים לצומת L2_14, התחל בהצגת הפרשי הישרדות עבור כל אחד מגורמי L2_14. בטל סימון מיון על ידי p-val בחלון ההישרדות ולאחר מכן לחץ על כל אחד מספרי הפקטור ברציפות. לעשות זאת, שים לב כי רק גורמים 14, 32, ו 39 להציג שיוך הישרדות. כעת, משורת התפריטים העליונה, בחר באפשרות PPI מחלון ההוספה הנפתח שוב. לחץ על הוסף כדי להוסיף חלון גרף של PPI לאזור התצוגה. בחלון הגרף של PPI, בחר את הפקטור ‘ ל-layer1:52 ‘ כדי להציג את האינטראקציות של חלבון חלבון המשמעותיות. פריסת דוגמה של חלונות בנקודה זו מוצגת באיור 3. לחץ על התצוגה בקישור מסדר מצגת db בחלק התחתון של חלון PPI כדי להתחבר למסד הנתונים המקוון מסדר מצגת db. לחץ על המשך מהמסך הראשון ולאחר מכן בחר בכרטיסיה ניתוח מתחת לגרף הרשת כמו קודם כדי לקבל ניתוח GO מקוון עבור הגנים של הרשת PPI. המרכיב התאי העליון הוא קומפלקס החלבון “MHC class II”. חזור לכרטיסיה CorExplorer ולחלון PPI ובחר פקטור 32, הפעם מתוך הפקטור הנפתח. לחץ על תצוגת הקישור באמצעות מסדר היציאה לניתוח מסדר הנתונים. המרכיב הסלולרי העליון הוא ‘ מחלקה MHC I ‘ מורכב חלבון, ‘ בניגוד לכיתה II עבור פקטור 52 בשלב הקודם! לבסוף, לחזור לחלון PPI ולבחור ‘ ל-layer1:39 ‘ מהתפריט הנפתח הגורם בראש. לחץ על תצוגת הקישור בתוך מסדר הנתונים כדי להתחבר לניתוח מסדר הנתונים. לחץ על המשך מהמסך הראשון ולאחר מכן בחר בכרטיסיה ניתוח מתחת לגרף הרשת כדי לקבל ניתוח GO מקוון עבור הגנים ברשת PPI. שים לב כי הפונקציה המולקולרית העליון הוא ‘ CXCR3 כימוקין קולטן מחייב. ‘ 3. באמצעות הישרדות וביאורי מסד נתונים כדי לחפש שילובים טיפוליים מבטיחים עבור אל מלנומה TCGA CorExplorer על ידי בחירת TCGA_SKCM מהתפריט הנפתח Dataset . שימו לב כי הפקטור עם דיפרנציאל ההישרדות הגדול ביותר הוא פקטור 171. בדוק את הפקטור 171 ביאורים על ידי גלילה ולשים לב כי ‘ תגובה חיסונית ‘ ו ‘ cytokine מתווך איתות מסלול ‘ הם ליד העליון (כפי שהם היו עבור גורם השחלות העליון). כדי למצוא גורם משלים, בדוק את הגורמים הקשורים ההישרדות העליון יחד עם מונחים הביאור העליון שלהם. לשם כך, לחץ על קישור סקירה של קבוצת הנתונים בשורת התפריטים העליונה כדי לפתוח כרטיסיה נפרדת המכילה טבלה עם פרטי עיבוד נתונים, כמו גם סיכום של גורמים עליונים לפי ערך p של ההפרש בין ההישרדות. שים לב כי הגורם הראשון שאינו החיסון הוא 88. חזור לכרטיסיית הדפדפן TCGA_SKCM . בחר בפקטור 88 בחלונות ההישרדות, הביאור והגרף. החלק העליון מספר ללכת קשורים ‘ rRNA עיבוד ‘ ו ‘ מיטוכונמיטוהארגון, ‘ מאשרת אותו בנפרד מן הגורמים הקשורים החיסונית. בחלון ההישרדות, על הגורמים המשולבים הנפתחת, בחר ‘ 88 _ 171 ‘ כדי לראות איך הישרדות משופר עבור חולים ברובד האמצעי עבור 171 ו 88 גורמי ביטוי משולבים. השוואות ביאור והישרדות מומחשות באיור 4. 4. למצוא את הדברים השכיחים והבדלים של וריאציה ביטוי גנים על פני סוגי גידולים באמצעות דף החיפוש לחץ על כותרת Corexplorer כדי לחזור לעמוד הראשון. לחץ על חיפוש בשורת התפריטים העליונה כדי לעבור לדף המאפשר חיפוש מעל כל ערכות הנתונים באתר corexplorer. בתיבת החיפוש של הגן , הזן ‘ FLT1 ‘ (VEGFR1) ולחץ על החזרה או על חיפוש. FLT1 נמצא עם משקל גבוה יחסית בגורמים הבאים: OVCA-76, LUAD-162, SKCM-195 ו-SKCM-184, כמו גם COAD-112 ו COAD-74. לחלופין, חפש תקופת GO קשורה בכל ערכות הנתונים. נסה זאת בתיבה ‘ GO Search ‘ על-ידי הקלדת ‘ אנגיוגנזה ‘ ופגיעה בהחזרה או בהקשה על חיפוש. כל הגורמים הFLT1, למעט SKCM-195, מפורטים כחלק מבחינה סטטיסטית לגנים של “אנגיוגנזה” – גורם 195, למעשה, יש את הביאור, אבל מתחת ברירת המחדל של סף ה10-8. תוצאות חיפוש עבור זה והצעד הקודם מוצגים באיור 5. כדוגמאות נוספות, בתיבת החיפוש GO, הסוג הראשון ‘ קולטן באפידרמיס של גורם גדילה. ‘ רק LUAD מועשר עבור מונח זה, גורם מוכר ריבוד לסרטן ריאות. לאחר מכן, הקלד ‘ mesenchymal ‘ בתיבת החיפוש. מונח זה מועשר בקבוצות ביטוי גנים עבור OVCA, שם הוא ריבוד פקטור היטב.

Representative Results

מחפש את הגן ‘ BRCA1 ‘ בקבוצת הנתונים של סרטן הריאות חושף אותו להיות הקשורים ביותר חזק עם פקטור CorEx 26 (איור 2). GO העשרה המונח עבור גורם זה נראה גבוה מאוד, עם תיקון DNA המציגות את רוזוולט של רק 1 x 10-19. הבחירה גם מושכת תשומת לב לאשכול הרמה השנייה L2_8 שיש לו שישה גורמים קשורים היטב כילדים. בחירת ‘ תיקון ה-DNA ‘ ב או ביאורים לטווח ללכת או הגרף ללכת מועשר הנפתחת הכולל גנים הקשורים בכל אחד מהגורמים, עם הגורם 26 לאחר הרבה ביותר, כצפוי11. הרשת האינטראקציית חלבון-חלבון מקושרת מאוד, ותומכת עוד יותר בפונקציונליות המקושרת היטב של הגנים בפקטור 26. גרף ההישרדות המשויך מציע קשר אפשרי עם הישרדות החולה, אבל זה צריך להיות מאושר בערכת נתונים גדולה יותר. החל בהישרדות יכול לאפשר ניתוח של סיבות הישרדות משופרת הקשורים לקבוצות ביטוי גנטי מסוים. כדוגמה, הגורם העליון המשפיעים על הישרדות סרטן השחלות נראה להיות מספר 39, אשר מועשר מאוד עבור גנים הקשורים למערכת החיסונית (איור 3). חמישה גורמים אחרים הקשורים באותו שלב 2 הצומת מצוינים גם להיות החיסונית הקשורות, אולם ההשפעה הישרדות נראה משתנה מאוד ביניהם, עם 39 להיות הגבוהה ביותר 52 להיות הנמוך ביותר. הוספת חלון אינטראקציה חלבון חלבון עבור גורם מציג את רשת האינטראקציה המיידית ומאפשרת קישור לאתר האינטרנט של מסדר ה-12 כדי לבצע שאילתה על enrichments שונים עבור הגנים ברשת PPI. על ידי עושה את זה עבור כל אחד מגורמי L2_14 בתורו, אחד מוצא כי מסמסד db enrichments עבור הגנים ברשת PPI להציע את ההסבר האפשרי הבא עבור האסוציאציות עם הישרדות. פקטור 32 מכיל גנים שעושים את הקומפלקס הגדול ביותר היסטרתאימות (MHC) בכיתה אני חלבון מורכב, אשר מזוהה על ידי לימפוציטים T ציטוטוקסיים. פקטור 39 מתאים איתות cy, ו CXCR3 קולטן מחייב, הקשורות CD8 + T לימפוציטים. שני גורמים אלה מופיעים כדי להעניק יתרון הישרדות משמעותי עבור חולים המציגות ביטוי גבוה יחסית של הגנים המתאימים. ציטומיק CD8 + T לימפוציטים הם בעיקר אחראים נגד הגידול חסינות. פקטור 52, מצד שני, מורכב גנים קידוד עבור חלבונים במתחם MHC מחלקה II אשר מזוהים בעיקר על ידי CD4 + T תאים מסייע ולא ישירות על ידי לימפוציטים T ציטוטוקסיים. שאר גורמי L2_14 משקפים הפעלה כללית של המערכת החיסונית כי לא להבדיל בין שני סוגים של אוכלוסיות לימפוציטים. האגודה הישרדות ספציפי ציטוטוקסיט T זיהוי לימפוציטים של mch class אני אנטיגנים סלולריים הוא עקבי עם ההבנה שלנו של חסינות antitumor בכלל ומסרטן אחרים כגון מלנומה13,14. פורטל האינטרנט תומך בגילוי של זוגות של גורמים עם פונקציות משלימות שעשויות להציע טיפולים יעילים לגידול ספציפי שילוב. סקירה של ערכת הנתונים ניתן לסרוק עבור גורמים הרואים מתאם עם הישרדות עדיין יש ברורים GO enrichments. עבור מלנומה (TCGA_SKCM; איור 4), הוא ראה כי הגורם ההישרדות העליון 171 הוא קשור החיסונית, בעוד גורם 88 במורד הרשימה מראה העשרה עבור גנים הקשורים בארגון מיטוכונמיטויום. אכן, זה הוצע כמטרה ב מלנומה15. הוספת חלונות הישרדות לעמוד CorExplorer מאפשרת השוואה של ריבוד באמצעות זוג פקטור זה של כל גורם בנפרד, מראה כי דפוסי ביטוי גנים נוחים משתי הקבוצות מציג מגמה של הישרדות טוב יותר עבור אחד לבד. הרובד העליון לא נראה שופרה עם זאת, מציע חיסוני רק עשוי להיות האופציה הטובה ביותר עבור חלק מהחולים. שכיח והבדלים בין גידולים ניתן לראות על ידי חיפוש על פני datasets עבור גנים או ללכת מונחים (איור 5). כדוגמה, FLT1 (aka VEGFR1) הוא סמן מקצועי למדי לימודי-אנגיוגנטי16,17. כאשר הוא הכניס לתוך סרגל החיפוש, כל הגידולים יש גורמים שבהם FLT1 משחק תפקיד מרכזי. לעומת זאת, כאשר המונח GO ‘ אנגיוגנזה ‘ הוא קלט בדף החיפוש, 5 מתוך 6 קבוצות FLT1 מופיעות עם העשרה זו. כל הגורמים FLT1, למעט SKCM-195, מפורטים מבחינה סטטיסטית מועשר בגנים של אנגיוגנזה. הגורם השישי הוא, למעשה, יש את הביאור, אבל מתחת ברירת המחדל 10-8 הסף. כאשר המשקל בתוך רשימת הגורמים מנוצל בחשבון העשרה חלופי, לדוגמה, המקדם העשרה של ג’ין (GSEA)18, נמצא הגורם השישי מועשר באופן משמעותי גם בגנים של אנגיוגנזה. חשוב לבדוק את מפות החום כדי להבטיח שהתבנית של ביטוי הגנים היא באיכות נאותה לתמיכה בפרשנויות ביולוגיות. מפות חום הצגת וריאציה ברורה חזקה עשוי להפגין ביטוי מתואם של גנים הגורם החל נמוך לדפוסים גבוהים או מורכבים יותר עם כמה גנים שיש ביטוי נמוך בקורלציה עם אחרים שיש גבוה (איור 6). סמן מפתח של קיבוץ באיכות גבוהה הוא הנוכחות של מספר גנים עם וריאציה חלקה בביטוי כפונקציה של ציון גורם. מפות החום של הפקטור מציגות דגימות שהוזמנו בהתאם לתוצאת הפקטור, ולכן צריך להיות מעבר הדרגתי חלק משמאל לימין. עם זאת, הדבר עלול להיכשל בשתי דרכים שונות לפחות. הנפוץ ביותר, היחסים יכול להיות רועש מאוד (איור 5C), קורא להטיל ספק את החוסן ואת התועלת של כל הסקנות לגבי הישרדות ו/או פונקציה ביולוגית. כמו כן, דפוסי שמתרחשים רק במיעוט קטן של דגימות לא יכול להתאים את המודל של שלוש מדינות ביטוי הניח על ידי אלגוריתם CorEx, וכתוצאה מכך סיווג מטעה של דגימות (הצד הימני של איור 5d). איור 1: דף השער של CorExplorer. לאחר לחיצה על + ליד סרטן השחלות תחת קישורים מהירים, פקטור גרף פרטים מוצגים. המודל ההירארכי של CorEx מורכב ממשתני קלט (ביטוי גנטי במקרה זה) בשכבה התחתונה וגורמים סמויים בשכבות הגבוהות יותר. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. איור 2: שימוש בשם הגן כדי להדריך את המחקר. האיור מציג סדרה של צילומי מסך המדגימה חקירה של גורמי סרטן ריאות CorEx הקשורים מאוד BRCA1. ראשית, בחירה ב-‘ BRCA1 ‘ בתיבה הנפתחת ‘ גן ‘ עבור גרף הפקטור גורמת לתצוגת הגרף להגדיל את הפקטור שעבורו BRCA1 יש את המשקל הגדול ביותר. הגדלת המרחק של מסגרות סיביות לשני הצמתים L2_8 חיבור גורם זה לאלה קשורים אחרים. הישרדות וביאורים ניתן להשוות: לחיצה על המונח ללכת לתקן DNA תיקון גנים מוערת. חלון PPI נוסף כדי להציג את אינטראקציות הרשת עבור גנים בפקטור. באמצעות לחצן הוספת חלון כדי להוסיף מפת חום מראה שיוך של דפוסי ביטוי עם הישרדות, מציע ביטוי מוגבר של גנים תיקון DNA יכול להיות קשור עם ירידה הישרדות. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. איור 3: שימוש בנתונים קליניים (הישרדות) כדי להדריך את המחקר. חקירת מקדם ההישרדות העליון (39) עבור סרטן השחלות חושף קשרים מעניינים בין גורמים שכנים. לאחר בחירת פקטור 39 בגרף הפקטור והתקרבות מעט, השכבה ששני הגורמים המקושרים לפקטור 39 נראית כחמישה גורמים משויכים אחרים. חלון הישרדות נוסף מאפשר השוואה ישירה של הפרשי ההישרדות המשויכים. גורמים 39 ו 32 שניהם מראים מתאם הישרדות חיובי, בניגוד פקטור 52, אשר אינו. הרשתות האינטראקציית חלבון-חלבון מוגדרות היטב. קישור החוצה כדי מט db מאפשר השוואה של ביאורים GO (לא מוצג): פקטור 39 משויך עם רשת איתות cy, הקשורים ציטוטוקסיים CD8 + T הפעלה לימפוציטים וגורם 32 נשלט על ידי מחלקה mhc I אנטיגן הצגת חלבונים ש ההדק זיהוי על ידי לימפוציטים כגון; הגורמים השכנים, עם זאת, נשלטים על ידי רכיבים אחרים המערכת החיסונית כגון CD4 + מסייע בתאי T ולהראות שום מתאם הישרדות. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. איור 4: חקירת גורמי הישרדות העליון מציע שילובים פוטנציאליים פוטנציאל. הקישור ‘ ערכות נתונים ‘ בשורת התפריטים של דף הבית מוביל לטבלה תמציתית של גורמי הישרדות שהוזמנו על-ידי ערך p, יחד עם הביאור GO העליון (לא מוצג). שימוש במידע זה עבור מלנומה, השילוב של פקטור 171 עבור הפונקציה החיסונית עם פקטור 88 עבור המיטו, הארגון נראה משלים. האיור מציג חלונות ביאור עבור כל אחד מהגורמים זה לצד זה כדי להבדיל ביניהם. עקומות הישרדות עבור מטופלים שעברו באופן אינדיבידואלי על ידי שני הגורמים בנפרד או יחד מצביעים על כך שהשילוב מגדיל את ההפרש בין ההישרדות בהשוואה לפקטור בלבד. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. איור 5: עמוד החיפוש מקל על ניתוח הסרטן הפאן. גנים או מונחים מונחי תהליך ביולוגי ניתן לחפש על פני כל ערכות הנתונים באמצעות קישור החיפוש מדף הבית. האיור מציג תוצאות חיפוש עבור הגן FLT1 ואת המונח GO ‘ אנגיוגנזה ‘. התוצאות מראות את הנוכחות של FLT1 בגורמים מסומן עם המונח “אנגיוגנזה” על פני סרטן. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. איור 6: מפות החום ניתן להשתמש כדי להעריך את הקשרים באיכות מרבית בין הגנים והדגימות בהתאם לתוצאת הפקטור. קשרים ביטוי גנים באיכות גבוהה מוצגים על ידי הדרגתיות חלקה כאשר המטופלים מסודרים על ידי ציון גורם במפות החום. מיפוי החום השמאלי ביותר עבור פקטור 18 הוא דוגמה אחת. הדפוסים יכולים גם להקיף חתימות מורכבות של ביטוי למעלה ולמטה כמו במפת החום האמצעית הגדולה עבור פקטור 11. תבניות באיכות נמוכה יותר מציגות לעיתים שינויים פתאומיים בביטוי לקבוצת משנה של חולים כמו בפקטור 9 החום המפה על הזכות או פשוט היחסים מאוד רועש מאוד כמו בפקטור 161 החום מפה בצד ימין התחתון. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה.

Discussion

הצגנו את האתר CorExplorer, שרת אינטרנט נגיש לציבור עבור חקר אינטראקטיבי של גורמים ביטוי גנטי מקסימאלי בקורלציה מקסימאלית של הגידול RNA-seq על ידי אלגוריתם Corexplorer. הצגנו כיצד האתר עשוי לשמש כדי stratify חולים לפי ביטוי גן הגידול, ואיך ריבוד כזה מתאים פונקציה ביולוגית והישרדות.

שרתי אינטרנט אחרים עבור ניתוח של RNA-seq נבנו. ניתן לבדוק ולשלב ניתוח ביטוי משלים ושיתוף ביטויים לגידולים משולבים עם סוגי נתונים אחרים ב-cביובורטל19,20. השרתים שרתים21, mev22, ו מורפיוס23, לשלב טכניקות באשכולות הוקמה כגון ניתוח המרכיב העיקרי (pca), כלומר, או לארגן מפות עצמית (כאשר). מאמצים חדשניים יותר כוללים CamurWeb24, מבוסס על מסווג אוטומטי מחולל כללים, ו-tacco25, אשר מיישמת מסווג ביער אקראי lassos. אלגוריתם CorEx משמש כאן מייעל מידע רב משתנים כדי למצוא היררכיה של גורמים המסבירים דפוסים בנתונים. הלמידה למידה הירארכית וללא לינארית מופיעה כדי להניב המשך באופן משופר ביחס לגורמים הגלובליים הליניארים המצויים באמצעות PCA4. בנוסף, הטכניקה בסדר הניתוח העדין של אותות לדוגמה מאפשר השוואות הגידול מדויק לעומת-à-vis יותר נפוץ בשימוש תת-סוגי. שילוב זה של ניתוח מרכיב חופף והירארכי מבדיל בין מרבית הגישות האחרות ומחייבת כלים חדשים להדמיה ולסיכום.

חלק קריטי בניתוח גורם CorExplorer הוא היכולת לחקור לא רק כמה, אבל מעל 100 גורמים עם דפוסי גנים אינפורמטיביים הממוקמים בתוך היררכיה חופפים. CorExplorer מקלה על כריית הגורמים הרבים האלה עבור אגודות ביולוגיות וקליניות ומאפשר אפיון מפורט במיוחד של גידולים בודדים. הלמידה ללא השגחה של מספר כה גדול של גורמים פירושה שלא הכל יהיה רלוונטי לביולוגיה של המחלה. במקרה כזה, זה חיוני להשתמש ביאורים או גנים ידועים כדי למשוך את גורמי העניין או לחפש גורמים הקשורים לנתונים קליניים כגון הישרדות. לפיכך, CorExplorer מאפשר למשתמשים ליישם את הצעד החשוב מאוד מסנן. הנוכחות של דפוסי גנים גורם בגידול עשוי אפילו להציע גישה לטיפול באונקולוגיה אישית. יתר על כן, ריבוי של תוצאות גורם עבור כל גידול המאפשר גילוי של שילובים טיפולית פוטנציאלי שימושי.

לפעמים זה המקרה כי שום ביאורי GO משמעותיים להופיע עבור גורמים בקורלציה גבוהה עם הישרדות. בעוד שהדבר עלול להתרחש עקב רעש או מתחת לנתונים שנדגמו, יש גורמים אפשריים נוספים כגון גודל אשכול קטן מדי לרישום של עשרות העשרה משמעותיים או שהקבוצה היא ‘ סל ‘ של גנים בודדים ממסלולים שונים ללא ביולוגי אגודה. בנוסף, קטגוריה של ביאור השונה מהתהליך הביולוגי של KEGG ו-GO, למשל תא סלולארי, עשוי להתאים. ניתן לגשת אליהם באמצעות קישור אל מסדר הנתונים כפי שמתואר בפרוטוקול. הניתוח העשרה של הנטולוגיה הגנטית באתר CorExplorer כרגע אינו מהווה בחשבון את שקלול הגנים בפקטור, למרות שסביר להניח שזה יתוקן בעתיד הקרוב. הערה אפשרות של רשימת גנים זמינה תחת ‘ הוסף חלון ‘ המאפשר להוריד את רשימת הגנים של הגורם המלא לניתוח נוסף באמצעות כלים חיצוניים.

לצורך האתר, CorEx הופעל על כל אחד מערכות הנתונים חמש פעמים את ההפעלה כי הביא מתאם הכולל הגדול ביותר הכוללת נשמר. לאחר ייצוג סטטיסטי של התוצאות של מספר רב של מסלולים עשוי להיות אינפורמטיבי יותר והוא מטרה לעבודה בעתיד. בנוסף, הקבוצה של סוגי הגידולים הזמינים בשרת הוא קטן למדי, אך אנו מצפים לכך להתרחב עם הזמן בהתאם לעניין המשתמש.

כפי שמתואר לעיל, ה-CorExplorer מפעיל את מערכת היחסים של Corexplorer RNA-seq יחד עם מידע קליני ומסד נתונים, ובכך מאפשר מגוון מצבי חקירה שונים. אנו מקווים כי כלי זה יוביל לעבודה נוספת כדי לנצל את העוצמה של הניתוח RNA-seq עבור גילוי ויישום קליני באונקולוגיה.

Divulgaciones

The authors have nothing to disclose.

Acknowledgements

GV נתמך על ידי הפרס DARPA W911NF-16-0575.

Materials

Public server for CorExplorer website USC http://corex.isi.edu Intel Xeon E5-2690 4-core 2.6 GHz, 8GB RAM. Backend architecture is LAMP: Linux, Apache, MySQL, PHP.
Web browser Google/Apple Chrome/Safari Verified web browsers.

Referencias

  1. Petryszak, R., et al. The RNASeq-er API-a gateway to systematically updated analysis of public RNA-seq data. Bioinformatics. 33, 2218-2220 (2017).
  2. Steeg, G. V., Galstyan, A. Maximally Informative Hierarchical Representations of High-Dimensional Data. Proceedings of the Eighteenth International Conference on Artificial Intelligence and Statistics (AISTATS). , (2015).
  3. Ver Steeg, G., Galstyan, A. Discovering structure in high-dimensional data through correlation explanation. Advances in Neural Information Processing Systems. , (2014).
  4. Pepke, S., Ver Steeg, G. Comprehensive discovery of subsample gene expression components by information explanation: therapeutic implications in cancer. BMC medical Genomics. 10, 12 (2017).
  5. Byron, S. A., Van Keuren-Jensen, K. R., Engelthaler, D. M., Carpten, J. D., Craig, D. W. Translating RNA sequencing into clinical diagnostics: opportunities and challenges. Nature Reviews Genetics. 17, 257 (2016).
  6. Cancer Genome Atlas Research Network. Comprehensive molecular profiling of lung adenocarcinoma. Nature. 511, 543 (2014).
  7. Cancer Genome Atlas Network. Comprehensive molecular characterization of human colon and rectal cancer. Nature. 487, 330 (2012).
  8. Akbani, R., et al. Genomic classification of cutaneous melanoma. Cell. 161, 1681-1696 (2015).
  9. Cancer Genome Atlas Research Network. Integrated genomic analyses of ovarian carcinoma. Nature. 474, 609 (2011).
  10. Grossman, R. L., et al. Toward a shared vision for cancer genomic data. New England Journal of Medicine. 375, 1109-1112 (2016).
  11. Moynahan, M. E., Chiu, J. W., Koller, B. H., Jasin, M. Brca1 controls homology-directed DNA repair. Molecular Cell. 4, 511-518 (1999).
  12. Szklarczyk, D., et al. STRING v11: protein–protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets. Nucleic Acids Research. 47, 607-613 (2018).
  13. Durgeau, A., Virk, Y., Corgnac, S., Mami-Chouaib, F. Recent advances in targeting CD8 T-cell immunity for more effective cancer immunotherapy. Frontiers in Immunology. 9, 14 (2018).
  14. Sato, E., et al. Intraepithelial CD8+ tumor-infiltrating lymphocytes and a high CD8+/regulatory T cell ratio are associated with favorable prognosis in ovarian cancer. Proceedings of the National Academy of Sciences of the United States of America. 102, 18538-18543 (2005).
  15. De Moura, M. B., et al. Mitochondrial respiration-an important therapeutic target in melanoma. PLoS One. 7, 40690 (2012).
  16. Folkman, J., Merler, E., Abernathy, C., Williams, G. Isolation of a tumor factor responsible for angiogenesis. Journal of Experimental Medicine. 133, 275-288 (1971).
  17. Takahashi, S. Vascular endothelial growth factor (VEGF), VEGF receptors and their inhibitors for antiangiogenic tumor therapy. Biological and Pharmaceutical Bulletin. 34, 1785-1788 (2011).
  18. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America. 102, 15545-15550 (2005).
  19. Cerami, E., et al. The cBio Cancer Genomics Portal: An Open Platform for Exploring Multidimensional Cancer Genomics Data. Cancer Discovery. 2, 401-404 (2012).
  20. Gao, J., et al. Integrative Analysis of Complex Cancer Genomics and Clinical Profiles Using the cBioPortal. Science Signalling. 6, 1 (2013).
  21. Reich, M., et al. GenePattern 2.0. Nature Genetics. 38, 500 (2006).
  22. Wang, Y. E., Kutnetsov, L., Partensky, A., Farid, J., Quackenbush, J. WebMeV: A Cloud Platform for Analyzing and Visualizing Cancer Genomic Data. Investigación sobre el cáncer. 77, 11-14 (2017).
  23. . Morpheus Available from: https://software.broadinstitute.org/morpheus (2019)
  24. Weitschek, E., Lauro, S. D., Cappelli, E., Bertolazzi, P., Felici, G. CamurWeb: a classification software and a large knowledge base for gene expression data of cancer. BMC Bioinformatics. 19, 354 (2018).
  25. Chou, P. -. H., et al. tACCo, a Database Connecting transcriptome Alterations, pathway Alterations and Clinical outcomes in Cancers. Scientific Reports. 9, 3877 (2019).

Play Video

Citar este artículo
Pepke, S., Nelson, W. M., Ver Steeg, G. Analyzing Tumor Gene Expression Factors with the CorExplorer Web Portal. J. Vis. Exp. (152), e60431, doi:10.3791/60431 (2019).

View Video