רצף עמוק של אוכלוסיות השמרים שנבחר עבור אינטראקציות חיוביות שמרים 2-היברידית פוטנציאל התשואות שפע של מידע אודות אינטראקציה שותף חלבונים. כאן, אנו מתארים את הפעולה של ביואינפורמטיקה ספציפי כלים ותוכנות מעודכן המותאם אישית כדי לנתח נתונים רצף כזה המסכים.
אנחנו הסתגלו שמרים 2-היברידית וזמינותו לחשוף בו זמנית עשרות אינטראקציות חלבון ארעי וסטטיים בתוך מסך אחד ניצול רצפי DNA קצר-קריאה תפוקה גבוהה. Datasets רצף וכתוצאה מכך יכול לא רק לעקוב אחרי איזה גנים באוכלוסיה כי הם מועשרים במהלך הבחירה עבור אינטראקציות חיוביות שמרים 2-היברידית, אלא גם לתת מידע מפורט אודות תחומי משנה רלוונטיים של חלבונים מספיק עבור אינטראקציה. כאן, אנו מתארים חבילה מלאה של תוכניות עצמאיות המאפשרות שאינם מומחים לביצוע כל ביואינפורמטיקה, צעדים סטטיסטיים כדי לעבד ולנתח DNA רצף fastq קבצים אצווה שמרים 2-היברידית וזמינותו. השלבים בעיבוד מכוסה על ידי תוכנות אלה כוללים: קריאות רצף 1) מיפוי והספירה המתאים לכל חלבון המועמד מקודד בתוך ספרייה 2-היברידית טרף שמרים; 2) תוכנית ניתוח סטטיסטי המעריכה את הפרופילים העשרה; ו 3) כלים לבחון את המסגרת translational והמיקום בתוך אזור קידוד של כל מועשר פלסמיד מקודד חלבונים שמעצבת את עניין.
גישה אחת לגלות אינטראקציות חלבון הוא שמרים 2-היברידית (Y2H) וזמינותו, אילו תוכנות המנצלות לרעה את מהונדסים תאי שמרים לגדול רק כאשר חלבון עניין נקשר שבר של אינטראקציה שותפים1. זיהוי של אינטראקציות מרובות Y2H יכול להיעשות עכשיו עם העזרה של רצף תפוקה גבוהה מקבילים מסיבית. מספר תבניות כבר תיאר2,3,4,5 כולל אחד פיתחנו שבו אוכלוסיות מגודלים באצוות בתנאים בחר עבור שמרים המכיל פלסמידים לייצר אינטראקציה חיובית Y2H6. זרימת העבודה אנחנו פיתח, הנקרא DEEPN (דינמי העשרה עבור הערכה של חלבונים רשתות), מזהה interactomes דיפרנציאלית מספריות טרף אותו לזהות חלבונים המקיימים אינטראקציה עם חלבון (או קבוצת המחשבים) אחד vs. חלבון אחר או תחום mutant conformationally נפרדים. אחד הצעדים העיקריים בתהליך זה הוא ראוי עיבוד וניתוח של הנתונים רצף ה-DNA. מידע שאפשר לקרוא על ידי רק ספירת מספר קריאות עבור כל ג’ין גם לפני וגם אחרי הבחירה של Y2H אינטראקציות באופן מקביל ניסוי ה-RNA-seq. עם זאת, מידע מעמיק הרבה יותר יכול להיות מופק אלה נתונים (datasets) כולל מידע על תחום המשנה של חלבון נתון זה הוא מסוגל לייצר אינטראקציה עם Y2H. בנוסף, ואילו הגישה DEEPN היא ערך, ניתוח רבים דוגמת משכפל יכול להיות מסורבל ויקר. בעיה זו הביאו להקלה באמצעות מודל סטטיסטי שפותחה במיוחד עבור DEEPN datasets איפה המספר של משכפל מוגבל6. כדי להפוך עיבוד וניתוח של ה-DNA רצף נתונים (datasets) מהימן, מלא, עמיד, או נגיש לחוקרים ללא מומחיות ביואינפורמטיקה, פיתחנו חבילת תוכניות שיכולות לכסות את כל השלבים של ניתוח.
הסוויטה לעמוד לבד תוכנות הפועלות במחשבים שולחניים כולל MAPster, DEEPN Stat_Maker. MAPster הוא ממשק משתמש גרפי המאפשר שכל קובץ fastq בתור עבור מיפוי הגנום באמצעות תוכנית ‘ HISAT2 ‘7, הפקת קובץ .sam תקן לשימוש ביישומים במורד הזרם. DEEPN יש כמה מודולים. זה מקצה וסופרת קריאות המתאים גן מסוים דומה כימות סוג RNA-seq בעזרת המודול “ספירת ג’ין”. אותה גם מחלצת את רצפי המתאים בצומת שבין התחום תעתיק Gal4 ואת הרצף טרף, collates את המיקום של צמתים אלה כדי לאפשר בדיקה שלהם על ידי השוואתי טבלאות וגרפים (באמצעות המודול ‘Junction_Make’) המודול ‘Blast_Query’ מאפשר בדיקה קלה, כימות, השוואה של הרצף צומת Gal4 לצומת. Stat_Maker מעריך את הקריאות לפי ג’ין העשרת נתונים סטטיסטית כדרך של סדר עדיפויות להיטים Y2H סביר. כאן, אנו נתאר כיצד להשתמש מהתוכנות הללו, לנתח באופן מלא את רצף ה-DNA נתונים Y2H DEEPN הניסוי. גירסאות של DEEPN זמינים לפעול במערכות PC, Mac, ו- Linux. בתוכניות אחרות, כגון התוכנית מיפוי MAPster, מודול הסטטיסטיקה DEEPN Stat_Maker להסתמך על subroutines המופיעה תחת Unix, הינם זמינים רק במערכות Mac ו- linux.
חבילת התוכנות המתוארים כאן מאפשרת לעבד ולנתח תפוקה גבוהה DNA רצף נתונים ניסוי DEEPN לחלוטין. בתוכנית הראשונה בשימוש הוא MAPster, אשר לוקח את קריאות רצף ה-DNA בקבצים רגילים fastq וממפה את עמדתם על הפניה דנ א לעיבוד הזרם על ידי שורה שלמה של אינפורמטיקה תוכניות כולל את התוכנה DEEPN. השירות של הממשק MAPster ואת ?…
The authors have nothing to disclose.
עבודה זו נתמכה על ידי מכוני הבריאות הלאומיים: NIH R21 EB021870-01A1, על ידי ה-NSF מחקר פרויקט מענק: 1517110.
Mapster | https://github.com/emptyewer/MAPster/releases | ||
DEEPN software | https://github.com/emptyewer/DEEPN/releases | ||
Statmaker | https://github.com/emptyewer/DEEPN/releases | ||
Minimum computer system | Apple | Mac Intel Core i5 or better | |
– | 4 Gb RAM or better | ||
– | 500 Gb Disk spce or better | ||
– | OS 10.10 or higher | ||
Dell | Intel i5-7400 or better | ||
– | 4 Gb RAM or better | ||
– | 500 Gb Disk spce or better | ||
– | Windows 7 or higher |