שיטה ישר קדימה ויציב לזהות מוטיבים רגולטוריים פוטנציאל שיתוף מוסדר גנים מוצג. היקף אינה דורשת כל הפרמטרים המשתמש מחזיר מוטיבים המייצגים מועמדים מצוינים עבור אותות הרגולציה. הזיהוי של אותות רגולטוריים כאלה עוזר להבין את הביולוגיה הבסיסית.
היקף מהווה מוטיב אנסמבל מוצא כי משתמשת בשלושה אלגוריתמים מרכיב במקביל לזהות מוטיבים רגולטוריים פוטנציאל ידי ייצוג יתר ואת המיקום מוטיב העדפה 1. אלגוריתם כל רכיב מותאם למצוא סוג אחר של מוטיב. על ידי לקיחת הטוב ביותר של שלוש גישות אלה, היקף מבצעת טוב יותר מאשר אלגוריתם כל אחד, אפילו בנוכחות של נתונים רועש 1. במאמר זה, אנו מנצלים גירסת האינטרנט של היקף 2 לבחון גנים מעורבים תחזוקה הטלומרים. היקף כבר שולבו מוטיב לפחות שתי תוכניות אחרות למצוא 3,4 נעשה שימוש במחקרים אחרים 5-8.
שלושת האלגוריתמים שמרכיבים היקף הן הקורה 9, אשר מוצא את הלא מנוונת מוטיבים (ACCGGT), PRISM 10, אשר מגלה מוטיבים מנוונת (ASCGWT), ו spacer 11, אשר מגלה מוטיבים bipartite יותר (ACCnnnnnnnnGGT). אלה הם שלושה אלגוריתמים מוטבו למצוא סוג של מוטיב המתאימים. ביחד, הם מאפשרים לבצע היקף טוב מאוד.
לאחר סדרה גן כבר ניתחו ומוטיבים מועמד מזוהה, היקף יכולים לחפש גנים אחרים המכילים את מוטיב אשר, כאשר הוסיף להגדיר המקורי, ישפרו את הציון מוטיב. זה יכול להתרחש באמצעות ייצוג יתר או העדפת מוטיב. עבודה עם קבוצות גנים חלקיים אימתת ביולוגית גורם שעתוק אתרי הקישור, היקף הצליח לזהות את רוב שאר הגנים מוסדר גם על ידי גורם שעתוק נתון.
פלט מתוך היקף מראה מוטיבים המועמד, את משמעותם, וכל מידע אחר הן השולחן כמפה מוטיב גרפי. שאלות נפוצות ומדריכים וידאו זמינים באתר האינטרנט היקף, אשר כולל גם "חיפוש מדגם" כפתור המאפשר למשתמש לבצע לרוץ למשפט.
היקף בעל ממשק משתמש ידידותי מאוד, המאפשר למשתמשים לגשת טירון מלוא העוצמה של אלגוריתם מבלי להיות מומחה ביואינפורמטיקה של מוטיב למצוא. כפי קלט, היקף יכול לקחת רשימה של גנים, או רצפי FASTA. אלה יכולים להיות מוזנים שדות טקסט הדפדפן, או לקרוא מקובץ. פלט היקף מכיל רשימה של כל המוטיבים המזוהים עם ציוניהם, מספר המופעים, שבריר של גנים המכילים את מוטיב, ואת האלגוריתם משמש לזיהוי מוטיב. עבור כל מוטיב, פרטים תוצאה כוללים ייצוג הקונצנזוס של מוטיב, לוגו רצף, מטריצה משקל עמדה, וכן רשימה של מקרים להתרחשות כל מוטיב (עם עמדות המדויק "גדיל" המצוין). תוצאות מוחזרות בחלון דפדפן וגם אופציונלי באמצעות הדוא"ל. מאמרים קודמים לתאר את האלגוריתמים היקף בפירוט 1,2,9-11.
היקף מספק את החוקר עם כלי רב עוצמה להשתמש לצורך זיהוי של מוטיבים רגולטוריים פוטנציאל סטים של גנים מוסדרים מתואמת. המשתמש אינו נדרש לנחש בגודל של מוטיב או את מספר המופעים של מוטיב כמוטיב למצוא אתרים רבים אחרים דורשים. פרמטרים אלה הם בעצם לידיעה עד מוטיב מזוהה. הממשק הוא מאוד פשוט הן להזנת או רצפי גנים שמות ועבור הצגת הפלט.
היקף התפוקה מספק מידע מפורט אודות כל המוטיבים המזוהות, באמצעות שלוש דרכים שונות של ייצוג מוטיב. כל מופע של מוטיב בכל הגנים מופיע עם עמדת מידע "גדיל". תוצאות גרפי בצורה של מפות מוטיב לספק תצוגה ויזואלית, כי קל להבין ומספק דרך אינטואיטיבית לראות דפוסים המוטיבים שנמצאים.
היקף הוא מאוד חזקים לנוכחות של רעש הנתונים. בדרך כלל, זה לובש צורה של גנים נוספים להיות נוכחים בקבוצת המוצא כי לא עשויה למעשה להיות שותף מוסדר עם שאר הגנים. זה קורה לעתים קרובות כאשר מתחילים עם גנים שיתוף לידי ביטוי בניסויים microarray. לפעמים הניסוי היא רועשת, או ייתכנו גורמי תעתוק מספר מופעל על תנאי הניסוי השתמשו לצורך הניסוי microarray. אלה גורמי שעתוק שונים סביר להניח שיש אתרי יעד שונים על ה-DNA. אפילו בנוכחות של פי 4 גנים זרים (רעש: יחס אות 04:01), הוא עדיין שומר על היקף של 50% הדיוק בניבוי אתרים 1.
למרות היקף מכיל מעל 2 מיליון מילים נרדפות לשמות גן, זה לפעמים לא מצליח לזהות כמה שמות הגנים. אנחנו כל הזמן לעדכן את רשימות נרדף שלנו, אבל לפעמים מוצאים מילים נרדפות שונים מתייחסים אותו גן. במקרים אלה, אנו לא כוללים את המילים הנרדפות בשל העמימות. אם יש לך שם הגן לא נמצא על ידי היקף, מומלץ שתפנה לאתר מסוים בגנום למצוא שם הגן חלופה לשימוש בהיקפה. דוגמאות של שמות הגן מתאים לכל מין ניתנים על ידי היקף.
היקף כיום מכיל 72 זנים עם זנים חדשים מתווספים כל הזמן. האתר מכיל וידאו לעזור, כמו גם שאלות נפוצות. קוד המקור שלה זמין בחינם למשתמשים אקדמי על ידי כתיבה RHG.
The authors have nothing to disclose.
מחקר זה מומן על ידי מענק כדי RHG מן הקרן הלאומית למדע, DBI-0445967.