קו ביואינפורמטיקה, כלומר miRDeep-P2 (miRDP2 בקיצור), עם קריטריונים מעודכנים של הצמח Mirdeep ואלגוריתם מקוצר, יכול לנתח באופן מדויק וביעילות מיקרוסקריפט בצמחים, במיוחד עבור מינים עם genomes מורכבים וגדולים.
MicroRNAs (miRNAs) הם 20-עד 24-נוקלאוטיד (nt) RNAs קטנים (sRNAs) הקיימים באופן מקיף בצמחים ובעלי חיים המשחק תפקידים חזקים בוויסות ביטוי הגנים ברמה שלאחר ההמרה. רצפי הספריות sRNA לפי רצף הדור הבא (NGS) שיטות המועסקים באופן נרחב כדי לזהות ולנתח miRNA הטרנססקריפט בעשור האחרון, והתוצאה היא עלייה מהירה של גילוי miRNA. עם זאת, שני אתגרים עיקריים נובעים הביאור miRNA הצמח בשל הגדלת עומק של ספריות sRNA רצף, כמו גם את הגודל והמורכבות של הצמח genomes. ראשון, סוגים רבים אחרים של sRNAs, בפרט, RNAs מתערב קצר (siRNAs) מספריות Srnas, הם מסומן בטעות כמו miRNAs על ידי כלים חישוביים רבים. שנית, זה הופך להיות תהליך רב למדי זמן לניתוח miRNA הטרנססקריפט במינים צמחיים עם genomes גדולים ומורכבים. כדי להתגבר על האתגרים הללו, שודרגו לאחרונה miRDeep-P (כלי פופולרי עבור הפעלת ניתוח Mirdeep) כדי miRDeep-P2 (miRDP2 בקיצור) על-ידי שימוש באסטרטגיית סינון חדשה, בגרירת האלגוריתם הבקיע ושילוב הצמח החדש שעודכן Mirdeep קריטריוני ביאור. בדקנו miRDP2 נגד אוכלוסיות sRNA בחמישה צמחים מייצגים עם הגדלת מורכבות גנומית, כולל Arabidopsis, אורז, עגבניה, תירס וחיטה. התוצאות מעידות על כך שmiRDP2 עיבד משימות אלה ביעילות גבוהה מאוד. בנוסף, miRDP2 ביצעו כלים אחרים חיזוי לגבי רגישות ודיוק. יחד, התוצאות שלנו להפגין miRDP2 ככלי מהיר ומדויק עבור ניתוח הצמח miRNA transcript, ולכן כלי שימושי לסייע לקהילה ביאורים טובים יותר Mirna בצמחים.
אחת התגליות המרגשות ביותר בשני העשורים האחרונים בביולוגיה היא התפקיד המוחלק של מינים sRNA בוויסות פונקציות מגוונות של הגנום1. במיוחד, mirnas מהווה מחלקה חשובה של 20-ל 24-nt srnas ב eukaryotes, ובעיקר לתפקד ברמה post-transcript כמו הרגולטורים גנים בולטים במהלך שלבי פיתוח מחזור חיים, כמו גם בתגובות גירוי וסטרס2,3. ב צמחים, mirnas נובעים התעתיקים העיקריים בשם פרי-mirnas, אשר משותילים בדרך כלל על-ידי RNA פולימראז II כיחידות תמלול בודדות4,5. מעובד על ידי מכונות סלולר שימור אבולוציונית (drosha rnase III ב בעלי חיים, dicer כמו צמחים), פרי-mirnas הם מרוטרים לתוך מיידית precursors מוקדם, pre-mirnas, אשר מכילים רצפים להרכיב גזע פנים מולקולרי מבנים6,7. Pre-mirnas מעובדים מכן לתוך intermediates כפול תקוע, כלומר דופלקסים mirnas, המורכב סטרנד פונקציונלי, בוגרת mirnas, ואת שותף פחות פונקציונלי, mirnas *2,8. לאחר שנטען לתוך מתחם ההשתקה המושרה RNA (risc), mirnas בוגרת יכול לזהות מטרות mrna שלהם מבוסס על משלימה רצף, וכתוצאה מכך פונקציה תקינה שלילית2,8. mirnas יכול לערער את התעתיקים היעד שלהם או למנוע תרגום יעד, אבל הדרך הקודמת נשלטת בצמחים8,9.
מאז התגלית של מירנה הראשונה באתר המלון 10,11, מחקרים רבים כבר מחויבת לזיהוי mirna וניתוח פונקציונלי שלה, במיוחד לאחר הזמינות של שיטת ngs. היישום רחב של שיטת NGS קידם במידה רבה את הניצול של כלים חישוביים שתוכננו ללכוד את התכונה הייחודית של miRNAs, כגון מבנה לולאה גזע של טרום סמנים הצטברות שלהם מועדפים של רצף קורא על Mirnas בוגרת Mirnas *. כתוצאה מכך, החוקרים השיגו הצלחה יוצאת דופן בזיהוי miRNAs במינים שונים. בהתבסס על מודל הסתברות שתוארה בעבר12, פיתחנו Mirdeep-P13, שהיה כלי החישוב הראשון לגילוי mirdeep הצמח מתוך נתונים ngs. mirdeep-P הייתה מיועדת במיוחד לכבוש את האתגרים של פענוח צמח mirdeep שמציעות יותר משתנה באורך מקודparalogous גדול משפחות13,14,15. לאחר השקתו, תוכנית זו כבר הורידה אלפי פעמים והשתמשו כדי להוסיף ביאורים miRNA הטרנססקריפט ביותר מ 40 מינים צמח16. מונעת על ידי כלים מבוססי NGS כמו miRDeep-P, יש כבר עלייה דרמטית במספר של Mirdeep רשום במאגר Mirdeep הציבור Mirdeep17, שם מעל 38,000 מוצרים mirdeep מתארחים כעת (שחרור 22.1) בהשוואה רק ~ 500 פריטים mirdeep (שחרור 2.0) ב 200818.
עם זאת, שני אתגרים חדשים עלו מן הצמח miRNA ביאור. ראשון, היחס הגבוה של שווא-חיוביים השפיעו בכבדות על איכות של צמח mirna ביאורים16,19 מהסיבות הבאות: 1) מבול של rnas קצר הפרעה (sirnas) מ-ngs srna ספריות היו מסומן בטעות כמו mirna בשל חוסר קריטריונים מחמירים mirna ביאור; 2) עבור מינים ללא מידע מירנה פריורי, שווא-תוצאות החזוי בהתבסס על נתוני NGS קשה לחסל. באמצעות miRBase כדוגמה, טיילור ואח ‘20 נמצא שליש של הצמח מירנה ערכים במאגר הציבורי21 (שחרור 21) לא היה משכנע הראיות התומכות אפילו שלושה-ארבעה של משפחות צמח mirbase היו בספק. שנית, זה הופך להיות תהליך רב למדי זמן לחיזוי mirnas צמח עם גנום גדול ומורכב16. כדי להתגבר על האתגרים הללו, התעדכנו miRDeep-P על-ידי הוספת אסטרטגיית סינון חדשה, משיכת יתר של אלגוריתם הניקוד ושילוב קריטריונים חדשים עבור צמח Mirdeep ביאור, ושוחרר גירסה חדשה miRDP2. בנוסף, בדקנו miRDP2 באמצעות NGS sRNA נתונים עם הגדלת בהדרגה הגנום גדלים: Arabidopsis, אורז, עגבניה, תירס וחיטה. לעומת אחרים חמישה כלים בשימוש נרחב הגירסה הישנה שלה, miRDP2 נותחו אלה נתונים sRNA וניתח miRNA ההמרה מהר יותר עם דיוק ורגישות משופרת.
תוכן חבילת miRDP2
חבילת miRDP2 מורכב משש סקריפטים מתועדים Perl כי יש להפעיל ברציפות על ידי סקריפט bash מוכן. מתוך ששת התסריטים, שלושה (convert_bowtie_to_blast. pl, filter_alignments. plו- excise_candidate. pl) עוברים בירושה מ-mirdeep-P. הסקריפטים האחרים משתנים מהגירסה המקורית. פונקציות של ששת הסקריפטים מתוארות בהמשך:
preprocess_reads. pl מסננת קורא, כולל קריאות שארוך מדי או קצר מדי ( 25 nt), וקורא בקורלציה עם רצפי Rfam ncRNA, כמו גם קורא עם RPM (קורא לכל מיליון) פחות מ 5. קובץ ה-script מאחזר קריאות בקורלציה לרצפים מבוגרים ידועים של miRNA. קובצי הקלט הם קריאות מקוריות בתבנית FASTA/FASTQ ו-bowtie2 פלט של קריאות מיפוי לרצפי miRNA ו-ncRNA.
הנוסחה לחישוב סל ד היא כדלקמן:
convert_bowtie_to_blast. pl משנה את תבנית עניבת הקשת לתוך תבנית מנותח הפיצוץ. תבנית שנותחה הפיצוץ היא תבנית מותאמת אישית מופרדת טבלאית הנגזרת מתבנית תקן של NCBI.
filter_alignments. pl מסננת את המערכים של ברצף מעמיק קורא הגנום. הוא מסנן מערכים חלקיים, כמו גם קריאות מיושרות מרובות (סף תדירות שצוין על-ידי המשתמש). הקלט הבסיסי הוא קובץ בתבנית שנותחה הפיצוץ.
excise_candidate. pl גוזר רצפי מספרים פוטנציאליים מרצף התייחסות באמצעות היישור מקריא כהנחיות. הקלט הבסיסי הוא קובץ בתבנית שנותחה הפיצוץ וקובץ FASTA. הפלט הוא כל רצפי מקודמן פוטנציאליים בפורמט FASTA.
mod-miRDP.pl זקוק לשני קבצי קלט, קובץ חתימה מבנה קובץ, אשר שונה מן האלגוריתם mirdeep-P הליבה על ידי שינוי מערכת הניקוד עם פרמטרים מסוימים הצמח. קבצי הקלט הם קובץ מבנה המבנה הקודמי וקורא קובץ חתימת הפצה.
mod-rm_redundant_meet_plant. pl זקוק לשלושה קבצי קלט: chromosome_length, סמנים מוקדמים וoriginal_prediction שנוצרו על-ידי mod-miRDP.pl. הוא מייצר שני קבצי פלט, קובץ חזוי שאינם יתירים קובץ החזוי מסוננים על ידי החדש העדכון קריטריונים miRNA הצמח. פרטים על תבנית קובץ הפלט מתוארים בסעיף 1.4.
עם הופעתו של ngs, מספר גדול של מירנה מקום זוהו מתוך כמות גוברת של רצף נתונים של srna במינים שונים29,30. במסד הנתונים הקהילתי מרוכז miRBase21, הפריטים mirbase הופקד גדל כמעט 100 פעמים בעשור האחרון. עם זאת, בהשוואה mirnas בעלי חיים, צמח mirnas יש תכונות ייחודיות רבות העו…
The authors have nothing to disclose.
עבודה זו נתמכת על ידי בייג האקדמיה לחקלאות יערנות מדעי (KJCX201917, KJCX20180425, ו KJCX20180204) ל-XY ולאומי המדע הטבעי הקרן של סין (31621001) ל-LL.
Computer/computing node | N/A | N/A | Perl is required; at least 8 GB RAM and 100 GB storage are recommended |