Summary

צינור ביואינפורמטיקה לנתח באופן מדויק ויעיל את המייקרואורפה בצמחים

Published: January 21, 2020
doi:

Summary

קו ביואינפורמטיקה, כלומר miRDeep-P2 (miRDP2 בקיצור), עם קריטריונים מעודכנים של הצמח Mirdeep ואלגוריתם מקוצר, יכול לנתח באופן מדויק וביעילות מיקרוסקריפט בצמחים, במיוחד עבור מינים עם genomes מורכבים וגדולים.

Abstract

MicroRNAs (miRNAs) הם 20-עד 24-נוקלאוטיד (nt) RNAs קטנים (sRNAs) הקיימים באופן מקיף בצמחים ובעלי חיים המשחק תפקידים חזקים בוויסות ביטוי הגנים ברמה שלאחר ההמרה. רצפי הספריות sRNA לפי רצף הדור הבא (NGS) שיטות המועסקים באופן נרחב כדי לזהות ולנתח miRNA הטרנססקריפט בעשור האחרון, והתוצאה היא עלייה מהירה של גילוי miRNA. עם זאת, שני אתגרים עיקריים נובעים הביאור miRNA הצמח בשל הגדלת עומק של ספריות sRNA רצף, כמו גם את הגודל והמורכבות של הצמח genomes. ראשון, סוגים רבים אחרים של sRNAs, בפרט, RNAs מתערב קצר (siRNAs) מספריות Srnas, הם מסומן בטעות כמו miRNAs על ידי כלים חישוביים רבים. שנית, זה הופך להיות תהליך רב למדי זמן לניתוח miRNA הטרנססקריפט במינים צמחיים עם genomes גדולים ומורכבים. כדי להתגבר על האתגרים הללו, שודרגו לאחרונה miRDeep-P (כלי פופולרי עבור הפעלת ניתוח Mirdeep) כדי miRDeep-P2 (miRDP2 בקיצור) על-ידי שימוש באסטרטגיית סינון חדשה, בגרירת האלגוריתם הבקיע ושילוב הצמח החדש שעודכן Mirdeep קריטריוני ביאור. בדקנו miRDP2 נגד אוכלוסיות sRNA בחמישה צמחים מייצגים עם הגדלת מורכבות גנומית, כולל Arabidopsis, אורז, עגבניה, תירס וחיטה. התוצאות מעידות על כך שmiRDP2 עיבד משימות אלה ביעילות גבוהה מאוד. בנוסף, miRDP2 ביצעו כלים אחרים חיזוי לגבי רגישות ודיוק. יחד, התוצאות שלנו להפגין miRDP2 ככלי מהיר ומדויק עבור ניתוח הצמח miRNA transcript, ולכן כלי שימושי לסייע לקהילה ביאורים טובים יותר Mirna בצמחים.

Introduction

אחת התגליות המרגשות ביותר בשני העשורים האחרונים בביולוגיה היא התפקיד המוחלק של מינים sRNA בוויסות פונקציות מגוונות של הגנום1. במיוחד, mirnas מהווה מחלקה חשובה של 20-ל 24-nt srnas ב eukaryotes, ובעיקר לתפקד ברמה post-transcript כמו הרגולטורים גנים בולטים במהלך שלבי פיתוח מחזור חיים, כמו גם בתגובות גירוי וסטרס2,3. ב צמחים, mirnas נובעים התעתיקים העיקריים בשם פרי-mirnas, אשר משותילים בדרך כלל על-ידי RNA פולימראז II כיחידות תמלול בודדות4,5. מעובד על ידי מכונות סלולר שימור אבולוציונית (drosha rnase III ב בעלי חיים, dicer כמו צמחים), פרי-mirnas הם מרוטרים לתוך מיידית precursors מוקדם, pre-mirnas, אשר מכילים רצפים להרכיב גזע פנים מולקולרי מבנים6,7. Pre-mirnas מעובדים מכן לתוך intermediates כפול תקוע, כלומר דופלקסים mirnas, המורכב סטרנד פונקציונלי, בוגרת mirnas, ואת שותף פחות פונקציונלי, mirnas *2,8. לאחר שנטען לתוך מתחם ההשתקה המושרה RNA (risc), mirnas בוגרת יכול לזהות מטרות mrna שלהם מבוסס על משלימה רצף, וכתוצאה מכך פונקציה תקינה שלילית2,8. mirnas יכול לערער את התעתיקים היעד שלהם או למנוע תרגום יעד, אבל הדרך הקודמת נשלטת בצמחים8,9.

מאז התגלית של מירנה הראשונה באתר המלון 10,11, מחקרים רבים כבר מחויבת לזיהוי mirna וניתוח פונקציונלי שלה, במיוחד לאחר הזמינות של שיטת ngs. היישום רחב של שיטת NGS קידם במידה רבה את הניצול של כלים חישוביים שתוכננו ללכוד את התכונה הייחודית של miRNAs, כגון מבנה לולאה גזע של טרום סמנים הצטברות שלהם מועדפים של רצף קורא על Mirnas בוגרת Mirnas *. כתוצאה מכך, החוקרים השיגו הצלחה יוצאת דופן בזיהוי miRNAs במינים שונים. בהתבסס על מודל הסתברות שתוארה בעבר12, פיתחנו Mirdeep-P13, שהיה כלי החישוב הראשון לגילוי mirdeep הצמח מתוך נתונים ngs. mirdeep-P הייתה מיועדת במיוחד לכבוש את האתגרים של פענוח צמח mirdeep שמציעות יותר משתנה באורך מקודparalogous גדול משפחות13,14,15. לאחר השקתו, תוכנית זו כבר הורידה אלפי פעמים והשתמשו כדי להוסיף ביאורים miRNA הטרנססקריפט ביותר מ 40 מינים צמח16. מונעת על ידי כלים מבוססי NGS כמו miRDeep-P, יש כבר עלייה דרמטית במספר של Mirdeep רשום במאגר Mirdeep הציבור Mirdeep17, שם מעל 38,000 מוצרים mirdeep מתארחים כעת (שחרור 22.1) בהשוואה רק ~ 500 פריטים mirdeep (שחרור 2.0) ב 200818.

עם זאת, שני אתגרים חדשים עלו מן הצמח miRNA ביאור. ראשון, היחס הגבוה של שווא-חיוביים השפיעו בכבדות על איכות של צמח mirna ביאורים16,19 מהסיבות הבאות: 1) מבול של rnas קצר הפרעה (sirnas) מ-ngs srna ספריות היו מסומן בטעות כמו mirna בשל חוסר קריטריונים מחמירים mirna ביאור; 2) עבור מינים ללא מידע מירנה פריורי, שווא-תוצאות החזוי בהתבסס על נתוני NGS קשה לחסל. באמצעות miRBase כדוגמה, טיילור ואח ‘20 נמצא שליש של הצמח מירנה ערכים במאגר הציבורי21 (שחרור 21) לא היה משכנע הראיות התומכות אפילו שלושה-ארבעה של משפחות צמח mirbase היו בספק. שנית, זה הופך להיות תהליך רב למדי זמן לחיזוי mirnas צמח עם גנום גדול ומורכב16. כדי להתגבר על האתגרים הללו, התעדכנו miRDeep-P על-ידי הוספת אסטרטגיית סינון חדשה, משיכת יתר של אלגוריתם הניקוד ושילוב קריטריונים חדשים עבור צמח Mirdeep ביאור, ושוחרר גירסה חדשה miRDP2. בנוסף, בדקנו miRDP2 באמצעות NGS sRNA נתונים עם הגדלת בהדרגה הגנום גדלים: Arabidopsis, אורז, עגבניה, תירס וחיטה. לעומת אחרים חמישה כלים בשימוש נרחב הגירסה הישנה שלה, miRDP2 נותחו אלה נתונים sRNA וניתח miRNA ההמרה מהר יותר עם דיוק ורגישות משופרת.

תוכן חבילת miRDP2
חבילת miRDP2 מורכב משש סקריפטים מתועדים Perl כי יש להפעיל ברציפות על ידי סקריפט bash מוכן. מתוך ששת התסריטים, שלושה (convert_bowtie_to_blast. pl, filter_alignments. plו- excise_candidate. pl) עוברים בירושה מ-mirdeep-P. הסקריפטים האחרים משתנים מהגירסה המקורית. פונקציות של ששת הסקריפטים מתוארות בהמשך:

preprocess_reads. pl מסננת קורא, כולל קריאות שארוך מדי או קצר מדי ( 25 nt), וקורא בקורלציה עם רצפי Rfam ncRNA, כמו גם קורא עם RPM (קורא לכל מיליון) פחות מ 5. קובץ ה-script מאחזר קריאות בקורלציה לרצפים מבוגרים ידועים של miRNA. קובצי הקלט הם קריאות מקוריות בתבנית FASTA/FASTQ ו-bowtie2 פלט של קריאות מיפוי לרצפי miRNA ו-ncRNA.

הנוסחה לחישוב סל ד היא כדלקמן:

Equation 1

convert_bowtie_to_blast. pl משנה את תבנית עניבת הקשת לתוך תבנית מנותח הפיצוץ. תבנית שנותחה הפיצוץ היא תבנית מותאמת אישית מופרדת טבלאית הנגזרת מתבנית תקן של NCBI.

filter_alignments. pl מסננת את המערכים של ברצף מעמיק קורא הגנום. הוא מסנן מערכים חלקיים, כמו גם קריאות מיושרות מרובות (סף תדירות שצוין על-ידי המשתמש). הקלט הבסיסי הוא קובץ בתבנית שנותחה הפיצוץ.

excise_candidate. pl גוזר רצפי מספרים פוטנציאליים מרצף התייחסות באמצעות היישור מקריא כהנחיות. הקלט הבסיסי הוא קובץ בתבנית שנותחה הפיצוץ וקובץ FASTA. הפלט הוא כל רצפי מקודמן פוטנציאליים בפורמט FASTA.

mod-miRDP.pl זקוק לשני קבצי קלט, קובץ חתימה מבנה קובץ, אשר שונה מן האלגוריתם mirdeep-P הליבה על ידי שינוי מערכת הניקוד עם פרמטרים מסוימים הצמח. קבצי הקלט הם קובץ מבנה המבנה הקודמי וקורא קובץ חתימת הפצה.

mod-rm_redundant_meet_plant. pl זקוק לשלושה קבצי קלט: chromosome_length, סמנים מוקדמים וoriginal_prediction שנוצרו על-ידי mod-miRDP.pl. הוא מייצר שני קבצי פלט, קובץ חזוי שאינם יתירים קובץ החזוי מסוננים על ידי החדש העדכון קריטריונים miRNA הצמח. פרטים על תבנית קובץ הפלט מתוארים בסעיף 1.4.

Protocol

1. התקנה ובדיקה הורד את יחסי התלות הדרושים: Bowtie222 ו-RNAfold23. מומלץ לעשות חבילות שעברו קומפילציה. הורד Bowtie2, כלי מיפוי קריאה, מהאתר הביתי שלה (http://bowtie-bio.sourceforge.net/bowtie2/index.shtml). הורד RNAfold, כלי של חבילת וינה המשמש ל?…

Representative Results

צינור הביאור mirna, miRDP2, תיאר בזאת מוחל על 10 הציבור srna-seq ספריות מ 5 מינים צמח עם אורך הגנום גדל בהדרגה, כולל arabidopsis thaliana, oryza סאטיבה (אורז), solanum lycopersicum (עגבניה), zea מייז (תירס) ו triticum חיטת (באיור 1א באופן כללי, לכל מין, 2 ספריות sRNA מייצגות מרקמות שונות (…

Discussion

עם הופעתו של ngs, מספר גדול של מירנה מקום זוהו מתוך כמות גוברת של רצף נתונים של srna במינים שונים29,30. במסד הנתונים הקהילתי מרוכז miRBase21, הפריטים mirbase הופקד גדל כמעט 100 פעמים בעשור האחרון. עם זאת, בהשוואה mirnas בעלי חיים, צמח mirnas יש תכונות ייחודיות רבות העו…

Disclosures

The authors have nothing to disclose.

Acknowledgements

עבודה זו נתמכת על ידי בייג האקדמיה לחקלאות יערנות מדעי (KJCX201917, KJCX20180425, ו KJCX20180204) ל-XY ולאומי המדע הטבעי הקרן של סין (31621001) ל-LL.

Materials

Computer/computing node N/A N/A Perl is required; at least 8 GB RAM and 100 GB storage are recommended

References

  1. Ghildiyal, M., Zamore, P. D. Small silencing RNAs: an expanding universe. Nature Reviews Genetics. 10 (2), 94-108 (2009).
  2. Bartel, D. P. MicroRNAs: target recognition and regulatory functions. Cell. 136 (2), 215-233 (2009).
  3. Moran, Y., Agron, M., Praher, D., Technau, U. The evolutionary origin of plant and animal microRNAs. Nature Ecology Evolution. 1 (3), 27 (2017).
  4. Xie, Z., et al. Expression of Arabidopsis MIRNA genes. Plant Physiology. 138 (4), 2145-2154 (2005).
  5. Zhao, X., Zhang, H., Li, L. Identification and analysis of the proximal promoters of microRNA genes in Arabidopsis. Genomics. 101 (3), 187-194 (2013).
  6. Bologna, N. G., Mateos, J. L., Bresso, E. G., Palatnik, J. F. A loop-to-base processing mechanism underlies the biogenesis of plant microRNAs miR319 and miR159. EMBO JOURNAL. 28 (23), 3646-3656 (2009).
  7. Rogers, K., Chen, X. Biogenesis, turnover, and mode of action of plant microRNAs. Plant Cell. 25 (7), 2383-2399 (2013).
  8. Voinnet, O. Origin, biogenesis, and activity of plant microRNAs. Cell. 136 (4), 669-687 (2009).
  9. Iwakawa, H. O., Tomari, Y. The Functions of MicroRNAs: mRNA Decay and Translational Repression. Trends in Cell Biology. 25 (11), 651-665 (2015).
  10. Lee, R. C., Feinbaum, R. L., Ambros, V. The C. elegans heterochronic gene lin-4 encodes small RNAs with antisense complementarity to lin-14. Cell. 75 (5), 843-854 (1993).
  11. Wightman, B., Ha, I., Ruvkun, G. Posttranscriptional regulation of the heterochronic gene lin-14 by lin-4 mediates temporal pattern formation in C. elegans. Cell. 75 (5), 855-862 (1993).
  12. Friedlander, M. R., et al. Discovering microRNAs from deep sequencing data using miRDeep. Nature Biotechnology. 26 (4), 407-415 (2008).
  13. Yang, X., Li, L. miRDeep-P: a computational tool for analyzing the microRNA transcriptome in plants. Bioinformatics. 27 (18), 2614-2615 (2011).
  14. Meyers, B. C., et al. Criteria for annotation of plant MicroRNAs. Plant Cell. 20 (12), 3186-3190 (2008).
  15. Yang, X., Zhang, H., Li, L. Global analysis of gene-level microRNA expression in Arabidopsis using deep sequencing data. Genomics. 98 (1), 40-46 (2011).
  16. Kuang, Z., Wang, Y., Li, L., Yang, X. miRDeep-P2: accurate and fast analysis of the microRNA transcriptome in plants. Bioinformatics. , (2018).
  17. Kozomara, A., Birgaoanu, M., Griffiths-Jones, S. miRBase: from microRNA sequences to function. Nucleic Acids Research. 47 (1), 155-162 (2019).
  18. Griffiths-Jones, S., Saini, H. K., van Dongen, S., Enright, A. J. miRBase: tools for microRNA genomics. Nucleic Acids Research. 36, 154-158 (2008).
  19. Axtell, M. J., Meyers, B. C. Revisiting Criteria for Plant MicroRNA Annotation in the Era of Big Data. Plant Cell. 30 (2), 272-284 (2018).
  20. Taylor, R. S., Tarver, J. E., Hiscock, S. J., Donoghue, P. C. Evolutionary history of plant microRNAs. Trends in Plant Science. 19 (3), 175-182 (2014).
  21. Kozomara, A., Griffiths-Jones, S. miRBase: annotating high confidence microRNAs using deep sequencing data. Nucleic Acids Research. 42, 68-73 (2014).
  22. Langmead, B., Salzberg, S. L. Fast gapped-read alignment with Bowtie 2. Nature Methods. 9 (4), 357-359 (2012).
  23. Lorenz, R., et al. ViennaRNA Package 2.0. Algorithms for Molecular Biology. 6, 26 (2011).
  24. Langmead, B., Trapnell, C., Pop, M., Salzberg, S. L. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biology. 10 (3), 25 (2009).
  25. An, J., Lai, J., Sajjanhar, A., Lehman, M. L., Nelson, C. C. miRPlant: an integrated tool for identification of plant miRNA from RNA sequencing data. BMC Bioinformatics. 15, 275 (2014).
  26. Lei, J., Sun, Y. miR-PREFeR: an accurate, fast and easy-to-use plant miRNA prediction tool using small RNA-Seq data. Bioinformatics. 30 (19), 2837-2839 (2014).
  27. Evers, M., Huttner, M., Dueck, A., Meister, G., Engelmann, J. C. miRA: adaptable novel miRNA identification in plants using small RNA sequencing data. BMC Bioinformatics. 16, 370 (2015).
  28. Mathelier, A., Carbone, A. MIReNA: finding microRNAs with high accuracy and no learning at genome scale and from deep sequencing data. Bioinformatics. 26 (18), 2226-2234 (2010).
  29. Zhu, Q. H., et al. A diverse set of microRNAs and microRNA-like small RNAs in developing rice grains. Genome Research. 18 (9), 1456-1465 (2008).
  30. Fahlgren, N., et al. MicroRNA gene evolution in Arabidopsis lyrata and Arabidopsis thaliana. Plant Cell. 22 (4), 1074-1089 (2010).
  31. Fromm, B., et al. A Uniform System for the Annotation of Vertebrate microRNA Genes and the Evolution of the Human microRNAome. Annual Review of Genetics. 49, 213-242 (2015).
  32. Blevins, T., et al. Identification of Pol IV and RDR2-dependent precursors of 24 nt siRNAs guiding de novo DNA methylation in Arabidopsis. Elife. 4, 09591 (2015).
  33. Zhai, J., et al. A One Precursor One siRNA Model for Pol IV-Dependent siRNA Biogenesis. Cell. 163 (2), 445-455 (2015).
  34. Werner, S., Wollmann, H., Schneeberger, K., Weigel, D. Structure determinants for accurate processing of miR172a in Arabidopsis thaliana. Current Biology. 20 (1), 42-48 (2010).
  35. Mateos, J. L., Bologna, N. G., Chorostecki, U., Palatnik, J. F. Identification of microRNA processing determinants by random mutagenesis of Arabidopsis MIR172a precursor. Current Biology. 20 (1), 49-54 (2010).
  36. Vitsios, D. M., et al. Mirnovo: genome-free prediction of microRNAs from small RNA sequencing data and single-cells using decision forests. Nucleic Acids Research. 45 (21), 177 (2017).

Play Video

Cite This Article
Wang, Y., Kuang, Z., Li, L., Yang, X. A Bioinformatics Pipeline to Accurately and Efficiently Analyze the MicroRNA Transcriptomes in Plants. J. Vis. Exp. (155), e59864, doi:10.3791/59864 (2020).

View Video