Summary

גילוי רצף הרומן מאת גנומיקה מופחתים

Published: January 25, 2019
doi:

Summary

המטרה של פרוטוקול זה היא להשתמש שילוב של חישובית ומחקר ספסל למצוא רצפי חדשניים אשר לא ניתן להפריד בקלות בין רצף טיהור משותף, אשר עשוי להיות מוכר באופן חלקי בלבד.

Abstract

גנומיקה מופחתים ניתן להשתמש במחקר כלשהו שבו המטרה היא לזהות את הרצף של גנים, חלבונים או אזור כללי שמוטבעת בתוך הקשר גנומית גדול. גנומיקה מופחתים מאפשר חוקר לבודד המטרה רצף של עניין (T) על ידי רצף מקיף ומחסר החוצה מרכיבים גנטיים מוכרים (הפניה, R). השיטה יכולה לשמש לזיהוי רצפים הרומן המיטוכונדריה, מהכלורופלסט, וירוסים, או germline מוגבלת כרומוזומים, יעיל במיוחד כאשר T לא יכול להיות בקלות מבודד מ ר מתחיל עם הנתונים גנומית מקיף (R + T), השיטה משתמש בסיסי מקומי יישור חיפוש כלי (פיצוץ) נגד רצף הפניה או רצפים, כדי להסיר את התאמת ידועים רצפי (R), משאיר מאחור את המטרה (T). עבור חיסור לפעול בצורה הטובה ביותר, R צריך להיות טיוטה שלמה יחסית שחסרה לו ט מאז רצפים שנותרו לאחר חיסור נבדקים דרך כמותיים תגובת שרשרת פולימראזית (qPCR), R לא צריך להיות מושלם. שיטת העבודה. כאן אנחנו קישור צעדים חישובית עם מדרגות ניסיוני לתוך מחזור זה יכול להיות iterated בהתאם לצורך, ברצף הסרת מספר רצפי הפניה וכוונון החיפוש אחר טי היתרון של גנומיקה מופחתים הוא כי ברצף ולחלוטין היעד ניתן לזהות אפילו במקרים שבהם טיהור פיזית קשה, בלתי אפשרי או יקר. החיסרון של השיטה הוא מציאת הפניה מתאימה עבור חיסור וקבלת T-חיובי ושלילי דגימות לבדיקת qPCR. אנו מתארים שלנו ויישום שיטת הזיהוי של הגן הראשון של כרומוזום germline מוגבלת של זברה פינק. במקרה זה סינון חישובית מעורב 3 הפניות (R), ברצף להסיר מעל בשלושה מחזורים: מכלול לא שלם גנומית, הנתונים הגולמיים גנומית, ונתונים transcriptomic.

Introduction

מטרת שיטה זו הוא לזהות של הרומן היעד (T) רצף גנומית, DNA או RNA, ההקשר גנומית, או הפניה (R) (איור 1). השיטה זו שימושית במיוחד אם היעד לא יכולה להיות מופרדים פיזית, או שזה יהיה יקר לעשות זאת. רק כמה אורגניזמים לחלוטין סיימו את הגנום עבור חיסור, אז חידוש מפתח בשיטה שלנו היא שילוב של חישובית של השיטות הספסל לתוך מעגל הפעלת חוקרים לבודד המטרה רצפים כאשר ההפניה היא פגומה, או טיוטה הגנום של אורגניזם שאינו-מודל. בסוף מחזור, בדיקות qPCR משמש כדי לקבוע אם יש צורך חיסור נוסף. רצף המאומת המועמד T יראה זיהוי סטטיסטית בדגימות T-חיוביות מוכרות על-ידי qPCR.

גלגולים של השיטה יושמו גילוי חדש חיידקי סמים מטרות שאין המארח homologs1,2,3,4 , זיהוי של וירוסים הרומן לנשאים נגועים 5,6. בנוסף זיהוי של T, השיטה יכול לשפר את r: לאחרונה השתמשנו בשיטת לזהות גנים חסרים 936 מן הגנום הפניה זברה פינק גן חדש של כרומוזום germline בלבד (T)7. גנומיקה מופחתים הוא יקר במיוחד כאשר T צפוי להיות מאוד מתפצלת של רצפי ידוע, או כאשר זהותו של T אינה מוגדרת בהרחבה, כמו זברה פינק מוגבלת germline כרומוזום7.

ואחרת לא זיהוי חיובי של T מראש, יתרון מפתח של מופחתים גנומיקה היא שזה לא משוחדת. במחקר שנערך לאחרונה, Readhead. ואח בדק את הקשר בין מחלת אלצהיימר ושפע ויראלית באזורים במוח ארבעה. עבור זיהוי ויראלי, Readhead. et al. ליצור מסד נתונים של וירוסים 5158, מגבילה מאוד את הסוכנים ויראלי המחקר שלהם שיכול לזהות. גנומיקה מופחתים יכול שימשו כדי להשוות בין הבריאים ואת הגנום אלצהיימר על מנת לבודד וירוסים הרומן הקשורים במחלה, ללא קשר הדמיון שלהם לגורמי ידוע. אמנם ישנם וירוסים פילוח האדם מוכרים 263, ההערכה היא כי כ 1.67 מיליון שעדיין לא התגלו מינים ויראלי קיימים, עם 631,000-827,000 מהם יש אפשרות להדביק בני אדם9.

בידוד של וירוסים הרומן הוא אזור שבו מופחתים גנומיקה יעיל במיוחד, אך מחקרים ייתכן שלא תזדקק השיטה מחמירים. לדוגמה, מחקרים זיהוי וירוסים הרומן השתמשו מוטים רצף תפוקה גבוהה ואחריו שעתוק במהופך, BLASTx עבור רצפי ויראלי5 או העשרה של חומצות גרעין נגיפיות כדי לחלץ ולהפוך לתמלל ויראלי רצפים 6. בעוד מחקרים אלה המועסקים דה נובו רצף והרכבה, חיסור לא שימש כי הרצפים היעד זוהו באופן חיובי באמצעות פיצוץ. אם וירוסים ולחלוטין, לא קשורים (או קרובים רחוקים) וירוסים אחרים, גנומיקה מופחתים היה טכניקה שימושית. היתרון של גנומיקה מופחתים הוא כי ניתן להשיג רצפי אשר הינם חדשים לחלוטין. אם הגנום של האורגניזם ידוע, זה ניתן להפחית לעזוב כל רצפי ויראלי. כך למשל, במחקר שפורסם שלנו בודדנו רצף ויראלי הרומן של זברה פינק באמצעות גנומיקה מופחתים, למרות שזה לא כוונה המקורי שלנו7.

גנומיקה מופחתים גם הוכיח שימושי בזיהוי מטרות חיסון חיידקי, מוטיבציה מאת לעליה דרמטית עמידות לאנטיביוטיקה1,2,3,4. כדי למזער את הסיכון של תגובה אוטואימונית, חוקרים צמצמתי את מטרות אפשריות של החיסון על-ידי חיסור כל החלבונים שיש homologs לארח אדם. מחקר אחד מסוים, מסתכלים על Corynebacterium pseudotuberculosis, ביצע חיסור של הגנום מארח חוליות מן הגנום חיידקית מספר כדי להבטיח אפשרי סמים מטרות לא ישפיע על חלבונים ב המארחים שמוביל לתופעות לוואי 1. תהליך עבודה בסיסי של מחקרים אלה היא להוריד את פרוטאום חיידקי, לקבוע חלבונים חיוניים, להסיר חלבונים יתיר, השתמש BLASTp כדי לבודד את החלבונים חיוניים, BLASTp נגד פרוטאום המארח כדי להסיר את כל החלבונים עם המארח homologs 1 , 2 , 3 , 4. במקרה זה, גנומיקה מופחתים להבטיח כי החיסונים פיתחו לא יהיו תופעות את המטרה מארח1,2,3,4.

השתמשנו גנומיקה מופחתים כדי לזהות את הגן הראשון חלבונים על מוגבלת germline כרומוזום (GRC) (במקרה זה, T), הנמצא germlines אבל לא סומאטית רקמות של שני המינים10. לפני במחקר זה, המידע רק גנומית היה ידוע אודות למרפאה היה אזור החוזרות על עצמן11. דה נובו ההרכבה בוצעה ב- RNA וסודרו מן השחלה ואת teste רקמות (R + T) מן הפרושים זברה למבוגרים. חיסול חישובית של רצפי התבצע בעזרת שפורסמו סומאטית (שריר) הגנום רצף (R1)12, שלו raw (סנגר) לקרוא נתונים (R2), transcriptome (R3) סומאטית (המוח)13. שימוש רציף ושלוש הפניות הסיע את qPCR בדיקות בשלב 5 של כל מחזור (איור 2א), מראה כי סינון נוסף היה נדרש. הגן α-SNAP שהתגלו אושר דרך qPCR של ה-DNA ו- RNA, ו שיבוט רצף. אנחנו מראים בדוגמה שלנו כי שיטה זו היא גמישה: זה לא תלויה התאמת חומצות גרעין (DNA לעומת ה-RNA), ניתן לבצע את החיסור הפניות (R) מורכבות של הרכבות או קריאות raw.

Protocol

1. דה נובו להרכיב מתחיל רצף הערה: נתונים הדור הבא ברצף (הגדרות) יכול לשמש, כל עוד הרכבה ניתן להפיק את הנתונים האלה. נתוני קלט מתאים כולל אילומינה, PacBio, או Nanopore אוקספורד הקראה התאספו לתוך קובץ fasta. עבור קונקרטיות, סעיף זה מתאר הרכבה transcriptomic מבוססי אילומינה ספיציפית המחקר זברה…

Representative Results

לאחר הפעלת הפיצוץ, קובץ הפלט יהיה רשימה של רצפי מהשאילתה התואמות במסד הנתונים. לאחר חיסור פיתון, מספר רצפי צורות להיות מושגת, ונבדק על ידי qPCR. התוצאות של זה, ואת השלבים הבאים, נדונים להלן. שלילי התוצאה. ישנן שתי תוצאות שליליות אפשר?…

Discussion

בעוד גנומיקה מופחתים הוא רב עוצמה, זה לא בגישה לשירי, המחייב התאמה אישית מספר השלבים החשובים, וכן בחירה זהירה של רצפי הפניה ודוגמאות מבחן. אם מכלול שאילתה באיכות ירודה, סינון צעדים אולי רק לבודד חפצים הרכבה. לכן, חשוב יסודי לאמת את מכלול דה נובו באמצעות פרוטוקול האימות המתאים לפרוייקט ?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

המחברים להכיר מישל בידרמן, אליסה פדרסן, קולין. ג’יי Saldanha לסיוע שלהם עם הפרויקט גנומיקה זברה פינק בשלבים שונים. אנו גם להכיר יבגני Bisk עבור מחשוב ניהול המערכת אשכול ואת NIH גרנט 1K22CA184297 (ל J.R.B.) NIH NS 042767 (ל C.J.S).

Materials

Accustart II Taq DNA Polymerase Quanta Bio 95141
Blasic Local Alignment Search Tool (BLAST) https://github.com/trinityrnaseq/trinityrnaseq/wiki/Transcriptome-Assembly-Quality-Assessment
Bowtie 2 https://www.python.org/download/releases/2.7/
BWA-MEM v. 0.7.12 https://github.com/BenLangmead/bowtie2
Geneious https://blast.ncbi.nlm.nih.gov/Blast.cgi
PEAR v. 0.9.6 http://www.mybiosoftware.com/reptile-1-1-short-read-error-correction.html
Personal Computer Biomatters http://www.geneious.com/
PowerSYBR qPCR mix ThermoFisher 4367659
Python v. 2.7 https://sco.h-its.org/exelixis/web/software/pear/
Reptile v.1.1 https://alurulab.cc.gatech.edu/reptile
Stratagene Mx3005P Agilent Technologies 401456
TransDecoder v. 3.0.1 https://sourceforge.net/projects/bio-bwa/files/
Trinity v. 2.4.0 https://github.com/TransDecoder/TransDecoder/wiki

References

  1. Barh, D., et al. A Novel Comparative Genomics Analysis for Common Drug and Vaccine Targets in Corynebacterium pseudotuberculosis and other CMN Group of Human Pathogens. Chemical Biology & Drug Design. 78 (1), 73-84 (2011).
  2. Sarangi, A. N., Aggarwal, R., Rahman, Q., Trivedi, N. Subtractive Genomics Approach for in Silico Identification and Characterization of Novel Drug Targets in Neisseria Meningitides Serogroup B. Journal of Computer Science & Systems Biology. 2 (5), (2009).
  3. Kaur, N., et al. Identification of Druggable Targets for Acinetobacter baumannii Via Subtractive Genomics and Plausible Inhibitors for MurA and MurB. Applied Biochemistry and Biotechnology. 171 (2), 417-436 (2013).
  4. Rathi, B., Sarangi, A. N., Trivedi, N. Genome subtraction for novel target definition in Salmonella typhi. Bioinformation. 4 (4), 143-150 (2009).
  5. Epstein, J. H., et al. Identification of GBV-D, a Novel GB-like Flavivirus from Old World Frugivorous Bats (Pteropus giganteus) in Bangladesh. PLoS Pathogens. 6 (7), (2010).
  6. Kapoor, A., et al. Identification of Rodent Homologs of Hepatitis C Virus and Pegiviruses. MBio. 4 (2), (2013).
  7. Biederman, M. K., et al. Discovery of the First Germline-Restricted Gene by Subtractive Transcriptomic Analysis in the Zebra Finch, Taeniopygia guttata. Current Biology. 28 (10), 1620-1627 (2018).
  8. Readhead, B., et al. Multiscale Analysis of Independent Alzheimer’s Cohorts Finds Disruption of Molecular, Genetic, and Clinical Networks by Human Herpesvirus. Neuron. 99, 1-19 (2018).
  9. Carroll, D., et al. The global virome project. Science. 359 (6378), 872-874 (2016).
  10. Pigozzi, M. I., Solari, A. J. Germ cell restriction and regular transmission of an accessory chromosome that mimics a sex body in the zebra finch. Taeniopygia guttata. Chromosome Research. 6, 105-113 (1998).
  11. Itoh, Y., Kampf, K., Pigozzi, M. I., Arnold, A. P. Molecular cloning and characterization of the germline-restricted chromosome sequence in the zebra finch. Chromosoma. 118, 527-536 (2009).
  12. Warren, W. C., et al. The genome of a songbird. Nature. 464, 757-762 (2010).
  13. Balakrishnan, C. N., Lin, Y. C., London, S. E., Clayton, D. F. RNAseq transcriptome analysis of male and female zebra finch cell lines. Genomics. 100, 363-369 (2012).
  14. Bolger, A. M., Lohse, M., Usadel, B. Trimmomatic: a flexible trimmer for Illumina sequence data. Bioinformatics. 30 (15), 2114-2120 (2014).
  15. Zhang, J., Kobert, K., Flouri, T., Stamatakis, A. PEAR: a fast and accurate Illumina Paired-End reAd mergeR. Bioinformatics. 30, 614-620 (2014).
  16. Yang, X., Dorman, K. S., Aluru, S. Reptile: representative tiling for short read error correction. Bioinformatics. 26, 2526-2533 (2010).
  17. MacManes, M. D., Eisen, M. B. Improving transcriptome assembly through error correction of high-throughput sequence reads. PeerJ. 1 (113), (2013).
  18. Grabherr, M. G., et al. Full-length transcriptome assembly from RNA-seq data without a reference genome. Nature Biotechnology. 29, 644-652 (2011).
  19. Li, H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv. , (2013).
  20. Langmead, B., Salzberg, S. Fast gapped-read alignment with Bowtie 2. Nature Methods. 9, 357-359 (2012).
  21. Kearse, M., et al. Geneious Basic: an integrated and extendable desktop software platform for the organization and analysis of sequence data. Bioinformatics. 28 (12), 1647-1649 (2012).
  22. Peirson, S. N., Butler, J. N. Quantitative polymerase chain reaction. Methods in Molecular Biology. 362, 349-362 (2007).
  23. Hunt, M., Kikuchi, T., Sanders, M., Newbold, C., Berriman, M., Otto, T. D. REAPR citation: REAPR: a universal tool for genome assembly evaluation. Genome Biology. 14 (5), (2013).
  24. Meyer, M., et al. A mitochondrial genome sequence of a hominin from Sima de los Huesos. Nature. 505 (7483), 403-406 (2013).
  25. Gunnarsdóttir, E. D., Li, M., Bauchet, M., Finstermeier, K., Stoneking, M. High-throughput sequencing of complete human mtDNA genomes from the Philippines. Genome Research. 21 (1), 1-11 (2010).
  26. King, J. L., et al. High-quality and high-throughput massively parallel sequencing of the human mitochondrial genome using the Illumina MiSeq. Forensic Science International: Genetics. 12, 128-135 (2014).
  27. Yao, X., et al. The First Complete Chloroplast Genome Sequences in Actinidiaceae: Genome Structure and Comparative Analysis. Plos One. 10 (6), (2015).
  28. Zhang, Y., et al. The Complete Chloroplast Genome Sequences of Five Epimedium Species: Lights into Phylogenetic and Taxonomic Analyses. Frontiers in Plant Science. 7, (2016).
  29. Swart, E. C., et al. The Oxytricha trifallax Mitochondrial Genome. Genome Biologyogy and Evolution. 4 (2), 136-154 (2011).
  30. Barth, D., Berendonk, T. U. The mitochondrial genome sequence of the ciliate Paramecium caudatum reveals a shift in nucleotide composition and codon usage within the genus Paramecium. BMC Genomics. 12 (1), (2011).
  31. Coombe, L., et al. Assembly of the Complete Sitka Spruce Chloroplast Genome Using 10X Genomics’ GemCode Sequencing Data. Plos One. 11 (9), (2016).
  32. Herschleb, J., Ananiev, G., Schwartz, D. C. Pulsed-field gel electrophoresis. Nature Protocols. 2 (3), 677-684 (2007).

Play Video

Cite This Article
Asalone, K. C., Nelson, M. M., Bracht, J. R. Novel Sequence Discovery by Subtractive Genomics. J. Vis. Exp. (143), e58877, doi:10.3791/58877 (2019).

View Video