Summary

Определение вероятности варианта патогенности, используя аминокислоты уровня сигнала к шуму анализ генетической изменчивости

Published: January 16, 2019
doi:

Summary

Аминокислоты уровня сигнала к шуму анализ определяет распространенности генетической вариации в данной аминокислоты позиции нормированы фон генетической вариации населения. Это позволяет для идентификации вариант «горячих точек» в последовательности белка (сигнал), который поднимается выше частота редких вариантов в популяции (шум).

Abstract

Прогресс в стоимость и скорость следующего поколения генетическое секвенирование вызвали взрыв клинических весь exome и тестирования всего генома. Хотя это привело к увеличению идентификации вероятно патогенных мутаций, связанных с генетическими синдромами, он также резко возросло количество кстати нашел генетических вариантов неизвестное значение (VUS). Определение клиническое значение из этих вариантов является серьезной проблемой для ученых и клиницистов. Подход для оказания помощи в определении вероятности патогенности является анализ сигнал шум на уровне последовательности белка. Этот протокол описывает метод для анализа сигнал шум аминокислоты уровня, который использует вариант частоты в позиции каждой аминокислоты белка с топологией известных белков для выявления областей первичной последовательности с повышенной вероятностью патологические изменения (относительно населения «фон» вариант). Этот метод можно определить аминокислотных остатков местоположение «горячих точек» высокой патологический сигнал, который может использоваться для уточнения диагностических вес VUSs например тех, которые определены следующего поколения генетического тестирования.

Introduction

Быстрое улучшение генетического секвенирования платформ изменила доступности и роли генетики в медицине. После только одного гена, или горсть генов, сокращение расходов и увеличение скорости следующего поколения, генетического секвенирования привело обычной последовательности весь геном программирования последовательности (exome вся последовательность, Уэс) и весь геном ( всего генома, РГ) в клинических условиях. Уэс и WGS были использованы часто в параметре тяжелобольным новорожденных и детей с обеспокоенностью за генетическим синдромом где это доказано диагностический инструмент, который может изменить клинического управления1,2. Хотя это привело к увеличению идентификации вероятно патогенных мутаций, связанных с генетическими синдромами, он также резко возросло количество случайно найденный генетических вариантов, или неожиданные положительные результаты, неизвестных диагностики значение (VUS). Хотя некоторые из этих вариантов не учитываются и не сообщается, варианты локализации для гены, связанные с потенциально смертельным или весьма болезненный заболеваний часто сообщают. Нынешние руководящие принципы рекомендуют отчетности непредвиденных вариантов в конкретных генов, которые могут быть медицинская польза для пациента, включая гены, связанные с развитием внезапной сердечной смерти предрасполагающие заболеваний, таких как кардиомиопатии и channelopathies3. Хотя эта рекомендация была разработана для захвата людей риску заболевания SCD-предрасполагающие, чувствительность вариант определения намного превышает специфичности. Это находит свое отражение в растущее число VUSs и кстати выявлены варианты с неясными диагностики Утилита, которая намного превышает частоту соответствующих заболеваний в данной популяции4. Один такой болезни, долго QT синдром (LQTS), является каноническим сердечной channelopathy, вызванных мутациями, локализация генов, кодирующих сердца ионных каналов, или каналов взаимодействия белки, что приводит к задержки сердца реполяризации5. Эта задержка реполяризации, видели длительного интервала QT на отдыха электрокардиограмма, приводит к электрической предрасположенность к потенциально смертельным желудочковых аритмий, например torsades de pointes. Хотя количество генов были связаны в развитие этого заболевания, мутации в KCNQ1-кодировке яKs калия канал (KCNQ1, Kv7.1) является причиной LQTS типа 1 и используется в качестве примера ниже6. Иллюстрирующих сложность в вариант интерпретации, наличие редких вариантов в LQTS-связанных генов, так называемые «фон генетической вариации» был ранее описанных7,8.

В дополнение к большой сборник стиль баз известных патогенных вариантов для предсказывая будет производить эффект различные варианты существуют несколько стратегий. Некоторые основаны на алгоритмы, такие как ПРОСЕЯТЬ и 2 Polyphen, которые можно отфильтровать большое количество роман не синонимами вариантов предсказать deleteriousness9,10. Несмотря на широкое использование этих инструментов низкой специфичности ограничивает их применимости, когда дело доходит до «вызова» клинических VUSs11. «Сигнал шум» анализ — инструмент, который определяет вероятность того вариант, связанный с болезнью, основываясь на частоте известных патологические изменения на локусов в вопросе нормализации против редких генетических отклонений от населения. Локализация для генетических локусов варианты там, где высокая распространенность болезней связанных мутаций, по сравнению с населения на основе вариации, высокий сигнал шум, являются скорее болезнь связанные сами. Кроме того, редкие варианты нашел кстати локализации к гену с высокой частотой редких населения вариантов по сравнению с болезнь связанные частоты, низкий сигнал шум, может быть меньше шансов быть связанных заболеваний. Утилиты диагностики сигнал шум анализа была показана в последних руководящих принципах генетического тестирования, кардиомиопатии и channelopathies; Однако он только работал на уровне весь ген или доменного уровня12. Недавно учитывая увеличение объема патологической варианты (болезнь баз данных, когортные исследования в литературе) и варианты управления на основе населения (консорциум агрегации Exome, ExAC и агрегирования данных генома, GnomAD13), Это был применен к позиции отдельных аминокислот в рамках первичной последовательности белка. Аминокислоты уровня сигнала к шуму анализ оказался полезным в классификации кстати выявленных вариантов в генах, связанные с LQTS как вероятно генетической вариации «фон» вместо того, чтобы связанные заболевания. Среди трех основных генов, связанных с LQTS, включая KCNQ1эти кстати выявленных вариантов отсутствуют значительные соотношения сигнал шум, предполагая, что частота этих вариантов на позициях отдельных аминокислот отражают редкий населения вариации, а не связанных заболеваний мутации. Кроме того, когда белок доменного топологии был обложил против областях высокий сигнал шум, патологический мутации «горячих точек», локализованные в ключевых функциональных областях белки14. Эта методология является перспективным в определения что 1) вероятность того вариант болезни или населения, связанных и 2) роман критических функциональные домены белка, связанные с заболеваний человека.

Protocol

1. Определите гена и конкретных Splice изоформы интереса Примечание: Здесь мы продемонстрировать использование Ensembl15 определить последовательность консенсуса для гена интереса, который связан с патогенез заболевания интереса (то есть KCNQ1 мутации связаны с …

Representative Results

Представитель результат аминокислоты уровень сигнала анализ шума для KCNQ1 изображен на рисунке 6. В этом примере, редких вариантов, определенных в GnomAD когорты (когорта управления), кстати выявлены варианты Уэс (экспериментальная когорты #1) и LQTS дело связ?…

Discussion

Высок объём генетическое тестирование передовые резко в ее применения и доступности в последнее десятилетие. Однако во многих заболеваний с устоявшейся генетических основ, таких как кардиомиопатии, расширенного тестирования не удалось улучшить диагностический выход21. К…

Disclosures

The authors have nothing to disclose.

Acknowledgements

APL поддерживается путем национальных институтов из здравоохранения K08-HL136839.

Materials

1000 Genome Project N/A www.internationalgenome.org
ClinVar N/A www.ncbi.nlm.nih.gov/clinvar
Ensembl Genome Browser N/A uswest.ensembl.org/index.html
Excel Microsoft office.microsoft.com/excel/ Used for all example formulas and functions
Exome Aggregation Consortium  N/A www.exac.broadinstitute.org
Genome Aggregation Database  N/A www.gnomad.broadinstitute.org
National Center for Biotechnology Information Domain and Structure Database N/A www.ncbi.nlm.nih.gov/guide/domains-structures/
National Center for Biotechnology Information Gene Database N/A www.ncbi.nlm.nih.gov/gene/
National Center for Biotechnology Information Protein Database N/A www.ncbi.nlm.nih.gov/protein/
National Heart, Lung, and Blood Institute GO Exome Sequencing Project N/A www.evs.gs.washington.edu/EVS/
SnapGene GSL Biotech LCC www.snapgene.com
University of California, Santa Cruz Human Genome Browser N/A www.genome.ucsc.edu

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Meng, L., et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. Journal of the American Medical Association Pediatrics. 171 (12), 173438 (2017).
  3. Kalia, S. S., et al. Recommendations for reporting of secondary findings in clinical exome and genome sequencing, 2016 update (ACMG SF v2.0): a policy statement of the American College of Medical Genetics and Genomics. Genetics in Medicine. 19 (2), 249-255 (2017).
  4. Landstrom, A. P., Ackerman, M. J. The Achilles’ heel of cardiovascular genetic testing: distinguishing pathogenic mutations from background genetic noise. Clinical Pharmacology and Therapeutics. 90 (4), 496-499 (2011).
  5. Landstrom, A. P., Tester, D. J., Ackerman, M. J., Lawless, C. Role of genetic testing for sudden death predisposing heart conditions in athletes. Sports Cardiology Essentials. , (2011).
  6. Wang, Q., et al. Positional cloning of a novel potassium channel gene: KVLQT1 mutations cause cardiac arrhythmias. Nature Genetics. 12 (1), 17-23 (1996).
  7. Kapa, S., et al. Genetic testing for long-QT syndrome: distinguishing pathogenic mutations from benign variants. Circulation. 120 (18), 1752-1760 (2009).
  8. Ackerman, M. J., et al. Ethnic differences in cardiac potassium channel variants: implications for genetic susceptibility to sudden cardiac death and genetic testing for congenital long QT syndrome. Mayo Clinic Proceedings. 78 (12), 1479-1487 (2003).
  9. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nature Protocols. 4 (7), 1073-1081 (2009).
  10. Adzhubei, I., Jordan, D. M., Sunyaev, S. R. Predicting functional effect of human missense mutations using PolyPhen-2. Current Protocols in Human Genetics. , (2013).
  11. Flanagan, S. E., Patch, A. M., Ellard, S. Using SIFT and PolyPhen to predict loss-of-function and gain-of-function mutations. Genetic Testing and Molecular Biomarkers. 14 (4), 533-537 (2010).
  12. Ackerman, M. J., et al. HRS/EHRA expert consensus statement on the state of genetic testing for the channelopathies and cardiomyopathies this document was developed as a partnership between the Heart Rhythm Society (HRS) and the European Heart Rhythm Association (EHRA). Heart Rhythm. 8 (8), 1308-1339 (2011).
  13. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  14. Landstrom, A. P., et al. Amino acid-level signal-to-noise analysis of incidentally identified variants in genes associated with long QT syndrome during pediatric whole exome sequencing reflects background genetic noise. Heart Rhythm. 15 (7), 1042-1050 (2018).
  15. Hubbard, T., et al. Ensembl 2005. Nucleic Acids Research. 33, 447-453 (2005).
  16. O’Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, 733-745 (2016).
  17. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  18. The 100 Genome Projects Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  19. Fu, W., et al. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 493 (7331), 216-220 (2013).
  20. Mulder, N. J., Apweiler, R. Tools and resources for identifying protein families, domains and motifs. Genome Biology. 3 (1), (2002).
  21. Cirino, A. L., et al. A Comparison of Whole Genome Sequencing to Multigene Panel Testing in Hypertrophic Cardiomyopathy Patients. Circulation Cardiovascular Genetics. 10 (5), (2017).
  22. Landstrom, A. P., et al. Interpreting Incidentally Identified Variants in Genes Associated With Catecholaminergic Polymorphic Ventricular Tachycardia in a Large Cohort of Clinical Whole-Exome Genetic Test Referrals. Circulation Arrhythmia and Electrophysiology. 10 (4), (2017).
  23. Whiffin, N., et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genetics in Medicine. 19 (10), 1151-1158 (2017).
  24. Walsh, R., et al. Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples. Genetics in Medicine. 19 (2), 192-203 (2017).
  25. Buske, O. J., Manickaraj, A., Mital, S., Ray, P. N., Brudno, M. Identification of deleterious synonymous variants in human genomes. Bioinformatics. 31 (5), 799 (2015).
  26. Wen, P., Xiao, P., Xia, J. dbDSM: a manually curated database for deleterious synonymous mutations. Bioinformatics. 32 (12), 1914-1916 (2016).
  27. Bagnall, R. D., et al. Whole Genome Sequencing Improves Outcomes of Genetic Testing in Patients With Hypertrophic Cardiomyopathy. Journal of the American College of Cardiology. 72 (4), 419-429 (2018).
  28. Giudicessi, J. R., Roden, D. M., Wilde, A. A. M., Ackerman, M. J. Classification and Reporting of Potentially Proarrhythmic Common Genetic Variation in Long QT Syndrome Genetic Testing. Circulation. 137 (6), 619-630 (2018).
  29. Sundaram, L., et al. Predicting the clinical impact of human mutation with deep neural networks. Nature Genetics. 50, 1161-1170 (2018).
  30. Krittanawong, C., Zhang, H., Wang, Z., Aydar, M., Kitai, T. Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology. 69 (21), 2657-2664 (2017).

Play Video

Cite This Article
Jones, E. G., Landstrom, A. P. Determining the Likelihood of Variant Pathogenicity Using Amino Acid-level Signal-to-Noise Analysis of Genetic Variation. J. Vis. Exp. (143), e58907, doi:10.3791/58907 (2019).

View Video