Summary

Bestimmen die Wahrscheinlichkeit einer Variante Pathogenität mit Aminosäure-Niveau Signal-Rausch-Analyse genetischer Variation

Published: January 16, 2019
doi:

Summary

Aminosäure-Niveau Signal-Rausch-Analyse bestimmt die Prävalenz der genetischen Variation an einer bestimmten Aminosäure-Position auf Hintergrund genetische Variation einer bestimmten Population normalisiert. Dies ermöglicht eine Identifizierung der Variante “Hotspots” in eine Proteinsequenz (Signal), die über die Häufigkeit der seltenen Varianten gefunden in einer Population (Lärm) steigt.

Abstract

Fortschritten bei der Kosten und Geschwindigkeit der genetische Sequenzierung der nächsten Generation haben eine Explosion von klinischen ganze Exome und gesamten Genoms Tests generiert. Während dies zu erhöhten Identifikation von wahrscheinlich pathogenen Mutationen im Zusammenhang mit genetischen Syndromen geführt hat, hat sie auch drastisch erhöht, die Zahl der übrigens fand genetische Varianten von unbekannter Bedeutung (VUS). Feststellung der klinischen Bedeutung dieser Varianten ist eine große Herausforderung für Wissenschaftler und Kliniker. Es ist ein Ansatz zur Unterstützung bei der Bestimmung der Wahrscheinlichkeit der Pathogenität Signal-Rausch-Analyse auf Proteinebene Sequenz. Dieses Protokoll beschreibt eine Methode für die Aminosäure-Niveau Signal-Rausch-Analyse, die Variante Frequenz bei jeder Aminosäure des Proteins mit bekannten Protein Topologie, um Bereiche der primären Sequenz mit erhöhter Wahrscheinlichkeit zu ermitteln, nutzt pathologische Variation (bezogen auf Bevölkerungsanstieg “Hintergrund”). Diese Methode erkennt Aminosäure Rückstände Lage “Hotspots” der hohe pathologische Signal, welche verwendet werden können, um die diagnostische Gewicht des VUSs wie diejenigen, die von der nächsten Generation Gentests zu verfeinern.

Introduction

Die schnelle Verbesserung der genetische Sequenzierung Plattformen hat die Zugänglichkeit und die Rolle der Genetik in der Medizin revolutioniert. Sobald auf ein einzelnes Gen oder eine Handvoll Genen beschränkt, ist die Reduzierung der Kosten und Erhöhung der Geschwindigkeit der nächsten Generation genetische Sequenzierung dazu, dass routinemäßige Sequenzierung des gesamten Genoms geführt hat Sequenz (ganze Exome Sequenzierung, WES) Codierung und das gesamte Genom ( kompletten Genoms, WGS) in der klinischen Einstellung. WES und WGS wurden häufig verwendet in der Umgebung von kritisch kranken Neugeborenen und Kindern mit Besorgnis für genetisches Syndrom wo ist es eine bewährte Diagnosetool, das Klinikmanagement1,2ändern kann. Während dies zu erhöhten Identifikation von wahrscheinlich pathogenen Mutationen im Zusammenhang mit genetischen Syndromen geführt hat, stieg es auch drastisch die Anzahl der im übrigen gefundenen genetischen Varianten oder unerwartete positive Ergebnisse von unbekannten Diagnose- Bedeutung (VUS). Während einige dieser Varianten sind außer acht gelassen und nicht gemeldet, Varianten zu lokalisieren sind Gene verbunden mit potenziell tödlichen oder sehr morbide Erkrankungen häufig berichtet. Aktuelle Leitlinien empfehlen Berichterstattung über anfallende Varianten gefunden in bestimmte Gene, die möglicherweise von medizinischen Nutzen für den Patienten, einschließlich der Gene, die im Zusammenhang mit der Entwicklung von plötzlichen kardialen Tod prädisponierende Erkrankungen wie Kardiomyopathien und Channelopathien3. Obwohl diese Empfehlung entwickelt wurde, um Personen in Gefahr einer SCD prädisponierende Erkrankung erfassen, übertrifft die Nachweisempfindlichkeit Variante Spezifität. Dies spiegelt sich in einer wachsenden Zahl von VUSs und übrigens unklar Diagnoseprogramm, die weit über die Häufigkeit der jeweiligen Krankheiten in einer gegebenen Population4Varianten zugeordnet. Eine solche Krankheit, lange QT-Syndrom (LQTS), ist eine kanonische kardiale Channelopathie verursacht durch Mutationen, die Lokalisierung von Genen die kardiale Ionenkanäle codieren oder Kanal-Proteine, wodurch Interaktion verzögert kardiale Repolarisation5. Diese verzögerte Repolarisation, gesehen von einem verlängertem QT-Intervall im Ruhe-EKG, führt zu einem elektrischen Prädisposition für potenziell tödliche ventrikuläre Arrhythmien wie Torsades de Pointes. Während eine Reihe von Genen für die Entwicklung dieser Krankheit, Mutationen im KCNQ1verknüpft wurden-kodiert ichKs Kalium Kanal (KCNQ1, Kv7.1) ist die Ursache des LQTS Typ 1 und ist als ein Beispiel unter6genutzt. Zur Veranschaulichung der Komplexität in der Variante Interpretation, wurde die Anwesenheit von seltenen Varianten in LQTS-assoziierten Genen, so genannte “Hintergrund genetische Variation” beschriebenen7,8.

Neben großen Kompendium-Stil Datenbanken der bekannten pathogenen Varianten existieren mehrere Strategien für die Vorhersage, dass die Wirkung verschiedener Varianten produzieren. Einige basieren auf Algorithmen, wie z. B. SIFT und Polyphen 2, die große Anzahl von Roman nicht gleichbedeutend Varianten vorherzusagen Verderblichkeit9,10filtern können. Trotz breiten Einsatz dieser Werkzeuge begrenzt geringe Spezifität ihrer Anwendbarkeit, wenn es darum geht, “calling” klinische VUSs11. “Signal-Rausch-” Analyse ist ein Werkzeug, das die Wahrscheinlichkeit einer Variante mit Krankheit bezogen auf die Frequenz des bekannten pathologische Variation bei den fraglichen Loci normalisiert gegen seltene genetische Variation aus einer Population identifiziert. Lokalisierung von genetischen Loci Varianten wo gibt es eine hohe Prävalenz von krankheitsassoziierten Mutationen im Vergleich zur Bevölkerung basierende Variante, einen hohen Signal-Rausch-, sind eher krankheitsassoziierten selbst zu sein. Weitere, seltene Varianten fand übrigens auf ein Gen mit einer hohen Frequenz von seltenen Bevölkerung Varianten Lokalisierung im Vergleich zu krankheitsassoziierten Frequenz, eine geringe Signal-Rausch-, möglicherweise seltener Krankheiten. Der diagnostische Nutzen des Signal-Rausch-Analyse hat in den neuesten Leitlinien für Gentests für Kardiomyopathien und Channelopathien illustriert; Es ist jedoch nur auf ganze gen oder domänenspezifische Level12beschäftigt. Vor kurzem gegeben erhöhte Verfügbarkeit der pathologische Varianten (Krankheit Datenbanken, Kohortenstudien in der Literatur) und bevölkerungsbezogenen Kontrolle Varianten (Exome Aggregation Konsortium, ExAC und Genom-Aggregation-Datenbank, GnomAD13), die einzelne Aminosäure-Positionen innerhalb der primären Sequenz eines Proteins zugewiesen wurden. Aminosäure-Niveau Signal-Rausch-Analyse hat bei der Kategorisierung übrigens identifizierter Varianten in Genen verbunden mit LQTS als wahrscheinlich “Hintergrund” genetische Variation, anstatt krankheitsassoziierten bewährt. Unter den drei wichtigen Genen verbunden mit LQTS, einschließlich KCNQ1fehlte diese übrigens identifizierten Varianten eine erhebliche Signal-Rausch-Verhältnis, darauf hindeutet, dass die Häufigkeit dieser Varianten an einzelne Aminosäure-Positionen selten reflektieren Bevölkerungsanstieg anstatt krankheitsassoziierten Mutationen. Darüber hinaus wurde als Protein-spezifische Domänentopologie gegen Gebiete der hohen Signal-Rausch, pathologischer Mutation “Hotspots” auf wichtige Funktionsbereiche der Proteine14lokalisiert überlagert. Diese Methode verspricht bei der Bestimmung, dass (1) die Wahrscheinlichkeit, dass eine Variante krankheitsassoziierten oder Bevölkerung ist und (2) Ermittlung der Roman kritische Funktionsbereiche eines Proteins mit der menschlichen Krankheit verbunden.

Protocol

1. identifizieren Sie die Gene und bestimmte Splice Isoform von Interesse Hinweis: Hier zeigen wir den Einsatz von Ensembl15 Konsensussequenz für das gen des Interesses zu identifizieren, die im Zusammenhang mit der Pathogenese der Krankheit von Interesse (d.h. KCNQ1 Mutationen LQTS zugeordnet sind). Alternativen zu Ensembl gehören RefSeq über das National Center for Biotechnology Information (NCBI)16 und der University of California, S…

Representative Results

Ein repräsentatives Ergebnis für Aminosäure-Niveau Signal-Lärm-Analyse für KCNQ1 ist in Abbildung 6dargestellt. In diesem Beispiel, seltene Varianten identifiziert in der GnomAD Kohorte (Kontrolle Kohorte), gilt als im übrigen identifiziert WES (experimentelle Kohorte #1), und LQTS Fall-assoziierten Varianten wahrscheinlich krankheitsassoziierten (experimentelle Kohorte #2) dargestellt werden. Darüber hinaus normalisiert die Signal-Rausch-Analyse Vergl…

Discussion

Hochdurchsatz-Gentests hat drastisch in seiner Anwendung und Verfügbarkeit im letzten Jahrzehnt weiterentwickelt. Jedoch ist bei vielen Erkrankungen mit etablierten genetische Grundlagen, wie z. B. Kardiomyopathien, erweiterte Tests fehlgeschlagen diagnostische Ausbeute21zu verbessern. Darüber hinaus gibt es erhebliche Unsicherheit in Bezug auf das Diagnoseprogramm von vielen identifizierte Varianten. Dies ist teilweise auf eine wachsende Zahl von übrigens identifizierten seltenen Varianten ent…

Disclosures

The authors have nothing to disclose.

Acknowledgements

APL ist von den nationalen Instituten der Gesundheit K08-HL136839 unterstützt.

Materials

1000 Genome Project N/A www.internationalgenome.org
ClinVar N/A www.ncbi.nlm.nih.gov/clinvar
Ensembl Genome Browser N/A uswest.ensembl.org/index.html
Excel Microsoft office.microsoft.com/excel/ Used for all example formulas and functions
Exome Aggregation Consortium  N/A www.exac.broadinstitute.org
Genome Aggregation Database  N/A www.gnomad.broadinstitute.org
National Center for Biotechnology Information Domain and Structure Database N/A www.ncbi.nlm.nih.gov/guide/domains-structures/
National Center for Biotechnology Information Gene Database N/A www.ncbi.nlm.nih.gov/gene/
National Center for Biotechnology Information Protein Database N/A www.ncbi.nlm.nih.gov/protein/
National Heart, Lung, and Blood Institute GO Exome Sequencing Project N/A www.evs.gs.washington.edu/EVS/
SnapGene GSL Biotech LCC www.snapgene.com
University of California, Santa Cruz Human Genome Browser N/A www.genome.ucsc.edu

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Meng, L., et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. Journal of the American Medical Association Pediatrics. 171 (12), 173438 (2017).
  3. Kalia, S. S., et al. Recommendations for reporting of secondary findings in clinical exome and genome sequencing, 2016 update (ACMG SF v2.0): a policy statement of the American College of Medical Genetics and Genomics. Genetics in Medicine. 19 (2), 249-255 (2017).
  4. Landstrom, A. P., Ackerman, M. J. The Achilles’ heel of cardiovascular genetic testing: distinguishing pathogenic mutations from background genetic noise. Clinical Pharmacology and Therapeutics. 90 (4), 496-499 (2011).
  5. Landstrom, A. P., Tester, D. J., Ackerman, M. J., Lawless, C. Role of genetic testing for sudden death predisposing heart conditions in athletes. Sports Cardiology Essentials. , (2011).
  6. Wang, Q., et al. Positional cloning of a novel potassium channel gene: KVLQT1 mutations cause cardiac arrhythmias. Nature Genetics. 12 (1), 17-23 (1996).
  7. Kapa, S., et al. Genetic testing for long-QT syndrome: distinguishing pathogenic mutations from benign variants. Circulation. 120 (18), 1752-1760 (2009).
  8. Ackerman, M. J., et al. Ethnic differences in cardiac potassium channel variants: implications for genetic susceptibility to sudden cardiac death and genetic testing for congenital long QT syndrome. Mayo Clinic Proceedings. 78 (12), 1479-1487 (2003).
  9. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nature Protocols. 4 (7), 1073-1081 (2009).
  10. Adzhubei, I., Jordan, D. M., Sunyaev, S. R. Predicting functional effect of human missense mutations using PolyPhen-2. Current Protocols in Human Genetics. , (2013).
  11. Flanagan, S. E., Patch, A. M., Ellard, S. Using SIFT and PolyPhen to predict loss-of-function and gain-of-function mutations. Genetic Testing and Molecular Biomarkers. 14 (4), 533-537 (2010).
  12. Ackerman, M. J., et al. HRS/EHRA expert consensus statement on the state of genetic testing for the channelopathies and cardiomyopathies this document was developed as a partnership between the Heart Rhythm Society (HRS) and the European Heart Rhythm Association (EHRA). Heart Rhythm. 8 (8), 1308-1339 (2011).
  13. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  14. Landstrom, A. P., et al. Amino acid-level signal-to-noise analysis of incidentally identified variants in genes associated with long QT syndrome during pediatric whole exome sequencing reflects background genetic noise. Heart Rhythm. 15 (7), 1042-1050 (2018).
  15. Hubbard, T., et al. Ensembl 2005. Nucleic Acids Research. 33, 447-453 (2005).
  16. O’Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, 733-745 (2016).
  17. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  18. The 100 Genome Projects Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  19. Fu, W., et al. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 493 (7331), 216-220 (2013).
  20. Mulder, N. J., Apweiler, R. Tools and resources for identifying protein families, domains and motifs. Genome Biology. 3 (1), (2002).
  21. Cirino, A. L., et al. A Comparison of Whole Genome Sequencing to Multigene Panel Testing in Hypertrophic Cardiomyopathy Patients. Circulation Cardiovascular Genetics. 10 (5), (2017).
  22. Landstrom, A. P., et al. Interpreting Incidentally Identified Variants in Genes Associated With Catecholaminergic Polymorphic Ventricular Tachycardia in a Large Cohort of Clinical Whole-Exome Genetic Test Referrals. Circulation Arrhythmia and Electrophysiology. 10 (4), (2017).
  23. Whiffin, N., et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genetics in Medicine. 19 (10), 1151-1158 (2017).
  24. Walsh, R., et al. Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples. Genetics in Medicine. 19 (2), 192-203 (2017).
  25. Buske, O. J., Manickaraj, A., Mital, S., Ray, P. N., Brudno, M. Identification of deleterious synonymous variants in human genomes. Bioinformatics. 31 (5), 799 (2015).
  26. Wen, P., Xiao, P., Xia, J. dbDSM: a manually curated database for deleterious synonymous mutations. Bioinformatics. 32 (12), 1914-1916 (2016).
  27. Bagnall, R. D., et al. Whole Genome Sequencing Improves Outcomes of Genetic Testing in Patients With Hypertrophic Cardiomyopathy. Journal of the American College of Cardiology. 72 (4), 419-429 (2018).
  28. Giudicessi, J. R., Roden, D. M., Wilde, A. A. M., Ackerman, M. J. Classification and Reporting of Potentially Proarrhythmic Common Genetic Variation in Long QT Syndrome Genetic Testing. Circulation. 137 (6), 619-630 (2018).
  29. Sundaram, L., et al. Predicting the clinical impact of human mutation with deep neural networks. Nature Genetics. 50, 1161-1170 (2018).
  30. Krittanawong, C., Zhang, H., Wang, Z., Aydar, M., Kitai, T. Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology. 69 (21), 2657-2664 (2017).

Play Video

Cite This Article
Jones, E. G., Landstrom, A. P. Determining the Likelihood of Variant Pathogenicity Using Amino Acid-level Signal-to-Noise Analysis of Genetic Variation. J. Vis. Exp. (143), e58907, doi:10.3791/58907 (2019).

View Video