Summary

Varyant patojenitesi Amino asit düzeyi parazit sinyal analizi genetik varyasyon kullanarak olasılığını belirleme

Published: January 16, 2019
doi:

Summary

Amino asit düzeyi parazit sinyal analizi arka plan için verilen bir popülasyonun genetik varyasyon normalleştirilmiş bir belirli amino asit pozisyonda genetik varyasyon yaygınlığı belirler. Bu varyant “sıcak noktalar” frekans nadir versiyonlarının bir nüfus (gürültü) bulundu yukarıda yükselir bir protein sıra (sinyal) içinde tanımlanması için sağlar.

Abstract

Gelişmeler maliyet ve sonraki nesil genetik sıralama hızını bir patlama klinik tüm exome ve tüm genom test oluşturmuş. Muhtemel patojen mutasyonların genetik sendromlar ile ilişkili artan kimlik yol açmıştır iken, bu da önemli ölçüde sayısı bilinmeyen önem (VUS) genetik varyantların tesadüfen bulundu artmıştır. Bu değişik klinik önemi belirleme bilim adamları ve klinisyenler için büyük bir sorun olduğunu. Patojen olasılığını belirlemede yardımcı olmak için bir yaklaşım protein sıra düzeyinde sinyal-gürültü analizidir. Bu iletişim kuralı her yükseltilmiş olasılığı ile birincil dizinin alanları tanımlamak için bilinen protein topolojisi ile protein amino asit konumunu değişik frekansta güçlendirir amino asit düzeyi parazit sinyal analizi için bir yöntemi açıklar patolojik değişim (göre nüfus “arka plan” varyasyon). Bu yöntem amino asit kalıntı konumu “sıcak noktalar” VUSs tanı ağırlığı bu sonraki nesil genetik test ederek tespit gibi iyileştirmek için kullanılan yüksek patolojik sinyal tanımlayabilirsiniz.

Introduction

Genetik sıralama platformlar hızlı düzelme erişilebilirlik ve rolü genetik tıpta devrim yarattı. Bir kez tek bir gen veya gen bir avuç binayla, maliyet azaltma ve yeni nesil genetik sıralama genom tamamını rutin sıralama açmıştır hızını artış sırası (tüm exome sıralama, WES) kodlama’nın ve tüm genom ( tüm genom sıralama, WGS) klinik ortamda. WES ve WGS sık ağır hasta yenidoğan bebeklerin ve çocukların genetik sendromu için endişe ile ortamda klinik Yönetim1,2değiştirebilirsiniz kanıtlanmış bir tanı aracı nerede kullanılmaktadır. Muhtemel patojen mutasyonların genetik sendromlar ile ilişkili artan kimlik yol açmıştır iken, aynı zamanda önemli ölçüde bu arada bulunan genetik varyantların veya beklenmeyen olumlu sonuçlarını, bilinmeyen tanı sayısı artmıştır önemi (VUS). Bazı bu çeşitleri göz ardı ve türevleri için yerelleştirme rapor değil iken potansiyel olarak ölümcül ya da son derece korkunç hastalıklar ile ilişkili genlerin sık sık rapor edilir. Mevcut kurallar tavsiye kardiyomiyopatiler gibi ani kardiyak ölüm predispozan hastalıkların gelişimi ile ilişkili genlerin de dahil olmak üzere hastanın tıbbi yararı olabilir belirli genler bulundu arızi versiyonlarının raporlama ve channelopathies3. Her ne kadar bu öneriye SCD predispozan hastalığı riskini bireylerin yakalamak için tasarlanmıştır, varyant algılama hassasiyeti çok özgüllüğü aşıyor. Bu VUSs giderek artan sayıda içinde yansıtılır ve bu arada çok aşan bir verilen nüfus4ilgili hastalıklarda sıklığını belirsiz tanılama yardımcı programı ile türevlerini tespit. Bir tür hastalık, uzun QT sendromu (LQTS), kardiyak iyon kanalları kodlamak genler için yerelleştirme mutasyonlar neden kurallı bir kalp channelopathy, ya da kardiyak repolarization5sonuçlanan proteinler, etkileşim kanalı gecikmeli. Elektrokardiyogram, istirahat üzerinde uzun süreli bir QT aralığı tarafından görülen bu gecikmiş repolarization torsades de pointesgibi potansiyel olarak ölümcül ventriküler aritmiler elektrik bir yatkınlık sonuçlanır. Bu hastalık, KCNQ1mutasyonların gelişmesine bağlı gen sayısı ise-kodlanmışKs Potasyum kanal (KCNQ1, Kv7.1) LQTS tip 1 nedeni ve6aşağıda örnek olarak kullanılmaktadır. Varyant yorumunu karmaşıklık gösteren, “arka plan genetik varyasyon” sözde genler, LQTS ilişkili nadir versiyonlarında varlığı önceden açıklanan7,8oldu.

Büyük Özet tarzı veritabanlarına ek olarak bilinen patojen varyantları, etkisi farklı varyantları üretecek tahmin etmek için çeşitli stratejiler vardır. Bazı algoritmalar, SIFT ve Polyphen 2, deleteriousness9,10tahmin için roman eşanlamlı sigara türevleri çok sayıda filtre uygulayabilirsiniz gibi temel alır. “Klinik VUSs11calling” geldiğinde bu araçları geniş kullanılmasına rağmen onların uygulanabilirliği düşük özgüllük sınırlar. “Sinyal-gürültü” analiz nadir genetik varyasyon bir popülasyondan karşı normalleştirilmiş söz konusu loci, bilinen patolojik değişim sıklığı temel hastalığı ile ilişkili olan bir değişken olasılığını tanımlayan bir araçtır. Genetik loci yerelleştirme türevleri olduğu yerde yüksek yaygınlık varyasyon, bir yüksek sinyal-gürültü, nüfus tabanlı göre hastalık ilişkili mutasyonların daha kendilerini hastalık ilişkili olması muhtemeldir. Bu arada bir gen ile nadir nüfus versiyonlarının yüksek frekans için yerelleştirme bulundu Ayrıca, nadir türevleri hastalık ilişkili frekans, bir düşük sinyal-gürültü için karşılaştırıldığında, daha az hastalık ilişkili olması muhtemeldir. Tanılama yardımcı programı parazit sinyal analizi kardiyomiyopatiler ve channelopathies için genetik test etmek için son yönergeleri yılında resimli; Ancak, bu yalnızca bütün gen düzeyinde veya etki alanına özgü düzeyi12istihdam edilmiştir. Son zamanlarda, patolojik türevleri (hastalık veritabanları, kohort çalışmalar literatürde) ve nüfus tabanlı kontrol türevleri (Exome toplama Konsorsiyumu, orada ve genom toplama veritabanı, GnomAD13), artırılmış kullanılabilirlik verilen Bu bir protein birincil dizisi içinde bireysel amino asit pozisyonlar için uygulanmıştır. Amino asit düzeyi parazit sinyal analizi tesadüfen saptanan hastalık ilişkili daha büyük olasılıkla “arka plan” genetik varyasyon olarak LQTS ile ilişkili genlerin versiyonlarında kategorize yararlı olmuştur. KCNQ1, dahil olmak üzere LQTS ile ilişkili üç önemli genler arasında bu çeşitleri bireysel amino asit pozisyonlarda sıklığını nadir yansıtacak düşündüren önemli bir sinyal noise oranları bu tesadüfen tespit çeşitleri yoksun nüfus değişimi yerine hastalık ilişkili mutasyonlar. Ayrıca, ne zaman protein özel etki alanı topolojisi yüksek sinyal gürültü, patolojik mutasyon “lokalize anahtar işlevsel etki alanlarına proteinler14sıcak noktalar” alanlarında karşı overlaid. Bu yöntem 1) olasılığını bir değişken hastalığı veya nüfus ilişkili olduğunu belirleme ve 2) bir proteinin insan hastalığı ile ilişkili roman kritik işlevsel etki alanları tanımlayan söz sahibidir.

Protocol

1. gen ve belirli Splice izoformu ilgi tanımlamak Not: Burada, faiz hastalığın patogenezi ile ilişkili olan faiz gen için fikir birliği sırasını tanımlamak için Ensembl15 kullanımını göstermektedir (yani KCNQ1 mutasyonlar LQTS ile ilişkili). Seçimli-e doğru Ensembl dahil RefSeq biyoteknoloji bilgi (NCBI)16 Ulusal Merkezi ve University of California, Santa Cruz (UCSC) insan genom tarayıcı17 üzer…

Representative Results

Amino asit düzeyi sinyal-gürültü analizi için KCNQ1 için temsil edici bir sonuç Şekil 6′ tasvir edilir. Bu örnekte, GnomAD kohort (denetim kohort), tanımlanan nadir türevleri tesadüfen tespit WES türevleri (deneysel kohort #1) ve LQTS vaka ilgili değişik olası hastalık ilişkili (deneysel kohort #2) tasvir edilmektedir sayılır. Ayrıca, WES ve LQTS kohort varyant frekans karşılaştırma parazit sinyal analizi varyant sıklığı tasvir Gn…

Discussion

Yüksek işlem hacmi genetik test önemli ölçüde kendi uygulama ve kullanılabilirlik içinde son on yıl içinde ilerlemiştir. Ancak, birçok hastalıkları kardiyomiyopatiler gibi köklü genetik temelleri ile genişletilmiş test tanı verim21geliştirmek başarısız oldu. Ayrıca, birçok tanımlanan türevleri tanılama yardımcı programı ile ilgili önemli belirsizlik vardır. Bu kısmen WES ve yanlış tanı22‘ ye yol açabilir WGS keşfedilen bu arada tanıml…

Disclosures

The authors have nothing to disclose.

Acknowledgements

APL ulusal kurumları, sağlık K08-HL136839 tarafından desteklenir.

Materials

1000 Genome Project N/A www.internationalgenome.org
ClinVar N/A www.ncbi.nlm.nih.gov/clinvar
Ensembl Genome Browser N/A uswest.ensembl.org/index.html
Excel Microsoft office.microsoft.com/excel/ Used for all example formulas and functions
Exome Aggregation Consortium  N/A www.exac.broadinstitute.org
Genome Aggregation Database  N/A www.gnomad.broadinstitute.org
National Center for Biotechnology Information Domain and Structure Database N/A www.ncbi.nlm.nih.gov/guide/domains-structures/
National Center for Biotechnology Information Gene Database N/A www.ncbi.nlm.nih.gov/gene/
National Center for Biotechnology Information Protein Database N/A www.ncbi.nlm.nih.gov/protein/
National Heart, Lung, and Blood Institute GO Exome Sequencing Project N/A www.evs.gs.washington.edu/EVS/
SnapGene GSL Biotech LCC www.snapgene.com
University of California, Santa Cruz Human Genome Browser N/A www.genome.ucsc.edu

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Meng, L., et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. Journal of the American Medical Association Pediatrics. 171 (12), 173438 (2017).
  3. Kalia, S. S., et al. Recommendations for reporting of secondary findings in clinical exome and genome sequencing, 2016 update (ACMG SF v2.0): a policy statement of the American College of Medical Genetics and Genomics. Genetics in Medicine. 19 (2), 249-255 (2017).
  4. Landstrom, A. P., Ackerman, M. J. The Achilles’ heel of cardiovascular genetic testing: distinguishing pathogenic mutations from background genetic noise. Clinical Pharmacology and Therapeutics. 90 (4), 496-499 (2011).
  5. Landstrom, A. P., Tester, D. J., Ackerman, M. J., Lawless, C. Role of genetic testing for sudden death predisposing heart conditions in athletes. Sports Cardiology Essentials. , (2011).
  6. Wang, Q., et al. Positional cloning of a novel potassium channel gene: KVLQT1 mutations cause cardiac arrhythmias. Nature Genetics. 12 (1), 17-23 (1996).
  7. Kapa, S., et al. Genetic testing for long-QT syndrome: distinguishing pathogenic mutations from benign variants. Circulation. 120 (18), 1752-1760 (2009).
  8. Ackerman, M. J., et al. Ethnic differences in cardiac potassium channel variants: implications for genetic susceptibility to sudden cardiac death and genetic testing for congenital long QT syndrome. Mayo Clinic Proceedings. 78 (12), 1479-1487 (2003).
  9. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nature Protocols. 4 (7), 1073-1081 (2009).
  10. Adzhubei, I., Jordan, D. M., Sunyaev, S. R. Predicting functional effect of human missense mutations using PolyPhen-2. Current Protocols in Human Genetics. , (2013).
  11. Flanagan, S. E., Patch, A. M., Ellard, S. Using SIFT and PolyPhen to predict loss-of-function and gain-of-function mutations. Genetic Testing and Molecular Biomarkers. 14 (4), 533-537 (2010).
  12. Ackerman, M. J., et al. HRS/EHRA expert consensus statement on the state of genetic testing for the channelopathies and cardiomyopathies this document was developed as a partnership between the Heart Rhythm Society (HRS) and the European Heart Rhythm Association (EHRA). Heart Rhythm. 8 (8), 1308-1339 (2011).
  13. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  14. Landstrom, A. P., et al. Amino acid-level signal-to-noise analysis of incidentally identified variants in genes associated with long QT syndrome during pediatric whole exome sequencing reflects background genetic noise. Heart Rhythm. 15 (7), 1042-1050 (2018).
  15. Hubbard, T., et al. Ensembl 2005. Nucleic Acids Research. 33, 447-453 (2005).
  16. O’Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, 733-745 (2016).
  17. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  18. The 100 Genome Projects Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  19. Fu, W., et al. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 493 (7331), 216-220 (2013).
  20. Mulder, N. J., Apweiler, R. Tools and resources for identifying protein families, domains and motifs. Genome Biology. 3 (1), (2002).
  21. Cirino, A. L., et al. A Comparison of Whole Genome Sequencing to Multigene Panel Testing in Hypertrophic Cardiomyopathy Patients. Circulation Cardiovascular Genetics. 10 (5), (2017).
  22. Landstrom, A. P., et al. Interpreting Incidentally Identified Variants in Genes Associated With Catecholaminergic Polymorphic Ventricular Tachycardia in a Large Cohort of Clinical Whole-Exome Genetic Test Referrals. Circulation Arrhythmia and Electrophysiology. 10 (4), (2017).
  23. Whiffin, N., et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genetics in Medicine. 19 (10), 1151-1158 (2017).
  24. Walsh, R., et al. Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples. Genetics in Medicine. 19 (2), 192-203 (2017).
  25. Buske, O. J., Manickaraj, A., Mital, S., Ray, P. N., Brudno, M. Identification of deleterious synonymous variants in human genomes. Bioinformatics. 31 (5), 799 (2015).
  26. Wen, P., Xiao, P., Xia, J. dbDSM: a manually curated database for deleterious synonymous mutations. Bioinformatics. 32 (12), 1914-1916 (2016).
  27. Bagnall, R. D., et al. Whole Genome Sequencing Improves Outcomes of Genetic Testing in Patients With Hypertrophic Cardiomyopathy. Journal of the American College of Cardiology. 72 (4), 419-429 (2018).
  28. Giudicessi, J. R., Roden, D. M., Wilde, A. A. M., Ackerman, M. J. Classification and Reporting of Potentially Proarrhythmic Common Genetic Variation in Long QT Syndrome Genetic Testing. Circulation. 137 (6), 619-630 (2018).
  29. Sundaram, L., et al. Predicting the clinical impact of human mutation with deep neural networks. Nature Genetics. 50, 1161-1170 (2018).
  30. Krittanawong, C., Zhang, H., Wang, Z., Aydar, M., Kitai, T. Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology. 69 (21), 2657-2664 (2017).

Play Video

Cite This Article
Jones, E. G., Landstrom, A. P. Determining the Likelihood of Variant Pathogenicity Using Amino Acid-level Signal-to-Noise Analysis of Genetic Variation. J. Vis. Exp. (143), e58907, doi:10.3791/58907 (2019).

View Video