Summary

تحديد احتمال الإمراضية متغير باستخدام تحليل الإشارات إلى الضجيج مستوى الأحماض الأمينية للتنوع الوراثي

Published: January 16, 2019
doi:

Summary

يحدد تحليل الإشارات إلى الضجيج من الأحماض الأمينية-مستوى انتشار التنوع الوراثي في موضع معين من الأحماض الأمينية طبعت على خلفية التنوع الوراثي لعدد معين من السكان. وهذا يسمح لتحديد الخيار “النقاط الساخنة” ضمن تسلسل بروتين (الإشارة) التي ترتفع وتيرة المتغيرات نادرة وجدت في عدد سكان (الضوضاء).

Abstract

لقد ولدت التقدم في التكلفة والسرعة للتسلسل الوراثية الجيل القادم انفجار عزمي كله السريرية واختبار الجينوم كله. في حين أن هذا قد أدى إلى زيادة تحديد الطفرات المسببة للأمراض المحتملة المرتبطة المتلازمات الوراثية، فإنه أيضا زاد زيادة كبيرة العدد المناسبة العثور على المتغيرات الجينية ذات أهمية غير معروفة (فوس). تحديد الأهمية السريرية لهذه المتغيرات تحديا كبيرا للعلماء والأطباء. نهج للمساعدة في تحديد احتمالات الإمراضية تحليل إشارة إلى الضوضاء على مستوى تسلسل البروتين. ويصف هذا البروتوكول وسيلة لتحليل الإشارات إلى الضجيج مستوى الأحماض الأمينية أن روافع تردد متغير في كل موضع من الأحماض الأمينية من البروتين مع طبولوجيا البروتين المعروفة لتحديد مجالات التسلسل الأساسي مع احتمال ارتفاع باثولوجي التباين (بالنسبة إلى السكان “الخلفية” التباين). هذا الأسلوب يمكن تحديد موقع بقايا الأحماض الأمينية “النقاط الساخنة” من إشارة مرضية عالية، والتي يمكن استخدامها لتحسين وزن فوس التشخيص مثل تلك التي حددها الوراثية الجيل القادم اختبار.

Introduction

ثورة التحسن السريع في منصات التسلسل الجيني بإمكانية الوصول ودور علم الوراثة في الطب. مرة واحدة تنحصر في مورثة واحدة أو عدد قليل من الجينات، خفض التكلفة وزيادة سرعة جيل التالي التسلسل الجيني قد أدى الروتينية تسلسل الجينوم برمتها الترميز تسلسل (تسلسل عزمي كله، ويس) و (الجينوم الكامل تسلسل الجينوم كله، WGS) في الإعداد السريرية. ويس والأفرقة العاملة قد استخدمت كثيرا في الإعداد لأمراض خطيرة حديثي الولادة والأطفال مع إيلاء اهتمام لمتلازمة وراثية حيث أنها أداة تشخيص ثبت أنه يمكن تغيير الإدارة السريرية1،2. في حين أن هذا قد أدى إلى زيادة تحديد الطفرات المسببة للأمراض المحتملة المرتبطة المتلازمات الوراثية، زاد زيادة كبيرة أيضا العدد من المتغيرات الجينية وبالمناسبة وجدت، أو نتائج إيجابية غير متوقعة، والتشخيص غير معروف أهمية (فوس). في حين أن بعض هذه المتغيرات تجاهلها ولا يبلغ عنها، المتغيرات إضفاء الطابع المحلي على غالباً ما ترد الجينات المرتبطة بأمراض قاتلة أو المهووسين عاليا. وتوصي المبادئ التوجيهية الحالية الإبلاغ عن متغيرات عرضية وجدت في الجينات المحددة التي قد تكون ذات فائدة طبية للمرضى، بما في ذلك الجينات المرتبطة بتطور الأمراض مؤهبة موت القلب المفاجئ مثل القلب و تشانيلوباثيس3. على الرغم من أن هذه التوصية صمم للقبض على الأفراد المعرضين لخطر مرض مؤهبة SCD، حساسية الكشف عن البديل يتجاوز خصوصية. وهذا ينعكس في عدد متزايد من فوس وحددت المتغيرات المناسبة مع أداة تشخيصية غير واضحة أن تتجاوز وتيرة الأمراض كل منهما في معين من سكان4. هو واحد من هذه الأمراض، طويلة متلازمة كيو تي (LQTS)، المتعارف عليه تشانيلوباثي القلب الناجمة عن الطفرات إضفاء الطابع المحلي على الجينات التي ترميز قنوات أيون القلب، أو قناة تتفاعل البروتينات، مما أدى إلى تأخر repolarization القلب5. Repolarization تأخر هذا، ينظر إلى جانب فاصل كيو تي مطولة في يستريح رسم القلب، يؤدي نزعة كهربائية لعدم انتظام ضربات البطين قاتلة مثل torsades de pointes. في حين قد تم ربط عدد من الجينات لتطور هذا المرض، الطفرات في KCNQ1-ترميز أنا البوتاسيومKs قناة (KCNQ1, Kv7.1) هو السبب في لقتس نوع 1 وتستخدم كمثال أدناه6. توضح التعقيد في التفسير البديل، كان وجود متغيرات نادرة في الجينات المرتبطة لقتس، ما يسمى “التباين الوراثي الخلفية” هو موضح سابقا7،8.

بالإضافة إلى قواعد البيانات الكبيرة على غرار خلاصة وافية من المتغيرات المسببة للأمراض المعروفة، توجد عدة استراتيجيات للتنبؤ بتأثير المتغيرات المختلفة سوف تنتج. ويستند بعض الخوارزميات، مثل التدقيق و 2 بوليفين، والتي يمكن تصفية عدد كبير من المتغيرات غير مترادفين رواية للتنبؤ ديليتيريوسنيس9،10. وعلى الرغم من استخدام واسع النطاق لهذه الأدوات، حدود نوعية منخفضة قابليتها للتطبيق عندما يتعلق الأمر “استدعاء” السريرية فوس11. تحليل “إشارة إلى الضوضاء” هو أداة التي تحدد احتمال متغير يجري المرتبطة بالمرض استناداً إلى تكرار الاختلاف باثولوجي المعروف في المكان المعني تطبيع ضد الاختلاف الجيني نادرة من عدد سكان. المتغيرات إضفاء الطابع المحلي على المكاني الوراثية حيث يوجد انتشار المرتفع للطفرات المرتبطة بالمرض مقارنة المستندة إلى السكان التباين، ارتفاع إشارات إلى ضجيج، من المرجح أن تكون مرتبطة بالمرض أنفسهم. متغيرات أخرى، نادرة العثور على الترجمة المناسبة لجينات بتردد عالي من المتغيرات السكانية نادرة مقارنة بالمرتبطة بمرض التردد، انخفاض إشارات إلى ضجيج، قد تكون أقل احتمالاً لأن تكون مرتبطة بالمرض. وقد تجلى الأداة التشخيصية لتحليل الإشارات إلى الضجيج في أحدث المبادئ التوجيهية للاختبار الجيني للقلب وتشانيلوباثيس؛ بيد أنها استخدمت فقط على مستوى الجينات كاملة أو مجال معين مستوى12. في الآونة الأخيرة، ونظرا لزيادة توافر المتغيرات باثولوجي (المرض قواعد البيانات، ودراسات الأتراب في الأدب) ومتغيرات التحكم المستندة إلى السكان (اتحاد التجميع عزمي، إيزاك وقاعدة التجميع الجينوم، جنوماد13)، وهذا طبق لمواقف الأحماض الأمينية الفردية ضمن التسلسل الرئيسي للبروتين. تحليل الإشارات إلى الضجيج مستوى الأحماض الأمينية قد أثبتت أنها مفيدة في تصنيف المتغيرات المناسبة التي تم تحديدها في الجينات المرتبطة لقتس كاحتمال الاختلاف الجيني “الخلفية” بدلاً من المرتبطة بالمرض. بين الجينات الرئيسية الثلاثة المرتبطة لقتس، بما في ذلك KCNQ1، تفتقر هذه المتغيرات التي تم تحديدها بالمناسبة نسب هامة في إشارة إلى الضوضاء، مما يوحي بأن تواتر هذه المتغيرات في المواقف الفردية من الأحماض الأمينية تعكس نادرة تباين السكان بدلاً من الطفرات المرتبطة بالمرض. وعلاوة على ذلك، عندما كان مضافين مخطط المجال الخاصة بالبروتين ضد المناطق عالية إشارة إلى الضوضاء، وباثولوجي الطفرات “النقاط الساخنة” مترجمة إلى المجالات الوظيفية الرئيسية ل البروتينات14. ويبشر هذا المنهجية في تحديد 1) احتمال البديل هو المرض أو السكان المرتبطة و 2) تحديد مجالات وظيفية حرجة رواية بروتين المرتبطة بالأمراض التي تصيب البشر.

Protocol

1. تحديد الجينات و Isoform الوصلة المحددة للفائدة ملاحظة: هنا، نحن شرح استخدام انسيمبل15 لتحديد تسلسل توافق الآراء لجينات الفائدة التي ترتبط بالآلية المرضية لهذا مرض الاهتمام (أي KCNQ1 من الطفرات المرتبطة لقتس). وتشمل بدائل انسيمبل ريفسيق عن طريق المركز الوطني لمع…

Representative Results

نتيجة ممثل لإشارة مستوى الأحماض الأمينية لتحليل الضوضاء KCNQ1 هو مبين في الشكل 6. في هذا المثال، نادرة المتغيرات المحددة في الفوج جنوماد (مراقبة الفوج)، تعتبر ويس المناسبة تحديد المتغيرات (الفوج التجريبية #1)، والمتغيرات المرتبطة بقضية لقتس يصور المحتمل الم?…

Discussion

الاختبارات الجينية الفائق تقدما هائلا في تطبيقه وتوفر على مدى العقد الماضي. ومع ذلك، العديد من الأمراض مع راسخة الأسس الوراثية، مثل القلب، اختبار الموسعة قد أخفقت في تحسين الغلة التشخيص21. علاوة على ذلك، هناك عدم يقين كبيرة فيما يتعلق بالأداة التشخيصية للعديد من المتغيرات ال?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

معتمد من الألغام المضادة للأفراد بالوطنية معاهد للصحة K08-HL136839.

Materials

1000 Genome Project N/A www.internationalgenome.org
ClinVar N/A www.ncbi.nlm.nih.gov/clinvar
Ensembl Genome Browser N/A uswest.ensembl.org/index.html
Excel Microsoft office.microsoft.com/excel/ Used for all example formulas and functions
Exome Aggregation Consortium  N/A www.exac.broadinstitute.org
Genome Aggregation Database  N/A www.gnomad.broadinstitute.org
National Center for Biotechnology Information Domain and Structure Database N/A www.ncbi.nlm.nih.gov/guide/domains-structures/
National Center for Biotechnology Information Gene Database N/A www.ncbi.nlm.nih.gov/gene/
National Center for Biotechnology Information Protein Database N/A www.ncbi.nlm.nih.gov/protein/
National Heart, Lung, and Blood Institute GO Exome Sequencing Project N/A www.evs.gs.washington.edu/EVS/
SnapGene GSL Biotech LCC www.snapgene.com
University of California, Santa Cruz Human Genome Browser N/A www.genome.ucsc.edu

References

  1. Yang, Y., et al. Clinical whole-exome sequencing for the diagnosis of mendelian disorders. New England Journal of Medicine. 369 (16), 1502-1511 (2013).
  2. Meng, L., et al. Use of Exome Sequencing for Infants in Intensive Care Units: Ascertainment of Severe Single-Gene Disorders and Effect on Medical Management. Journal of the American Medical Association Pediatrics. 171 (12), 173438 (2017).
  3. Kalia, S. S., et al. Recommendations for reporting of secondary findings in clinical exome and genome sequencing, 2016 update (ACMG SF v2.0): a policy statement of the American College of Medical Genetics and Genomics. Genetics in Medicine. 19 (2), 249-255 (2017).
  4. Landstrom, A. P., Ackerman, M. J. The Achilles’ heel of cardiovascular genetic testing: distinguishing pathogenic mutations from background genetic noise. Clinical Pharmacology and Therapeutics. 90 (4), 496-499 (2011).
  5. Landstrom, A. P., Tester, D. J., Ackerman, M. J., Lawless, C. Role of genetic testing for sudden death predisposing heart conditions in athletes. Sports Cardiology Essentials. , (2011).
  6. Wang, Q., et al. Positional cloning of a novel potassium channel gene: KVLQT1 mutations cause cardiac arrhythmias. Nature Genetics. 12 (1), 17-23 (1996).
  7. Kapa, S., et al. Genetic testing for long-QT syndrome: distinguishing pathogenic mutations from benign variants. Circulation. 120 (18), 1752-1760 (2009).
  8. Ackerman, M. J., et al. Ethnic differences in cardiac potassium channel variants: implications for genetic susceptibility to sudden cardiac death and genetic testing for congenital long QT syndrome. Mayo Clinic Proceedings. 78 (12), 1479-1487 (2003).
  9. Kumar, P., Henikoff, S., Ng, P. C. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm. Nature Protocols. 4 (7), 1073-1081 (2009).
  10. Adzhubei, I., Jordan, D. M., Sunyaev, S. R. Predicting functional effect of human missense mutations using PolyPhen-2. Current Protocols in Human Genetics. , (2013).
  11. Flanagan, S. E., Patch, A. M., Ellard, S. Using SIFT and PolyPhen to predict loss-of-function and gain-of-function mutations. Genetic Testing and Molecular Biomarkers. 14 (4), 533-537 (2010).
  12. Ackerman, M. J., et al. HRS/EHRA expert consensus statement on the state of genetic testing for the channelopathies and cardiomyopathies this document was developed as a partnership between the Heart Rhythm Society (HRS) and the European Heart Rhythm Association (EHRA). Heart Rhythm. 8 (8), 1308-1339 (2011).
  13. Lek, M., et al. Analysis of protein-coding genetic variation in 60,706 humans. Nature. 536 (7616), 285-291 (2016).
  14. Landstrom, A. P., et al. Amino acid-level signal-to-noise analysis of incidentally identified variants in genes associated with long QT syndrome during pediatric whole exome sequencing reflects background genetic noise. Heart Rhythm. 15 (7), 1042-1050 (2018).
  15. Hubbard, T., et al. Ensembl 2005. Nucleic Acids Research. 33, 447-453 (2005).
  16. O’Leary, N. A., et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Research. 44, 733-745 (2016).
  17. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  18. The 100 Genome Projects Consortium. An integrated map of genetic variation from 1,092 human genomes. Nature. 491 (7422), 56-65 (2012).
  19. Fu, W., et al. Analysis of 6,515 exomes reveals the recent origin of most human protein-coding variants. Nature. 493 (7331), 216-220 (2013).
  20. Mulder, N. J., Apweiler, R. Tools and resources for identifying protein families, domains and motifs. Genome Biology. 3 (1), (2002).
  21. Cirino, A. L., et al. A Comparison of Whole Genome Sequencing to Multigene Panel Testing in Hypertrophic Cardiomyopathy Patients. Circulation Cardiovascular Genetics. 10 (5), (2017).
  22. Landstrom, A. P., et al. Interpreting Incidentally Identified Variants in Genes Associated With Catecholaminergic Polymorphic Ventricular Tachycardia in a Large Cohort of Clinical Whole-Exome Genetic Test Referrals. Circulation Arrhythmia and Electrophysiology. 10 (4), (2017).
  23. Whiffin, N., et al. Using high-resolution variant frequencies to empower clinical genome interpretation. Genetics in Medicine. 19 (10), 1151-1158 (2017).
  24. Walsh, R., et al. Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples. Genetics in Medicine. 19 (2), 192-203 (2017).
  25. Buske, O. J., Manickaraj, A., Mital, S., Ray, P. N., Brudno, M. Identification of deleterious synonymous variants in human genomes. Bioinformatics. 31 (5), 799 (2015).
  26. Wen, P., Xiao, P., Xia, J. dbDSM: a manually curated database for deleterious synonymous mutations. Bioinformatics. 32 (12), 1914-1916 (2016).
  27. Bagnall, R. D., et al. Whole Genome Sequencing Improves Outcomes of Genetic Testing in Patients With Hypertrophic Cardiomyopathy. Journal of the American College of Cardiology. 72 (4), 419-429 (2018).
  28. Giudicessi, J. R., Roden, D. M., Wilde, A. A. M., Ackerman, M. J. Classification and Reporting of Potentially Proarrhythmic Common Genetic Variation in Long QT Syndrome Genetic Testing. Circulation. 137 (6), 619-630 (2018).
  29. Sundaram, L., et al. Predicting the clinical impact of human mutation with deep neural networks. Nature Genetics. 50, 1161-1170 (2018).
  30. Krittanawong, C., Zhang, H., Wang, Z., Aydar, M., Kitai, T. Artificial Intelligence in Precision Cardiovascular Medicine. Journal of the American College of Cardiology. 69 (21), 2657-2664 (2017).

Play Video

Cite This Article
Jones, E. G., Landstrom, A. P. Determining the Likelihood of Variant Pathogenicity Using Amino Acid-level Signal-to-Noise Analysis of Genetic Variation. J. Vis. Exp. (143), e58907, doi:10.3791/58907 (2019).

View Video