Аминокислоты уровня сигнала к шуму анализ определяет распространенности генетической вариации в данной аминокислоты позиции нормированы фон генетической вариации населения. Это позволяет для идентификации вариант «горячих точек» в последовательности белка (сигнал), который поднимается выше частота редких вариантов в популяции (шум).
Прогресс в стоимость и скорость следующего поколения генетическое секвенирование вызвали взрыв клинических весь exome и тестирования всего генома. Хотя это привело к увеличению идентификации вероятно патогенных мутаций, связанных с генетическими синдромами, он также резко возросло количество кстати нашел генетических вариантов неизвестное значение (VUS). Определение клиническое значение из этих вариантов является серьезной проблемой для ученых и клиницистов. Подход для оказания помощи в определении вероятности патогенности является анализ сигнал шум на уровне последовательности белка. Этот протокол описывает метод для анализа сигнал шум аминокислоты уровня, который использует вариант частоты в позиции каждой аминокислоты белка с топологией известных белков для выявления областей первичной последовательности с повышенной вероятностью патологические изменения (относительно населения «фон» вариант). Этот метод можно определить аминокислотных остатков местоположение «горячих точек» высокой патологический сигнал, который может использоваться для уточнения диагностических вес VUSs например тех, которые определены следующего поколения генетического тестирования.
Быстрое улучшение генетического секвенирования платформ изменила доступности и роли генетики в медицине. После только одного гена, или горсть генов, сокращение расходов и увеличение скорости следующего поколения, генетического секвенирования привело обычной последовательности весь геном программирования последовательности (exome вся последовательность, Уэс) и весь геном ( всего генома, РГ) в клинических условиях. Уэс и WGS были использованы часто в параметре тяжелобольным новорожденных и детей с обеспокоенностью за генетическим синдромом где это доказано диагностический инструмент, который может изменить клинического управления1,2. Хотя это привело к увеличению идентификации вероятно патогенных мутаций, связанных с генетическими синдромами, он также резко возросло количество случайно найденный генетических вариантов, или неожиданные положительные результаты, неизвестных диагностики значение (VUS). Хотя некоторые из этих вариантов не учитываются и не сообщается, варианты локализации для гены, связанные с потенциально смертельным или весьма болезненный заболеваний часто сообщают. Нынешние руководящие принципы рекомендуют отчетности непредвиденных вариантов в конкретных генов, которые могут быть медицинская польза для пациента, включая гены, связанные с развитием внезапной сердечной смерти предрасполагающие заболеваний, таких как кардиомиопатии и channelopathies3. Хотя эта рекомендация была разработана для захвата людей риску заболевания SCD-предрасполагающие, чувствительность вариант определения намного превышает специфичности. Это находит свое отражение в растущее число VUSs и кстати выявлены варианты с неясными диагностики Утилита, которая намного превышает частоту соответствующих заболеваний в данной популяции4. Один такой болезни, долго QT синдром (LQTS), является каноническим сердечной channelopathy, вызванных мутациями, локализация генов, кодирующих сердца ионных каналов, или каналов взаимодействия белки, что приводит к задержки сердца реполяризации5. Эта задержка реполяризации, видели длительного интервала QT на отдыха электрокардиограмма, приводит к электрической предрасположенность к потенциально смертельным желудочковых аритмий, например torsades de pointes. Хотя количество генов были связаны в развитие этого заболевания, мутации в KCNQ1-кодировке яKs калия канал (KCNQ1, Kv7.1) является причиной LQTS типа 1 и используется в качестве примера ниже6. Иллюстрирующих сложность в вариант интерпретации, наличие редких вариантов в LQTS-связанных генов, так называемые «фон генетической вариации» был ранее описанных7,8.
В дополнение к большой сборник стиль баз известных патогенных вариантов для предсказывая будет производить эффект различные варианты существуют несколько стратегий. Некоторые основаны на алгоритмы, такие как ПРОСЕЯТЬ и 2 Polyphen, которые можно отфильтровать большое количество роман не синонимами вариантов предсказать deleteriousness9,10. Несмотря на широкое использование этих инструментов низкой специфичности ограничивает их применимости, когда дело доходит до «вызова» клинических VUSs11. «Сигнал шум» анализ — инструмент, который определяет вероятность того вариант, связанный с болезнью, основываясь на частоте известных патологические изменения на локусов в вопросе нормализации против редких генетических отклонений от населения. Локализация для генетических локусов варианты там, где высокая распространенность болезней связанных мутаций, по сравнению с населения на основе вариации, высокий сигнал шум, являются скорее болезнь связанные сами. Кроме того, редкие варианты нашел кстати локализации к гену с высокой частотой редких населения вариантов по сравнению с болезнь связанные частоты, низкий сигнал шум, может быть меньше шансов быть связанных заболеваний. Утилиты диагностики сигнал шум анализа была показана в последних руководящих принципах генетического тестирования, кардиомиопатии и channelopathies; Однако он только работал на уровне весь ген или доменного уровня12. Недавно учитывая увеличение объема патологической варианты (болезнь баз данных, когортные исследования в литературе) и варианты управления на основе населения (консорциум агрегации Exome, ExAC и агрегирования данных генома, GnomAD13), Это был применен к позиции отдельных аминокислот в рамках первичной последовательности белка. Аминокислоты уровня сигнала к шуму анализ оказался полезным в классификации кстати выявленных вариантов в генах, связанные с LQTS как вероятно генетической вариации «фон» вместо того, чтобы связанные заболевания. Среди трех основных генов, связанных с LQTS, включая KCNQ1эти кстати выявленных вариантов отсутствуют значительные соотношения сигнал шум, предполагая, что частота этих вариантов на позициях отдельных аминокислот отражают редкий населения вариации, а не связанных заболеваний мутации. Кроме того, когда белок доменного топологии был обложил против областях высокий сигнал шум, патологический мутации «горячих точек», локализованные в ключевых функциональных областях белки14. Эта методология является перспективным в определения что 1) вероятность того вариант болезни или населения, связанных и 2) роман критических функциональные домены белка, связанные с заболеваний человека.
Высок объём генетическое тестирование передовые резко в ее применения и доступности в последнее десятилетие. Однако во многих заболеваний с устоявшейся генетических основ, таких как кардиомиопатии, расширенного тестирования не удалось улучшить диагностический выход21. К…
The authors have nothing to disclose.
APL поддерживается путем национальных институтов из здравоохранения K08-HL136839.
1000 Genome Project | N/A | www.internationalgenome.org | |
ClinVar | N/A | www.ncbi.nlm.nih.gov/clinvar | |
Ensembl Genome Browser | N/A | uswest.ensembl.org/index.html | |
Excel | Microsoft | office.microsoft.com/excel/ | Used for all example formulas and functions |
Exome Aggregation Consortium | N/A | www.exac.broadinstitute.org | |
Genome Aggregation Database | N/A | www.gnomad.broadinstitute.org | |
National Center for Biotechnology Information Domain and Structure Database | N/A | www.ncbi.nlm.nih.gov/guide/domains-structures/ | |
National Center for Biotechnology Information Gene Database | N/A | www.ncbi.nlm.nih.gov/gene/ | |
National Center for Biotechnology Information Protein Database | N/A | www.ncbi.nlm.nih.gov/protein/ | |
National Heart, Lung, and Blood Institute GO Exome Sequencing Project | N/A | www.evs.gs.washington.edu/EVS/ | |
SnapGene | GSL Biotech LCC | www.snapgene.com | |
University of California, Santa Cruz Human Genome Browser | N/A | www.genome.ucsc.edu |