Análise de sinal-ruído nível de aminoácidos determina a prevalência da variação genética em uma posição de determinado aminoácido normalizada a variação genética de fundo de uma dada população. Isto permite a identificação de variantes “hotspots” dentro de uma sequência da proteína (sinal) que se eleva acima da frequência das variantes raras encontradas em uma população (ruído).
Avanços no custo e velocidade de sequenciamento genético de próxima geração têm gerado uma explosão de exome toda clínico e testes de genoma inteiro. Enquanto isto conduziu à maior identificação de prováveis mutações patogénicas associado com síndromes genéticas, dramaticamente também aumentou o número de encontrados incidentalmente variantes genéticas de significado desconhecido (VU). Determinar a significância clínica destas variantes é um grande desafio para os cientistas e clínicos. Análise de sinal-ruído a nível de sequência de proteínas é uma abordagem para ajudar a determinar a probabilidade de patogenicidade. Este protocolo descreve um método para a análise de sinal-ruído nível de aminoácido que utiliza frequência variante em cada posição do ácido aminado da proteína com topologia de proteínas conhecidas para identificar áreas da sequência principal com elevada probabilidade de variação patológica (em relação a variação de população “fundo”). Esse método pode identificar a localização de resíduo de aminoácido “hotspots” de alto sinal patológico, que pode ser usado para refinar o diagnóstico peso de VUSs tais como as identificadas por testes genéticos na próxima geração.
A melhoria rápida em plataformas de sequenciamento genético tem revolucionado a acessibilidade e o papel da genética na medicina. Uma vez que se limita a um único gene, ou um punhado de genes, a redução de custos e aumento na velocidade da próxima geração de sequenciamento genético levou rotineiro sequenciamento da totalidade do genoma da codificação de sequência (toda exome sequenciamento, WES) e o genoma inteiro ( sequenciamento do genoma inteiro, WGS) na prática clínica. WES e WGS têm sido utilizados com frequência no cenário de neonatos criticamente doentes e crianças com preocupação para síndrome genética onde é uma ferramenta de diagnóstico comprovada que pode mudar o manejo clínico1,2. Enquanto isto conduziu à maior identificação de prováveis mutações patogénicas associado com síndromes genéticas, dramaticamente também aumentou o número de variantes genéticas encontradas incidentalmente, ou inesperados resultados positivos, de diagnóstico desconhecido significado (VU). Enquanto algumas das variantes são tidas em conta e não relatadas, variantes localizando a genes associados a doenças potencialmente fatais ou altamente mórbidas frequentemente são relatados. As diretrizes atuais recomendam relatórios de incidentais variantes encontradas em genes específicos que podem ser de benefício médico ao paciente, incluindo genes associados com o desenvolvimento de doenças predisponentes de morte cardíacas súbitas como Miocardiopatias e canalopatias3. Embora esta recomendação foi projetada para capturar indivíduos em risco de uma doença SCD-predisponentes, a sensibilidade de detecção de variante excede a especificidade. Isto é refletido em um número crescente de VUSs e aliás identificadas variantes com utilitário de diagnóstico incerto que ultrapassam a frequência das respectivas doenças em uma dada população4. Uma tal doença, síndrome QT longo (LQTS), é um canônico channelopathy cardíaca causada por mutações de localização de genes que codificam os canais iônicos cardíacos, ou canal de interação de proteínas, resultando em atraso repolarização cardíaca5. Este repolarização retardada, vista por um intervalo QT prolongado no eletrocardiograma, de repouso resulta em uma elétrica predisposição para arritmias ventriculares potencialmente fatais como pointes de torsades de. Enquanto um número de genes têm sido associado ao desenvolvimento desta doença, mutações em KCNQ1-codificadoKs potássio canal (KCNQ1, Kv7.1) é a causa do LQTS tipo 1 e é utilizado como um exemplo abaixo de6. Ilustrando a complexidade na interpretação de variante, a presença de raras variantes em genes associados LQTS, assim chamados “variação genética do fundo” tem sido descrito anteriormente7,8.
Compêndio-estilo grandes bases de dados de variantes conhecidas patogênicas, além de várias estratégias existem para predizer que as variantes diferentes do efeito produzirá. Alguns são baseados em algoritmos, tais como SIFT e Polyphen 2, que pode filtrar um grande número de variantes não-sinônimo novela para prever deleteriousness9,10. Apesar do amplo uso dessas ferramentas, baixa especificidade limita sua aplicabilidade quando se trata de “chamar” clínica VUSs11. Análise de “Sinal-ruído” é uma ferramenta que identifica a probabilidade de uma variante a ser associada com doença, com base na frequência de variação patológica conhecida no locus em questão normalizada contra rara variação genética de uma população. Localizando a loci genéticos de variantes onde existe uma elevada prevalência de mutações associadas a doença em comparação com a variação populacional, um alto sinal-ruído, são mais propensos a ser associada a doença de si mesmos. Além disso, raras variantes encontradas incidentalmente localizando a um gene com uma alta frequência das variantes de população rara em comparação com frequência associada a doença, um baixo sinal-ruído, podem ser menos propensos a ser associada a doença. O utilitário de diagnóstico de análise de sinal-ruído tem sido ilustrado nas mais recentes orientações para testes genéticos para cardiomiopatias e canalopatias; no entanto, isso só tem sido empregado no nível do gene inteiro ou específicas de domínio nível12. Recentemente, dado o aumento da disponibilidade de variantes patológicas (doença bancos de dados, estudos de coorte na literatura) e variantes de controle populacional (Exome agregação consórcio, exacerbar e banco de dados de agregação do genoma, GnomAD13), Isto tem sido aplicado para as posições individuais de aminoácidos na sequência primária de uma proteína. Análise de sinal-ruído nível de aminoácido provou útil em categorizar aliás identificadas variantes em genes associados com LQTS como provável variação genética do “fundo”, ao invés de doença associada. Entre os três principais genes associados com LQTS, incluindo KCNQ1, essas variantes identificadas por acaso carecia de uma significativa rácios de sinal-ruído, sugerindo que a frequência dessas variantes em posições de aminoácidos individuais refletem rara variação de população ao invés de mutações associadas a doenças. Além disso, quando a topologia de domínio específico da proteína era revestida contra áreas de alta sinal-ruído, patológica mutação “hotspots” localizadas em domínios-chave funcionais das proteínas14. Esta metodologia é uma promessa para determinar que 1) a possibilidade de uma variante é associada a doença ou população e 2) identificando romance críticos domínios funcionais de uma proteína associada à doença humana.
Testes genéticos do elevado-throughput avançou dramaticamente em sua aplicação e disponibilidade durante a última década. No entanto, em muitas doenças com fundamentos de genéticas bem estabelecidas, como cardiomiopatias, expandido teste falhou melhorar o rendimento diagnóstico21. Além disso, há uma incerteza significativa sobre o utilitário de diagnóstico de muitas variantes identificadas. Isto é parcialmente devido a um número crescente de aliás identificadas variantes raras desc…
The authors have nothing to disclose.
APL é suportado pelos institutos nacionais de saúde K08-HL136839.
1000 Genome Project | N/A | www.internationalgenome.org | |
ClinVar | N/A | www.ncbi.nlm.nih.gov/clinvar | |
Ensembl Genome Browser | N/A | uswest.ensembl.org/index.html | |
Excel | Microsoft | office.microsoft.com/excel/ | Used for all example formulas and functions |
Exome Aggregation Consortium | N/A | www.exac.broadinstitute.org | |
Genome Aggregation Database | N/A | www.gnomad.broadinstitute.org | |
National Center for Biotechnology Information Domain and Structure Database | N/A | www.ncbi.nlm.nih.gov/guide/domains-structures/ | |
National Center for Biotechnology Information Gene Database | N/A | www.ncbi.nlm.nih.gov/gene/ | |
National Center for Biotechnology Information Protein Database | N/A | www.ncbi.nlm.nih.gov/protein/ | |
National Heart, Lung, and Blood Institute GO Exome Sequencing Project | N/A | www.evs.gs.washington.edu/EVS/ | |
SnapGene | GSL Biotech LCC | www.snapgene.com | |
University of California, Santa Cruz Human Genome Browser | N/A | www.genome.ucsc.edu |