Analyse de signal-bruit au niveau d’acides aminés détermine la prévalence de la variation génétique à une position donnée d’acides aminés normalisée à variation génétique de fond d’une population donnée. Cela permet l’identification des variantes « hotspots » dans une séquence de protéines (signal) qui s’élève au-dessus de la fréquence des variants rares trouvées dans une population (bruit).
Avancements dans le coût et la rapidité du séquençage génétique de prochaine génération ont généré une explosion de l’exome toute clinique et tests du génome entier. Alors que cela a conduit à l’identification accrue des mutations pathogènes susceptibles, associées à des syndromes génétiques, il a augmenté considérablement le nombre d’ailleurs trouvé des variantes génétiques d’importance inconnue (VUS). C’est un défi majeur pour les scientifiques et les cliniciens de déterminer la signification clinique de ces variantes. Une approche pour aider à déterminer la probabilité de pathogénicité est analyse de signal-bruit au niveau de séquences de protéines. Ce protocole décrit une méthode pour l’analyse de signal-bruit au niveau d’acides aminés qui exploite une fréquence variant à chaque position d’acides aminés de la protéine avec topologie protéiques connus pour identifier les domaines de la séquence primaire avec une probabilité élevée de variations pathologiques (par rapport à la variation de la population de « fond »). Cette méthode peut identifier l’emplacement de résidus d’acides aminés « points chauds » du signal pathologique élevé, ce qui permet d’affiner le diagnostic poids de VUSs tels que ceux identifiés par dépistage génétique de prochaine génération.
L’amélioration rapide des plateformes de séquençage génétique a révolutionné l’accessibilité et le rôle de la génétique en médecine. Une fois limité à un seul gène, ou une poignée de gènes, la réduction des coûts et augmentation de la vitesse de prochaine génération séquençage génétique a conduit le séquençage systématique de la totalité du génome de codage séquence (séquençage de l’exome entier, WES) et le génome entier () le séquençage du génome entier, WGS) en milieu clinique. WES et groupes de travail ont été utilisés fréquemment dans le cadre des nouveau-nés gravement malades et les enfants avec le souci de syndrome génétique où c’est un outil diagnostique qui peut changer la prise en charge clinique1,2. Alors que cela a conduit à l’identification accrue des mutations pathogènes susceptibles, associées à des syndromes génétiques, il a considérablement augmenté le nombre de variants génétiques trouvées ailleurs, ou des résultats positifs inattendus, de diagnostic inconnu signification (VUS). Tandis que certaines de ces variantes sont ignorées et non publiées, variantes, localisation de gènes associés à des maladies potentiellement mortelles ou très morbides sont souvent signalés. Lignes directrices actuelles recommandent déclaration des variantes accessoires trouvées dans les gènes spécifiques qui peuvent être d’utilité médicale du patient, y compris les gènes associés à l’apparition des maladies de prédisposant à la mort cardiaques soudaines comme les cardiomyopathies et Canalopathies3. Bien que cette recommandation a été conçue pour capturer des personnes présentant un risque d’une maladie prédisposant à la SCD, la sensibilité de détection variante dépasse de loin spécificité. Cela se reflète dans un nombre croissant de VUSs et par ailleurs identifié des variantes avec l’utilitaire de diagnostic difficile qui dépassent de loin la fréquence des maladies dans une population donnée4respectifs. Une telle maladie, le syndrome du QT long (SQTL), est un canonique canalopathie cardiaque causée par des mutations, localisation de gènes qui codent des canaux ioniques cardiaques ou canal interaction protéines, aboutissant à retard de repolarisation cardiaque5. Cette repolarisation retardée, vue par un intervalle prolongé de QT sur l’électrocardiogramme, de repos se traduit par une prédisposition électrique à des arythmies ventriculaires potentiellement mortelles telles que des torsades de pointes. Alors qu’un certain nombre de gènes ont été associé au développement de cette maladie, les mutations KCNQ1-j’ai codéKs potassium channel (KCNQ1, Kv7.1) est la cause du SQTL type 1 et est utilisé comme un exemple inférieur à6. Illustrant la complexité dans l’interprétation variant, la présence de variants rares dans les gènes associés à la SQTL, ce qu’on appelés « variation génétique de fond » a été décrite précédemment7,8.
En plus de bases de données grand recueil de style des variantes pathogènes connus, plusieurs stratégies existent pour prédire que les variantes différentes effet produira. Certains sont basés sur des algorithmes, tels que les EIPD et Polyphen 2, qui peut filtrer un grand nombre de nouvelles variantes non-synonyme de prédire prohibé9,10. Malgré une large utilisation de ces outils, faible spécificité limite leur applicabilité lorsqu’il s’agit de « vocation » clinique VUSs11. Analyse de « Signal sur bruit » est un outil qui identifie la probabilité d’une variante étant associée à la maladie basée sur la fréquence de la variation pathologique connue aux loci en question normalisée contre rare variation génétique d’une population. Variantes de localisation au locus génétiques où il y a une forte prévalence des mutations associées à la maladie par rapport à la variation sur la population, un signal sur bruit élevé, sont plus susceptibles d’être associés à la maladie eux-mêmes. En outre, rares variantes trouvées ailleurs localisation d’un gène ayant une fréquence élevée de variantes rares de population par rapport à la fréquence associés à la maladie, un faible signal-bruit, peut être moins susceptibles d’être associés à la maladie. L’utilitaire de diagnostic de l’analyse de signal-bruit a été illustré dans les dernières directives pour des tests génétiques pour les cardiomyopathies et Canalopathies ; Toutefois, il a seulement été utilisé au niveau du gène entier ou spécifiques à un domaine de niveau12. Récemment, étant donné la disponibilité accrue de variantes pathologiques (maladie bases de données, études de cohortes dans la littérature) et variantes de contrôle axée sur la population (Consortium d’agrégation de l’Exome, ExAC et les bases de données génomiques agrégation, GnomAD13), Ceci a été appliqué à la position de chaque acide aminé dans la séquence primaire d’une protéine. Analyse de signal-bruit au niveau d’acides aminés a révélé utile pour catégoriser les variantes d’ailleurs identifiés dans les gènes associés à SQTL comme probablement des variations génétiques « arrière-plan » plutôt que des associés à la maladie. Parmi les trois principaux gènes associés du SQTL, y compris KCNQ1, ces variants identifiés soit dit en passant n’avait pas un ratio signal-bruit significative, suggérant que la fréquence de ces variantes aux positions des acides aminés individuels représentent les rares variation de la population plutôt que des mutations associées à la maladie. En outre, lorsque la topologie de domaine spécifique à la protéine a été superposée contre les zones de forte mutation signal-bruit, pathologique « points chauds » localisés dans les principaux domaines fonctionnels de la protéines14. Cette méthodologie est prometteuse à déterminer 1) la probabilité d’une variante ou population-associés à la maladie et 2) identifier les nouveaux domaines fonctionnels critiques d’une protéine associée à la maladie humaine.
Tests génétiques haut débit a progressé considérablement dans sa demande et la disponibilité durant la dernière décennie. Toutefois, dans de nombreuses maladies avec des fondements génétiques bien établis, comme les cardiomyopathies, essai élargi a échoué à améliorer le rendement diagnostique21. En outre, il y a une incertitude importante concernant l’utilitaire de diagnostic de nombreux variants identifiés. Ceci est partiellement dû à un nombre croissant d’ailleurs identifi…
The authors have nothing to disclose.
APL est pris en charge par les instituts nationaux de santé K08-HL136839.
1000 Genome Project | N/A | www.internationalgenome.org | |
ClinVar | N/A | www.ncbi.nlm.nih.gov/clinvar | |
Ensembl Genome Browser | N/A | uswest.ensembl.org/index.html | |
Excel | Microsoft | office.microsoft.com/excel/ | Used for all example formulas and functions |
Exome Aggregation Consortium | N/A | www.exac.broadinstitute.org | |
Genome Aggregation Database | N/A | www.gnomad.broadinstitute.org | |
National Center for Biotechnology Information Domain and Structure Database | N/A | www.ncbi.nlm.nih.gov/guide/domains-structures/ | |
National Center for Biotechnology Information Gene Database | N/A | www.ncbi.nlm.nih.gov/gene/ | |
National Center for Biotechnology Information Protein Database | N/A | www.ncbi.nlm.nih.gov/protein/ | |
National Heart, Lung, and Blood Institute GO Exome Sequencing Project | N/A | www.evs.gs.washington.edu/EVS/ | |
SnapGene | GSL Biotech LCC | www.snapgene.com | |
University of California, Santa Cruz Human Genome Browser | N/A | www.genome.ucsc.edu |