Aminosäure-Niveau Signal-Rausch-Analyse bestimmt die Prävalenz der genetischen Variation an einer bestimmten Aminosäure-Position auf Hintergrund genetische Variation einer bestimmten Population normalisiert. Dies ermöglicht eine Identifizierung der Variante “Hotspots” in eine Proteinsequenz (Signal), die über die Häufigkeit der seltenen Varianten gefunden in einer Population (Lärm) steigt.
Fortschritten bei der Kosten und Geschwindigkeit der genetische Sequenzierung der nächsten Generation haben eine Explosion von klinischen ganze Exome und gesamten Genoms Tests generiert. Während dies zu erhöhten Identifikation von wahrscheinlich pathogenen Mutationen im Zusammenhang mit genetischen Syndromen geführt hat, hat sie auch drastisch erhöht, die Zahl der übrigens fand genetische Varianten von unbekannter Bedeutung (VUS). Feststellung der klinischen Bedeutung dieser Varianten ist eine große Herausforderung für Wissenschaftler und Kliniker. Es ist ein Ansatz zur Unterstützung bei der Bestimmung der Wahrscheinlichkeit der Pathogenität Signal-Rausch-Analyse auf Proteinebene Sequenz. Dieses Protokoll beschreibt eine Methode für die Aminosäure-Niveau Signal-Rausch-Analyse, die Variante Frequenz bei jeder Aminosäure des Proteins mit bekannten Protein Topologie, um Bereiche der primären Sequenz mit erhöhter Wahrscheinlichkeit zu ermitteln, nutzt pathologische Variation (bezogen auf Bevölkerungsanstieg “Hintergrund”). Diese Methode erkennt Aminosäure Rückstände Lage “Hotspots” der hohe pathologische Signal, welche verwendet werden können, um die diagnostische Gewicht des VUSs wie diejenigen, die von der nächsten Generation Gentests zu verfeinern.
Die schnelle Verbesserung der genetische Sequenzierung Plattformen hat die Zugänglichkeit und die Rolle der Genetik in der Medizin revolutioniert. Sobald auf ein einzelnes Gen oder eine Handvoll Genen beschränkt, ist die Reduzierung der Kosten und Erhöhung der Geschwindigkeit der nächsten Generation genetische Sequenzierung dazu, dass routinemäßige Sequenzierung des gesamten Genoms geführt hat Sequenz (ganze Exome Sequenzierung, WES) Codierung und das gesamte Genom ( kompletten Genoms, WGS) in der klinischen Einstellung. WES und WGS wurden häufig verwendet in der Umgebung von kritisch kranken Neugeborenen und Kindern mit Besorgnis für genetisches Syndrom wo ist es eine bewährte Diagnosetool, das Klinikmanagement1,2ändern kann. Während dies zu erhöhten Identifikation von wahrscheinlich pathogenen Mutationen im Zusammenhang mit genetischen Syndromen geführt hat, stieg es auch drastisch die Anzahl der im übrigen gefundenen genetischen Varianten oder unerwartete positive Ergebnisse von unbekannten Diagnose- Bedeutung (VUS). Während einige dieser Varianten sind außer acht gelassen und nicht gemeldet, Varianten zu lokalisieren sind Gene verbunden mit potenziell tödlichen oder sehr morbide Erkrankungen häufig berichtet. Aktuelle Leitlinien empfehlen Berichterstattung über anfallende Varianten gefunden in bestimmte Gene, die möglicherweise von medizinischen Nutzen für den Patienten, einschließlich der Gene, die im Zusammenhang mit der Entwicklung von plötzlichen kardialen Tod prädisponierende Erkrankungen wie Kardiomyopathien und Channelopathien3. Obwohl diese Empfehlung entwickelt wurde, um Personen in Gefahr einer SCD prädisponierende Erkrankung erfassen, übertrifft die Nachweisempfindlichkeit Variante Spezifität. Dies spiegelt sich in einer wachsenden Zahl von VUSs und übrigens unklar Diagnoseprogramm, die weit über die Häufigkeit der jeweiligen Krankheiten in einer gegebenen Population4Varianten zugeordnet. Eine solche Krankheit, lange QT-Syndrom (LQTS), ist eine kanonische kardiale Channelopathie verursacht durch Mutationen, die Lokalisierung von Genen die kardiale Ionenkanäle codieren oder Kanal-Proteine, wodurch Interaktion verzögert kardiale Repolarisation5. Diese verzögerte Repolarisation, gesehen von einem verlängertem QT-Intervall im Ruhe-EKG, führt zu einem elektrischen Prädisposition für potenziell tödliche ventrikuläre Arrhythmien wie Torsades de Pointes. Während eine Reihe von Genen für die Entwicklung dieser Krankheit, Mutationen im KCNQ1verknüpft wurden-kodiert ichKs Kalium Kanal (KCNQ1, Kv7.1) ist die Ursache des LQTS Typ 1 und ist als ein Beispiel unter6genutzt. Zur Veranschaulichung der Komplexität in der Variante Interpretation, wurde die Anwesenheit von seltenen Varianten in LQTS-assoziierten Genen, so genannte “Hintergrund genetische Variation” beschriebenen7,8.
Neben großen Kompendium-Stil Datenbanken der bekannten pathogenen Varianten existieren mehrere Strategien für die Vorhersage, dass die Wirkung verschiedener Varianten produzieren. Einige basieren auf Algorithmen, wie z. B. SIFT und Polyphen 2, die große Anzahl von Roman nicht gleichbedeutend Varianten vorherzusagen Verderblichkeit9,10filtern können. Trotz breiten Einsatz dieser Werkzeuge begrenzt geringe Spezifität ihrer Anwendbarkeit, wenn es darum geht, “calling” klinische VUSs11. “Signal-Rausch-” Analyse ist ein Werkzeug, das die Wahrscheinlichkeit einer Variante mit Krankheit bezogen auf die Frequenz des bekannten pathologische Variation bei den fraglichen Loci normalisiert gegen seltene genetische Variation aus einer Population identifiziert. Lokalisierung von genetischen Loci Varianten wo gibt es eine hohe Prävalenz von krankheitsassoziierten Mutationen im Vergleich zur Bevölkerung basierende Variante, einen hohen Signal-Rausch-, sind eher krankheitsassoziierten selbst zu sein. Weitere, seltene Varianten fand übrigens auf ein Gen mit einer hohen Frequenz von seltenen Bevölkerung Varianten Lokalisierung im Vergleich zu krankheitsassoziierten Frequenz, eine geringe Signal-Rausch-, möglicherweise seltener Krankheiten. Der diagnostische Nutzen des Signal-Rausch-Analyse hat in den neuesten Leitlinien für Gentests für Kardiomyopathien und Channelopathien illustriert; Es ist jedoch nur auf ganze gen oder domänenspezifische Level12beschäftigt. Vor kurzem gegeben erhöhte Verfügbarkeit der pathologische Varianten (Krankheit Datenbanken, Kohortenstudien in der Literatur) und bevölkerungsbezogenen Kontrolle Varianten (Exome Aggregation Konsortium, ExAC und Genom-Aggregation-Datenbank, GnomAD13), die einzelne Aminosäure-Positionen innerhalb der primären Sequenz eines Proteins zugewiesen wurden. Aminosäure-Niveau Signal-Rausch-Analyse hat bei der Kategorisierung übrigens identifizierter Varianten in Genen verbunden mit LQTS als wahrscheinlich “Hintergrund” genetische Variation, anstatt krankheitsassoziierten bewährt. Unter den drei wichtigen Genen verbunden mit LQTS, einschließlich KCNQ1fehlte diese übrigens identifizierten Varianten eine erhebliche Signal-Rausch-Verhältnis, darauf hindeutet, dass die Häufigkeit dieser Varianten an einzelne Aminosäure-Positionen selten reflektieren Bevölkerungsanstieg anstatt krankheitsassoziierten Mutationen. Darüber hinaus wurde als Protein-spezifische Domänentopologie gegen Gebiete der hohen Signal-Rausch, pathologischer Mutation “Hotspots” auf wichtige Funktionsbereiche der Proteine14lokalisiert überlagert. Diese Methode verspricht bei der Bestimmung, dass (1) die Wahrscheinlichkeit, dass eine Variante krankheitsassoziierten oder Bevölkerung ist und (2) Ermittlung der Roman kritische Funktionsbereiche eines Proteins mit der menschlichen Krankheit verbunden.
Hochdurchsatz-Gentests hat drastisch in seiner Anwendung und Verfügbarkeit im letzten Jahrzehnt weiterentwickelt. Jedoch ist bei vielen Erkrankungen mit etablierten genetische Grundlagen, wie z. B. Kardiomyopathien, erweiterte Tests fehlgeschlagen diagnostische Ausbeute21zu verbessern. Darüber hinaus gibt es erhebliche Unsicherheit in Bezug auf das Diagnoseprogramm von vielen identifizierte Varianten. Dies ist teilweise auf eine wachsende Zahl von übrigens identifizierten seltenen Varianten ent…
The authors have nothing to disclose.
APL ist von den nationalen Instituten der Gesundheit K08-HL136839 unterstützt.
1000 Genome Project | N/A | www.internationalgenome.org | |
ClinVar | N/A | www.ncbi.nlm.nih.gov/clinvar | |
Ensembl Genome Browser | N/A | uswest.ensembl.org/index.html | |
Excel | Microsoft | office.microsoft.com/excel/ | Used for all example formulas and functions |
Exome Aggregation Consortium | N/A | www.exac.broadinstitute.org | |
Genome Aggregation Database | N/A | www.gnomad.broadinstitute.org | |
National Center for Biotechnology Information Domain and Structure Database | N/A | www.ncbi.nlm.nih.gov/guide/domains-structures/ | |
National Center for Biotechnology Information Gene Database | N/A | www.ncbi.nlm.nih.gov/gene/ | |
National Center for Biotechnology Information Protein Database | N/A | www.ncbi.nlm.nih.gov/protein/ | |
National Heart, Lung, and Blood Institute GO Exome Sequencing Project | N/A | www.evs.gs.washington.edu/EVS/ | |
SnapGene | GSL Biotech LCC | www.snapgene.com | |
University of California, Santa Cruz Human Genome Browser | N/A | www.genome.ucsc.edu |