Das Ziel dieses Protokolls ist es, eine Referenz für unterschiedliche Proteine in einer Gruppe zu entwickeln, die kohärente Kriterien für Nomenklatur und Klassifizierung fehlt. Dieser Verweis erleichtert die Analyse und Diskussion der Gruppe als Ganzes und kann neben etablierten Namen verwendet werden.
Verwandte Proteine, die in verschiedenen Labors mit unterschiedlichen Organismen untersucht wurden, fehlen möglicherweise ein einheitliches System der Nomenklatur und Klassifizierung, macht es schwierig, die Gruppe als Ganzes zu diskutieren und neue Sequenzen in den entsprechenden Kontext zu platzieren. Eine Referenz, die wichtige Reihenfolge Funktionen priorisiert die Entwicklung im Zusammenhang mit Struktur und/oder Aktivität kann neben etablierten Namen hinzufügen einige Kohärenz zu einer vielfältigen Gruppe von Proteinen verwendet werden. Dieses Papier verwendet die Cystein-stabilisierten Alpha-Helix (CS-αβ) Überfamilie als Beispiel um zu zeigen, wie eine Referenz in Tabellenkalkulations-Software erzeugt kann klären Beziehungen zwischen vorhandenen Proteine in der Superfamilie, sowie erleichtern die Zugabe von neu Sequenzen. Es zeigt auch, wie die Referenz zur Sequenz Ausrichtungen erzeugt häufig verwendete Software, was Auswirkungen auf die Gültigkeit der phylogenetische Analysen zu verfeinern beitragen kann. Die Verwendung eines Verweises werden wahrscheinlich am hilfreichsten für Protein-Gruppen, die stark divergierende Sequenzen aus einem breiten Spektrum von Taxa mit Features enthalten, die nicht ausreichend durch molekulare Analysen erfasst werden.
Ein Protein namens sollte widerspiegeln, ist Eigenschaften und Beziehungen zu anderen Proteinen. Leider Namen werden in der Regel zum Zeitpunkt der Entdeckung und Forschung geht weiter, das Verständnis von den größeren Kontext kann sich ändern. Dies kann zu mehreren Namen führen, wenn ein Protein unabhängig von mehr als ein Labor, Änderungen in der Nomenklatur oder in den Eigenschaften dachte, endgültig zu sein, wenn der Name zuweisen und den Namen nicht mehr ausreichend differenziert das Protein identifiziert wurde von den anderen.
Wirbellosen Defensine sind ein gutes Beispiel der Degeneration in Nomenklatur und Klassifizierung. Die ersten Wirbellosen Defensine wurden von Insekten gemeldet, und der Name “Insekt defensin” wurde anhand der wahrgenommenen Homologie zu Säugetieren Defensine1,2vorgeschlagen. Der Begriff defensin wird noch verwendet, obwohl es ist nun klar, dass Wirbellosen und Säugetieren Defensine teilen keinen gemeinsamen Vorfahren3,4. Je nach Tierart möglicherweise ein Wirbellosen “defensin” sechs oder acht Cysteine (, die drei oder vier Disulfid-Bindungen bilden) und eine Vielzahl von antimikrobiellen Aktivitäten. Die Situation, Proteine mit den gleichen Merkmalen zu erschweren wie Defensine “Defensine,” nicht immer genannt werden wie die kürzlich identifizierten Cremycins von Caenorhabditis Remanei5. Darüber hinaus sind Wirbellosen große Defensine eher evolutionär auf vertebrate β-Defensine als auf anderen Wirbellosen Defensine6bezogen werden. Trotzdem setzen Forscher manchmal auf den Namen “defensin” bei der Bestimmung, welche Sequenzen in Analysen einbezogen werden sollten.
Strukturelle Studien zeigten die Ähnlichkeit zwischen Insekten Defensine und Skorpion-Toxine-7und die CS-αβ-Falte wurde anschließend als strukturelle Charakteristikum von Insekten Defensine8gegründet. Diese Falte definiert den Skorpion Toxin-ähnliche (CS-αβ)-Superfamilie in die strukturelle Klassifikation der Proteine (SCOP) Datenbank9umfasst derzeit fünf Familien: Insekt Defensine, kurzkettige Skorpion-Toxine, langkettige Skorpion-Toxine, MGD-1 (ein Weichtier) und pflanzlichen Defensine. Diese Überfamilie ist gleichbedeutend mit der kürzlich beschriebene Cis-Defensine4 und Superfamily 3.30.30.10 CATH/gen 3D Datenbank10,11. Studien aus einer Vielzahl von Wirbellosen Taxa, Pflanzen und Pilze zeigen, dass die Namen der Proteine, die diese Falte enthalten nicht eindeutig mit Cystein Anzahl oder Verklebung Muster, antimikrobielle Aktivität oder Evolutionsgeschichte12zusammenhängen.
Der Mangel an Konsequenz und klare Kriterien machen es schwierig zu benennen und neu identifizierten Sequenzen in dieser Überfamilie zu klassifizieren. Ein großes Hindernis für Proteine in dieser Überfamilie zu vergleichen ist, dass Cysteine, in Bezug auf jede einzelne Sequenz gezählt sind (die erste Cystein in jeder Sequenz ist C1), ohne die Möglichkeit, um die strukturelle Rolle zu berücksichtigen. Dies bedeutet, dass nur Sequenzen mit der gleichen Anzahl von Cysteine verglichen werden können. Es gibt kleine Sequenz Erhaltung als die Cysteine bilden die CS-αβ-Falte, die Achsen und phylogenetische Analysen erschwert. Durch die Entwicklung ein Zahlensystem, das strukturelle Merkmale priorisiert, können leichter Superfamilie Sequenzen verglichen und ausgerichtet. Konservierten Funktionen, sowie die Festlegung auf eine der Untergruppen können schnell visualisiert werden, und neue Sequenzen können leichter in den entsprechenden Kontext gesetzt werden.
Dieses Papier verwendet ein Tabellenkalkulationsprogramm (z.B. Excel) um einen Verweis Nummerierungs-System für die CS-αβ-Superfamilie zu generieren. Es zeigt, wie dies klärt Vergleiche zwischen Sequenzen und wendet sie auf neue CS-αβ-Sequenzen von Bärtierchen identifiziert. Beispiel von der CS-αβ-Superfamilie, wurde das Protokoll geschrieben, um Hilfestellung bei der Verwendung von Sequenzen von Interesse; Es soll jedoch nicht spezifisch zu dieser Überfamilie oder Cystein-reichen Sequenzen sein. Diese Methode werden wahrscheinlich besonders für Gruppen von Proteinen, die wurden unabhängig voneinander in unterschiedlichen Taxa recherchiert und/oder haben wenig allgemeine Sequenzhomologie mit diskreten Merkmalen, die nicht leicht durch molekulare Analysesoftware erkannt werden kann. Diese Methode erfordert einige a-priori Entscheidungen über wichtige Funktionen, so dass es von begrenztem Nutzen sein wird, wenn keine wichtigen Funktionen identifiziert wurden. Das primäre Ziel ist zu zeigen, wie eine einfache Visualisierung der Sequenz Beziehungen erreicht werden kann. Dies kann dann zur Sequenzalignment und Analyse zu informieren, aber wenn Ausrichtung und Analyse der primären Ziele sind, wäre eine Barcode-Methode eine geeignete Alternative, die mehr Kapazität für Automatisierung13hat. Die aktuelle Methode zeigt die Funktionen jedes Peptid in einer linearen Form, so wird es nicht hilfreich für die direkte Visualisierung der 3D-Struktur.
Die Kriterien für die Benennung eines Proteins innerhalb einer Gruppe sollte klar sein, aber dies ist nicht immer der Fall. Sequenzen, die die CS-αβ Falten sind in vielen Laboren unter Verwendung einer Vielzahl von Organismen, die wiederum verschiedene Systeme der Nomenklatur sowie unterschiedliche Charakterisierung untersucht worden. Versuch, eine völlig neue Nomenklatur zu verhängen ist nicht zumutbar und würde zu viel Verwirrung führen, bei der bisherigen Literatur Beratung. Ein Verweis Nummerierungs-System kan…
The authors have nothing to disclose.
Laufende tardigrade antimikrobiellen Peptid-Forschung wird durch Intramurale Mittel aus dem Midwestern University Office of Research und gesponserte Programme (ORSP) unterstützt. Die ORSP hatte keine Rolle beim Studiendesign, Datenerfassung, Analyse, Interpretation oder Manuskript Vorbereitung.
BLAST webpage | https://blast.ncbi.nlm.nih.gov/Blast.cgi | ||
EditSeq (Lasergene suite) | DNASTAR | https://www.dnastar.com/t-allproducts.aspx | |
Excel 2013 | Microsoft | ||
FigTree | http://tree.bio.ed.ac.uk/software/figtree/ | ||
MEGA | www.megasoftware.net | ||
MrBayes | http://mrbayes.sourceforge.net/ | ||
SCOP database | http://scop.mrc-lmb.cam.ac.uk/scop/ |