Het doel van dit protocol is het ontwikkelen van een verwijzing voor uiteenlopende eiwitten in een groep die ontbreekt aan coherente criteria voor nomenclatuur en classificatie. Deze referentie zal vergemakkelijken, analyses en discussie van de groep als geheel en kan worden gebruikt naast gevestigde namen.
Verwante proteïnen die zijn bestudeerd in verschillende laboratoria met behulp van verschillende organismen mag het ontbreken van een uniform systeem van nomenclatuur en classificatie, waardoor het moeilijk is om te bespreken van de groep als geheel en nieuwe sequenties in de juiste context plaatsen. Ontwikkeling van een referentie die prioriteit belangrijke reeks functies geeft verband houden met structuur en/of activiteit kan worden gebruikt naast gevestigde namen toe te voegen sommige coherentie aan een diverse groep van eiwitten. Deze paper gebruikt de superfamilie cysteïne-gestabiliseerde alpha-helix (CS-αβ) als een voorbeeld om te laten zien hoe een verwijzing gegenereerd in spreadsheet-software kan verduidelijking van de relaties tussen bestaande eiwitten in de superfamilie, evenals vergemakkelijken de toevoeging van nieuwe sequenties. Het laat ook zien hoe de verwijzing kan helpen om reeks aanpassingen gegenereerd in de gebruikte software, die invloed op de geldigheid van de fylogenetische analyses te verfijnen. Het gebruik van een verwijzing zal waarschijnlijk meest nuttig voor eiwit groepen waarin zeer uiteenlopende sequenties van een breed spectrum van taxa, met functies die niet adequaat door moleculaire analyses zijn vastgelegd.
Van een eiwit naam een afspiegeling is van de kenmerken en de relatie tot andere eiwitten. Helaas, namen zijn over het algemeen toegewezen op het moment van ontdekking en zoals onderzoek blijft, het inzicht in de grotere context kan veranderen. Dit kan leiden tot meerdere namen als een eiwit onafhankelijk door meer dan één lab, wijzigingen in de nomenclatuur of in de kenmerken gezien ontdekt werd als definitieve bij het toewijzen van de naam en de naam niet langer voldoende differentiatie van het eiwit van anderen.
Ongewervelde defensinen bieden een goed voorbeeld van degeneratie in de nomenclatuur en classificatie. De eerste-ongewervelde defensinen werden gemeld van insecten, en de naam “insect defensin” werd voorgesteld op basis van de waargenomen homologie aan zoogdieren defensinen1,2. De term defensin wordt nog steeds gebruikt, hoewel het is nu duidelijk dat ongewervelde en zoogdieren defensinen ben niet een gemeenschappelijke voorouder3,4. Afhankelijk van de soort kan wellicht een ongewervelden “defensin” zes of acht cysteines (die drie of vier disulfide bindingen vormen) en een scala aan antimicrobiële activiteiten. Om compliceren de situatie, eiwitten met dezelfde kenmerken als de defensinen zijn niet altijd genoemd “defensinen,” zoals de onlangs vastgestelde cremycins van Caenorhabditis remanei5. Daarnaast zijn de ongewervelde grote defensinen waarschijnlijker evolutionair verband te houden met gewervelde β-defensinen dan andere ongewervelde defensinen6. Ondanks dit, zijn onderzoekers soms afhankelijk van de naam “defensin” bij het bepalen welke rijen moeten worden opgenomen in de analyses.
Structurele studies bleek de gelijkenis tussen insect defensinen en scorpion toxines7en de CS-αβ-vouw vervolgens werd opgericht als het belangrijkste structurele kenmerk van insecten defensinen8. Deze vouw definieert de scorpion toxine-achtige (CS-αβ) superfamilie in de structurele indeling van eiwitten (SCOP) database9, waarin momenteel vijf families: insect defensinen, korte keten scorpion toxines, lange-keten scorpion toxines, MGD-1 (vanaf een weekdier), en plant defensinen. Deze superfamilie is synoniem met de recent beschreven cis-defensinen4 en de superfamilie 3.30.30.10 in de CATH/Gene 3D database10,11. Studies uit een verscheidenheid van ongewervelde taxa, planten en schimmels Toon dat de namen van eiwitten die deze vouw bevatten niet duidelijk zijn gerelateerd aan cysteïne getal of hechting patroon, antimicrobiële activiteit of evolutionaire geschiedenis12.
Het gebrek aan samenhang en duidelijke criteria maken het uitdagend naam te geven en nieuw geïdentificeerd sequenties in deze superfamilie classificeren. Een belangrijk obstakel voor het vergelijken van de eiwitten in deze superfamilie is dat cysteines met betrekking tot elke individuele opeenvolging (het eerste cysteïne in elke opeenvolging is C1), met geen enkele manier verantwoordelijk voor de structurele rol worden genummerd. Dit betekent dat alleen sequenties met hetzelfde aantal cysteines kunnen worden vergeleken. Er zijn kleine volgorde instandhouding dan de vorming van de CS-αβ-vouwen, waardoor uitlijning en fylogenetische analyses moeilijk cysteines. Door het ontwikkelen van een nummeringssysteem op dat prioriteit structurele kenmerken geeft, kunnen het superfamilie sequenties gemakkelijker worden vergeleken en uitgelijnd. Geconserveerde functies, alsmede vaststelling van subgroepen, kunnen snel worden gevisualiseerd en nieuwe sequenties kunnen gemakkelijker worden geplaatst in de juiste context.
Deze paper gebruikt een spreadsheet-programma (bijvoorbeeld Excel) voor het genereren van een systeem voor de CS-αβ-superfamilie nummering verwijzing. Het laat zien hoe dit verduidelijkt vergelijkingen tussen sequenties en toegepast op nieuwe CS-αβ-sequenties geïdentificeerd van beerdiertjes. De superfamilie van de CS-αβ als een voorbeeld gebruikt, werd het protocol geschreven te adviseren bij het gebruik van sequenties van belang; het is echter niet bedoeld om specifiek naar deze superfamilie of cysteïne-rijke sequenties. Deze methode zal wellicht nuttigst voor groepen van proteïnen toe die onafhankelijk van elkaar in uiteenlopende taxa zijn onderzocht en/of hebben weinig algemene reeks homologie, met aparte kenmerken die niet gemakkelijk kan worden herkend door moleculaire analysesoftware. Deze methode vereist sommige een priori besluiten over belangrijke kenmerken, dus het zal van beperkt nut als geen belangrijke kenmerken zijn geïdentificeerd. Het primaire doel is om te laten zien hoe een eenvoudige visualisatie van de reeks relaties kan worden bereikt. Dit kan vervolgens worden gebruikt om sequentie alignering en analyse te informeren, maar als uitlijning en analyse de primaire doelstellingen zijn, een barcode-methode zou een geschikt alternatief, dat meer capaciteit voor automatisering13 heeft. De huidige methode geeft de kenmerken van elke peptide in een lineaire vorm, zodat het niet zal nuttig zijn voor de directe visualisatie van 3D-structuur.
De criteria voor de naamgeving van een eiwit binnen een groep moet duidelijk zijn, maar dit is niet altijd het geval. Sequenties die hebben de CS-αβ vouwen zijn bestudeerd in veel laboratoria met behulp van een verscheidenheid van organismen, wat resulteert in verschillende systemen van de nomenclatuur, evenals de verschillende niveaus van karakterisering. Probeert op te leggen van een volledig nieuwe nomenclatuur is niet redelijk en zou leiden tot veel verwarring bij het raadplegen van de bestaande literatuur. Een ver…
The authors have nothing to disclose.
Lopende tardigrade antimicrobiële peptide onderzoek wordt ondersteund door intramurale financiering uit het Midwesten Universiteit Office of Research en gesponsorde programma’s (ORSP). De ORSP had geen rol in de studie ontwerp, gegevensverzameling, analyse, interpretatie of manuscript voorbereiding.
BLAST webpage | https://blast.ncbi.nlm.nih.gov/Blast.cgi | ||
EditSeq (Lasergene suite) | DNASTAR | https://www.dnastar.com/t-allproducts.aspx | |
Excel 2013 | Microsoft | ||
FigTree | http://tree.bio.ed.ac.uk/software/figtree/ | ||
MEGA | www.megasoftware.net | ||
MrBayes | http://mrbayes.sourceforge.net/ | ||
SCOP database | http://scop.mrc-lmb.cam.ac.uk/scop/ |