Summary

Créer et appliquer une référence afin de faciliter la Discussion et la Classification des protéines dans un groupe diversifié

Published: August 16, 2017
doi:

Summary

Ce protocole vise à développer une référence pour les protéines divergentes dans un groupe qui n’a pas de critères cohérents pour la classification et la nomenclature. Cette référence facilitera l’analyse et la discussion du groupe dans son ensemble et peut être utilisée en plus de noms établis.

Abstract

Protéines apparentées qui ont été étudiés dans des laboratoires différents utilisant des différents organismes n’ont pas un système uniforme de la nomenclature et classification, rendant difficile de discuter de l’ensemble du groupe et de placer de nouvelles séquences dans le contexte approprié. Développer une référence qui donne la priorité aux fonctionnalités importantes séquences liées à structure et/ou de l’activité peut être utilisée en plus des noms établis pour ajouter quelque cohérence à un groupe diversifié de protéines. Cet article utilise la super-famille des (CS-αβ) hélice alpha cystéine stabilisé à titre d’exemple pour montrer comment une référence générée en tableur peut clarifier les relations entre les protéines existantes dans la superfamille, ainsi que faciliter l’ajout de nouveaux séquences. Il montre également comment la référence peut aider à affiner les alignements de séquences générées dans les logiciels couramment utilisés, dont l’incidence sur la validité des analyses phylogénétiques. L’utilisation d’une référence sera probablement plus utile pour les groupes de protéines qui incluent des séquences très divergentes d’un vaste éventail de taxons, avec des fonctionnalités qui ne sont pas suffisamment couverts par les analyses moléculaires.

Introduction

Nom de la protéine devrait refléter est caractéristiques et relation à d’autres protéines. Malheureusement, les noms sont généralement affectés au moment de la découverte et que les recherches se poursuivent, la compréhension de l’ensemble des contextes peut-être changer. Cela peut conduire à plusieurs noms si une protéine a été identifiée séparément par plus d’un laboratoire, à des changements dans la nomenclature ou dans les caractéristiques considérés comme définitif lorsque vous affectez le nom et le nom n’est plus suffisamment différenciant la protéine d’autres personnes.

Les défensines invertébrés offrent un bon exemple de la dégénérescence dans la nomenclature et la classification. Les premiers défensines d’invertébrés ont été signalés par les insectes, et le nom « defensin insecte » a été proposée basée sur l’homologie perçue à mammifères défensines1,2. Le terme defensin est toujours utilisé, même s’il est maintenant clair que défensines invertébrés et mammifères ne partagent pas un ancêtre commun3,4. Selon les espèces, un invertébré « defensin » peut avoir six ou huit des cystéines (qui forment trois ou quatre ponts disulfures) et une variété d’activités antimicrobiennes. Pour compliquer la situation, protéines ayant les mêmes caractéristiques que les défensines ne sont pas toujours appelés « défensines, » tels que le cremycins récemment identifié de Caenorhabditis remanei5. En outre, défensines gros invertébrés sont plus susceptibles de concerner évolutionnaire vertébrée β-défensines que d’autres invertébrés défensines6. Malgré cela, les chercheurs s’appuient parfois sur le nom « defensin » pour déterminer quelles séquences devraient être inclus dans les analyses.

Des études structurales ont révélé la similitude entre insectes défensines et scorpion toxines7, et le pli de CS-αβ a été établi par la suite comme la caractéristique structurelle de l’insecte défensines8. Cette bergerie définit la superfamille (CS-αβ) scorpion toxine dans la Classification structurale des protéines (SCOP) base de données9, qui comprend actuellement cinq familles : insectes défensines, toxines scorpion à chaîne courte, toxines de longue chaîne scorpion, MGD-1 (à partir de mollusque) et plante défensines. Cette superfamille est synonyme de la cis-défensines décrit récemment4 et super-famille 3.30.30.10 dans le CATH/Gene database 3D10,11. Études de divers invertébrés, plantes et champignons que les noms des protéines qui contiennent cette bergerie ne sont pas clairement liées à afficher numéro de cystéine ou dessin de collage, activité antimicrobienne ou histoire évolutive12.

Le manque de cohérence et de critères clairs rendent difficile de nommer et classer les séquences vient d’être identifié dans cette superfamille. Un obstacle majeur à comparer les protéines dans cette superfamille est que cystéines sont comptés à l’égard de chaque séquence individuel (la première cystéine dans chaque séquence est C1), sans aucun moyen pour expliquer le rôle structurel. Cela signifie que seules les séquences avec le même nombre de cystéines peuvent être comparés. Il y a peu conservation de séquence autre que les cystéines formant le pli de CS-αβ, ce qui complique les alignements et les analyses phylogénétiques. En développant un système de numérotation qui priorise les caractéristiques structurales, superfamille séquences peuvent être plus facilement par rapport et alignés. Caractéristiques conservées, ainsi que ceux définissant les sous-groupes, peuvent être visualisées rapidement, et de nouvelles séquences peuvent être placés plus facilement dans le contexte approprié.

Cet article utilise un tableur (par exemple, Excel) pour générer une référence à la numérotation de la super-famille des CS-αβ. Il montre comment cela clarifie les comparaisons entre les séquences et l’applique aux nouvelles séquences de CS-αβ identifiés des tardigrades. À l’aide de la super-famille des CS-αβ à titre d’exemple, le protocole a été écrit pour fournir des orientations pour l’utilisation de séquences d’intérêt ; Cependant, il n’est pas prévu pour être précis de cette superfamille ou de séquences riches en cystéine. Cette méthode sera probablement plus utile pour les groupes de protéines qui ont été étudiés séparément dans des taxons divergentes et/ou ont peu homologie de séquence globale, ayant des caractéristiques distinctes qui peut ne pas être facilement reconnu par le logiciel d’analyse moléculaire. Cette méthode requiert certaines décisions a priori au sujet des caractéristiques importantes, il sera d’une utilité limitée si aucune caractéristiques importantes n’ont été identifiées. L’objectif principal est de montrer comment une visualisation simple des relations séquence peut être atteints. Cela peut ensuite servir à informer l’alignement de séquences et d’analyse, mais si l’alignement et l’analyse sont les principaux objectifs, une méthode de code à barres serait une alternative appropriée qui a plus de capacité pour l’automatisation,13. La méthode actuelle affiche les caractéristiques de chaque peptide sous une forme linéaire, donc il ne sera pas utile pour la visualisation directe de la structure 3D.

Protocol

1. déterminer les caractéristiques de définition du groupe de protéines d’intérêt consulter des publications antérieures pour déterminer s’il existe un consensus sur les fonctions qui sont nécessaires pour être considérés comme faisant partie du groupe. Prendre note des incohérences ou divergences d’opinion entre les groupes de recherche et comprennent des caractéristiques qui peuvent servir à différencier un sous-groupe de l’autre. Si la littérature antérieure ne traite pas…

Representative Results

Groupes de séquences de la super-famille des CS-αβ rapportées dans la littérature sont affichés dans la Figure 4. Les appariements de cystéine basées sur la numérotation pour chaque séquence suggèrent cinq groupes principaux (tableau 1, colonne du milieu). Le groupe 1 a 6 cystéines qui de disulfure de trois obligations et comprend des séquences d’insectes, les arachnides, les mollusques, les nématodes et les champignons. Les g…

Discussion

Les critères pour nommer une protéine au sein d’un groupe doivent être clairs, mais ce n’est pas toujours le cas. Les séquences qui ont le CS-αβ plier ont été étudiés dans plusieurs laboratoires en utilisant une variété d’organismes, ayant pour résultat différents systèmes de nomenclature, ainsi que différents niveaux de qualification. Tentative d’imposer une toute nouvelle nomenclature n’est pas raisonnable et se traduirait par une grande confusion lors de la consultation de la littérature ant…

Declarações

The authors have nothing to disclose.

Acknowledgements

Peptide antimicrobien tardigrade en cours recherche est appuyée par un financement intra-muros du Bureau de recherche de l’Université du Midwest et parrainé des programmes (ORSP). L’ORSP n’avait aucun rôle dans la conception de l’étude, la collecte de données, analyse, interprétation ou préparation du manuscrit.

Materials

BLAST webpage https://blast.ncbi.nlm.nih.gov/Blast.cgi
EditSeq (Lasergene suite) DNASTAR https://www.dnastar.com/t-allproducts.aspx
Excel 2013 Microsoft
FigTree  http://tree.bio.ed.ac.uk/software/figtree/
MEGA www.megasoftware.net
MrBayes http://mrbayes.sourceforge.net/
SCOP database http://scop.mrc-lmb.cam.ac.uk/scop/

Referências

  1. Matsuyama, K., Natori, S. Purification of Three Antibacterial Proteins from the Culture Medium of NIH-Sape-4, an Embryonic Cell Line of Sarcophaga peregrina. J Biol Chem. 263 (32), 17112-17116 (1988).
  2. Lambert, J., et al. Insect immunity: Isolation from immune blood of the dipteran Phormia terranovae. of two insect antibacterial peptides with sequence homology to rabbit lung macrophage bactericidal peptides. PNAS. 86 (262-266), (1989).
  3. Dimarcq, J. -. L., Bulet, P., Hetru, C., Hoffmann, J. Cysteine-rich antimicrobial peptides in invertebrates. Biopolymers. 47, 465-477 (1998).
  4. Shafee, T. M. A., Lay, F. T., Hulett, M. D., Anderson, M. A. The Defensins Consist of Two Independent, Convergent Protein Superfamilies. Mol Biol Evol. 33 (9), 2345-2356 (2016).
  5. Zhu, S., Gao, B. Nematode-derived drosomycin-type antifungal peptdies provide evidence for plant-to-ecdysozoan horizontal transfer of a disease resistance gene. Nat Commun. 5, (2014).
  6. Zhu, S., Gao, B. Evolutionary origin of b-defensins. Dev. Comp. Immunol. 39, 79-84 (2013).
  7. Bonmatin, J. -. M., et al. Two-dimensional 1H NMR study of recombinant insect defensin A in water: Resonance assignments, secondary structure and global folding. J Biomol NMR. 2 (3), 235-256 (1992).
  8. Cornet, B., et al. Refined three-dimensional solution structure of insect defensin A. Structure. 3 (5), 435-448 (1995).
  9. Murzin, A. G., Brenner, S. E., Hubbard, T., Chothia, C. SCOP: a structural classification of proteins database for the investigations of sequences and structures. J Mol Biol. 247, 536-540 (1995).
  10. Sillitoe, I., et al. CATH: comprehensive structural and functional annotations for genome sequences. Nucleic Acids Res. 43, 376-381 (2015).
  11. Lam, S. D., et al. Gene3D: expanding the utility of domain assignments. Nucleic Acids Res. 44, 404-409 (2016).
  12. Tarr, D. E. K. Establishing a reference array for the CS-ab superfamily of defensive peptides. BMC Res Notes. 9, 490 (2016).
  13. Shafee, T. M. A., Robinson, A. J., van der Weerden, N., Anderson, M. A. Structural homology guided alignment of cysteine rich proteins. SpringerPlus. 5 (27), (2016).
  14. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic Local Alignment Search Tool. J Mol Biol. 215 (3), 403-410 (1990).
  15. Duckert, P., Brunak, S., Blom, N. Prediction of proprotein convertase cleavage sites. Protein Eng Des Sel. 17 (1), 107-112 (2004).
  16. Petersen, T. N., Brunak, S., von Heijne, G., Nielsen, H. SignalP 4.0:discriminating signal peptides from transmembrane regions. Nat Methods. 8, 785-786 (2011).
  17. Kobayashi, Y., et al. The cysteine-stabilized a-helix: A common structural motif of ion-channel blocking neurotoxic peptides. Biopolymers. 31, 1213-1220 (1991).
  18. Gao, B., del Carmen Rodriguez, M., Lanz-Mendoza, H., Zhu, S. AdDLP, a bacterial defensin-like peptide, exhibits anti-Plasmodium. activity. Biochem Biophys Res Commun. 387, 393-398 (2009).
  19. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis. Mol Biol Evol. 30 (12), 2725-2729 (2013).
  20. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  21. Ronquist, F., Huelsenbeck, J. P. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics. 19 (12), 1572-1574 (2003).
  22. Altschul, S. F., et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25 (17), 3389-3402 (1997).
  23. Zhang, Z., et al. Protein sequence similarity searches using patterns as seeds. Nucleic Acids Res. 26 (17), 3986-3990 (1998).
check_url/pt/56107?article_type=t

Play Video

Citar este artigo
Tarr, D. E. K. Creating and Applying a Reference to Facilitate the Discussion and Classification of Proteins in a Diverse Group. J. Vis. Exp. (126), e56107, doi:10.3791/56107 (2017).

View Video