Summary

Creando y aplicando una referencia para facilitar la discusión y clasificación de las proteínas en un grupo diverso

Published: August 16, 2017
doi:

Summary

El objetivo de este protocolo es desarrollar una referencia para proteínas divergentes en un grupo que carece de criterios coherentes para la nomenclatura y clasificación. Esta referencia facilitará el análisis y la discusión del grupo como un todo y puede ser utilizada además de nombres establecidos.

Abstract

Relacionados con proteínas que han sido estudiadas en diferentes laboratorios utilizando diferentes organismos pueden carecer de un sistema uniforme de nomenclatura y clasificación, lo que hace difícil discutir el grupo como un todo y poner nuevas secuencias en el contexto adecuado. Desarrollar una referencia que da prioridad a las características de secuencia importante relacionados con la estructura o actividad puede utilizarse además de nombres establecidos para agregar cierta coherencia a un grupo diverso de proteínas. Este papel utiliza la superfamilia cisteína estabiliza hélice de la alfa (CS-αβ) como ejemplo para mostrar cómo una referencia generada en software de hoja de cálculo puede aclarar las relaciones entre las proteínas existentes en la superfamilia, así como facilitar la incorporación de nuevos secuencias. También muestra cómo la referencia puede ayudar a refinar las alineaciones de la secuencia generadas en el software utilizado, que afecta la validez de los análisis filogenéticos. El uso de una referencia probablemente sea más útil para los grupos de proteínas que incluyen secuencias altamente divergentes de una amplia gama de taxa, con características que no son adecuadamente capturados por los análisis moleculares.

Introduction

Nombre de la proteína debe reflejan características y relación con otras proteínas. Desafortunadamente, los nombres se asignan generalmente en el momento del descubrimiento y, como la investigación continúa, puede cambiar la comprensión de un contexto más amplio. Esto puede conducir a varios nombres si una proteína fue identificada independientemente por más de un laboratorio, cambios de nomenclatura o en las características probablemente definitivo al asignar el nombre y el nombre no más suficientemente diferenciando la proteína de los demás.

Defensinas invertebrados proporcionan un buen ejemplo de la degeneración en la nomenclatura y clasificación. Los primeros invertebrados defensinas se informaron de los insectos, y el nombre “insectos Defensina” fue propuesto en base a la homología percibida a mamíferos defensinas1,2. La Defensina del término todavía se utiliza, aunque es claro defensinas invertebrados y mamíferos no comparten un ancestro común3,4. Dependiendo de la especie, un invertebrado “Defensina” puede tener seis u ocho cisteínas (que forman tres o cuatro enlaces disulfuro) y una variedad de actividad antimicrobiana. Para complicar la situación, las proteínas con las mismas características como defensinas no se llaman siempre “defensinas”, como el recientemente identificado cremycins de Caenorhabditis remanei5. Además, son más probables ser evolutivamente relacionados con vertebrados β-defensinas que a otros invertebrados defensinas6defensinas grandes invertebrados. A pesar de ello, los investigadores dependen a veces el nombre “Defensina” al determinar que secuencias deben incluirse en el análisis.

Estudios estructurales revelaron la similitud entre insectos defensinas y toxinas de escorpión7, y el doblez del CS-αβ fue establecido como la característica definitoria de la estructural de defensinas insectos8. Este pliegue define la superfamilia de (CS-αβ) similar a la toxina de escorpión en la clasificación estructural de las proteínas (SCOP) base de datos9, que actualmente incluye cinco familias: insectos defensinas, las toxinas de escorpión de cadena corta, toxinas de escorpión de cadena larga, MGD-1 (a partir de un molusco) y defensinas de plantas. Esta superfamilia es sinónimo con el recientemente descrito cis-defensinas4 y Superfamilia 3.30.30.10 en la Gene Cateterismo 3D base de datos10,11. Estudios de una variedad de taxones invertebrados, plantas y hongos mostrar que los nombres de las proteínas que contienen este redil no están claramente relacionados con número de cisteína o patrón de la vinculación, actividad antimicrobiana o historia evolutiva12.

La falta de coherencia y criterios claros hacen difícil de nombrar y clasificar secuencias identificados recientemente en esta superfamilia. Un obstáculo importante para la comparación de proteínas en esta superfamilia es que cisteínas están numeradas con respecto a cada secuencia individual (la primera cisteína en cada secuencia es C1), sin posibilidad para tener en cuenta la función estructural. Esto significa que se pueden comparar solamente las secuencias con el mismo número de cisteínas. Hay poca conservación de secuencia que no sea de las cisteínas forman el pliegue CS-αβ, que dificulta el análisis filogenéticos y alineaciones. Mediante el desarrollo de un sistema de numeración que prioriza las características estructurales, secuencias de la superfamilia más fácilmente comparables y alineadas. Características conservadas, como los definen los subgrupos, se pueden visualizar rápidamente, y nuevas secuencias se pueden colocar más fácilmente en el contexto adecuado.

Este papel utiliza un software de hoja de cálculo (por ejemplo, Excel) para generar una referencia del sistema para la superfamilia CS-αβ de numeración. Muestra cómo esto aclara las comparaciones entre secuencias y lo aplica a nuevas secuencias de CS-αβ identificadas de tardígrados. Usando la superfamilia CS-αβ como ejemplo, el protocolo fue escrito para proporcionar orientación al utilizar secuencias de interés; sin embargo, no se pretende ser específico a esta superfamilia o a secuencias ricas en cisteína. Este método probablemente sea más útil para los grupos de proteínas que se han investigado independientemente en taxones divergentes o tienen poca homología de secuencia general, con características discretas que no puede ser reconocido fácilmente por el software de análisis molecular. Este método requiere algunas decisiones a priori acerca de características importantes, por lo que será de utilidad limitada si no hay características importantes han sido identificadas. El objetivo principal es mostrar cómo se puede lograr una simple visualización de las relaciones de secuencia. Esto puede usarse entonces para informar a alineamiento de secuencias y análisis, pero si la alineación y el análisis son los objetivos primarios, un método de código de barras sería una alternativa adecuada que tiene más capacidad para automatización13. El método actual muestra las características de cada péptido en una forma lineal, por lo que no será útil para la visualización directa de la estructura 3D.

Protocol

1. determinar las características de la definición del grupo de proteínas de interés consultar publicaciones anteriores para determinar si existe un consenso en relación con las características necesarias ser considerado parte del grupo. Tomar nota de las inconsistencias o diferencias de opinión entre grupos de investigación e incluyen características que pueden servir para distinguir un subgrupo de otro. Si la literatura no responde a características definitorias, utilizar secuencias que s…

Representative Results

Grupos de secuencias en la superfamilia CS-αβ divulgado en la literatura se muestran en la figura 4. Los maridajes de cisteína basados en la numeración para cada secuencia sugieren cinco grupos básicos (cuadro 1, columna media). Grupo 1 tiene seis cisteínas que de disulfuro tres bonos e incluye secuencias de insectos, arácnidos, moluscos, nemátodos y hongos. Grupos 2, 3 y 4 tienen 8 cisteínas que forman 4 enlaces disulfuro. Grupo 2 i…

Discussion

Los criterios para nombrar una proteína dentro de un grupo deben ser claros, pero esto no es siempre el caso. Secuencias que tienen la CS-αβ doble han sido estudiadas en muchos laboratorios usando una variedad de organismos, dando lugar a diferentes sistemas de nomenclatura, así como diferentes niveles de caracterización. Intentar imponer una nueva nomenclatura no es razonable y daría lugar a una gran confusión cuando se consulta la literatura anterior. Una referencia del sistema de numeración puede utilizarse ad…

Declarações

The authors have nothing to disclose.

Acknowledgements

Péptido antimicrobiano tardigrade continua investigación es apoyada por fondos intramuros de la oficina de investigación de la Universidad de Midwestern y programas patrocinados (ORSP). La ORSP no tuvo ningún papel en el diseño del estudio, recopilación de datos, análisis, interpretación o preparación del manuscrito.

Materials

BLAST webpage https://blast.ncbi.nlm.nih.gov/Blast.cgi
EditSeq (Lasergene suite) DNASTAR https://www.dnastar.com/t-allproducts.aspx
Excel 2013 Microsoft
FigTree  http://tree.bio.ed.ac.uk/software/figtree/
MEGA www.megasoftware.net
MrBayes http://mrbayes.sourceforge.net/
SCOP database http://scop.mrc-lmb.cam.ac.uk/scop/

Referências

  1. Matsuyama, K., Natori, S. Purification of Three Antibacterial Proteins from the Culture Medium of NIH-Sape-4, an Embryonic Cell Line of Sarcophaga peregrina. J Biol Chem. 263 (32), 17112-17116 (1988).
  2. Lambert, J., et al. Insect immunity: Isolation from immune blood of the dipteran Phormia terranovae. of two insect antibacterial peptides with sequence homology to rabbit lung macrophage bactericidal peptides. PNAS. 86 (262-266), (1989).
  3. Dimarcq, J. -. L., Bulet, P., Hetru, C., Hoffmann, J. Cysteine-rich antimicrobial peptides in invertebrates. Biopolymers. 47, 465-477 (1998).
  4. Shafee, T. M. A., Lay, F. T., Hulett, M. D., Anderson, M. A. The Defensins Consist of Two Independent, Convergent Protein Superfamilies. Mol Biol Evol. 33 (9), 2345-2356 (2016).
  5. Zhu, S., Gao, B. Nematode-derived drosomycin-type antifungal peptdies provide evidence for plant-to-ecdysozoan horizontal transfer of a disease resistance gene. Nat Commun. 5, (2014).
  6. Zhu, S., Gao, B. Evolutionary origin of b-defensins. Dev. Comp. Immunol. 39, 79-84 (2013).
  7. Bonmatin, J. -. M., et al. Two-dimensional 1H NMR study of recombinant insect defensin A in water: Resonance assignments, secondary structure and global folding. J Biomol NMR. 2 (3), 235-256 (1992).
  8. Cornet, B., et al. Refined three-dimensional solution structure of insect defensin A. Structure. 3 (5), 435-448 (1995).
  9. Murzin, A. G., Brenner, S. E., Hubbard, T., Chothia, C. SCOP: a structural classification of proteins database for the investigations of sequences and structures. J Mol Biol. 247, 536-540 (1995).
  10. Sillitoe, I., et al. CATH: comprehensive structural and functional annotations for genome sequences. Nucleic Acids Res. 43, 376-381 (2015).
  11. Lam, S. D., et al. Gene3D: expanding the utility of domain assignments. Nucleic Acids Res. 44, 404-409 (2016).
  12. Tarr, D. E. K. Establishing a reference array for the CS-ab superfamily of defensive peptides. BMC Res Notes. 9, 490 (2016).
  13. Shafee, T. M. A., Robinson, A. J., van der Weerden, N., Anderson, M. A. Structural homology guided alignment of cysteine rich proteins. SpringerPlus. 5 (27), (2016).
  14. Altschul, S. F., Gish, W., Miller, W., Myers, E. W., Lipman, D. J. Basic Local Alignment Search Tool. J Mol Biol. 215 (3), 403-410 (1990).
  15. Duckert, P., Brunak, S., Blom, N. Prediction of proprotein convertase cleavage sites. Protein Eng Des Sel. 17 (1), 107-112 (2004).
  16. Petersen, T. N., Brunak, S., von Heijne, G., Nielsen, H. SignalP 4.0:discriminating signal peptides from transmembrane regions. Nat Methods. 8, 785-786 (2011).
  17. Kobayashi, Y., et al. The cysteine-stabilized a-helix: A common structural motif of ion-channel blocking neurotoxic peptides. Biopolymers. 31, 1213-1220 (1991).
  18. Gao, B., del Carmen Rodriguez, M., Lanz-Mendoza, H., Zhu, S. AdDLP, a bacterial defensin-like peptide, exhibits anti-Plasmodium. activity. Biochem Biophys Res Commun. 387, 393-398 (2009).
  19. Tamura, K., Stecher, G., Peterson, D., Filipski, A., Kumar, S. MEGA6: Molecular Evolutionary Genetics Analysis. Mol Biol Evol. 30 (12), 2725-2729 (2013).
  20. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  21. Ronquist, F., Huelsenbeck, J. P. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics. 19 (12), 1572-1574 (2003).
  22. Altschul, S. F., et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25 (17), 3389-3402 (1997).
  23. Zhang, Z., et al. Protein sequence similarity searches using patterns as seeds. Nucleic Acids Res. 26 (17), 3986-3990 (1998).

Play Video

Citar este artigo
Tarr, D. E. K. Creating and Applying a Reference to Facilitate the Discussion and Classification of Proteins in a Diverse Group. J. Vis. Exp. (126), e56107, doi:10.3791/56107 (2017).

View Video