Se presenta un protocolo para la investigación en línea de relaciones de secuencia-estructura-dinámica de proteínas usando Bio3D-web.
Demostramos el uso de Bio3D-web para el análisis interactivo de datos de estructura biomolecular. La aplicación Bio3D-web proporciona funcionalidad en línea para: (1) La identificación de conjuntos de estructuras de proteínas relacionados con los umbrales de similitud especificados por el usuario; (2) Su superposición de alineación y estructura múltiple; (3) Análisis de la secuencia y la conservación de la estructura; (4) Cartografía de la relación interconformidad con el análisis del componente principal y (5) comparación de la dinámica interna predicha mediante el análisis del modo normal del conjunto. Esta funcionalidad integrada proporciona un flujo de trabajo en línea completo para investigar las relaciones dinámicas de secuencia-estructura dentro de familias de proteínas y superfamilias.
El banco de datos de proteínas (PDB) contiene ahora más de 120.000 estructuras de proteínas – muchas de las cuales son de la misma familia de proteínas pero resueltas bajo diferentes condiciones experimentales. Estas estructuras múltiples representan un recurso invaluable para entender las complejidades de la forma y de la función de la proteína. Por ejemplo, la comparación rigurosa de estos conjuntos de estructuras puede revelar importantes mecanismos moleculares 1 , 2 , 3 e informar sobre la dinámica conformacional involucrados en procesos que incluyen ligando ligando, catálisis enzimática y reconocimiento bi-molecular 4 , 5 , 6 , 7 . A menudo se pueden obtener nuevas ideas a partir del detallado análisis a gran escala de la secuencia, estructura y dinámica de las familias de proteínas. Sin embargo, esto requiere típicamenteOrmatics y experiencia de programación de la computadora junto con la familiaridad con los sistemas de la proteína bajo estudio. Por ejemplo, paquetes de software como Bio3D, ProDy y Maven requieren la programación en R, python y Matlab, respectivamente 8 , 9 , 10 . Por el contrario, las herramientas en línea para el análisis de la flexibilidad estructural se limitan generalmente a la investigación de las estructuras individuales [ 11 , 12] . Una excepción a este respecto es el recientemente desarrollado WebNM @ servidor, que permite la comparación de los patrones de flexibilidad obtenidos a partir de análisis de modo normal (NMA) de varias estructuras precalíneas usuario especificado 13 . Sin embargo, este servidor carece de un procedimiento automatizado para la identificación de estructuras para comparación, su alineación o análisis posterior más allá de NMA. Otra contribución reciente es la base de datos en línea PDBFlex, que presenta pre-cOmputed análisis de las estructuras de PDB que comparten el 95% o más de la secuencia de identidad [ 14] . Sin embargo, el análisis de conjuntos de estructuras más diversos no está actualmente disponible.
Anteriormente hemos presentado Bio3D-web – una aplicación web fácil de usar para el análisis de la proteína de la secuencia de estructura dinámica relaciones [ 15] . Bio3D-web es único en proporcionar funcionalidad integrada fácil de usar para la identificación, comparación y análisis detallado de grandes conjuntos de estructuras homólogas en línea. Aquí presentamos un protocolo detallado para la investigación en línea de proteína relación secuencia-estructura-dinámica utilizando Bio3D-web. Bio3D-web proporciona una variedad de funciones para soportar los cinco pasos principales del análisis de datos mostrados en la Figura 1 y discutidos en detalle a continuación. Estos pasos constituyen un flujo de trabajo que abarca desde la secuencia de consulta o entrada de estructura, a través de múltiples niveles de secuencia-estructura-análisis dinámico, hasta resumirGeneración de informes. Los resultados están disponibles de inmediato a través de extensa visualización en el navegador y dispositivos de trazado, así como a través de la descarga de archivos de resultados en formatos comúnmente utilizados. Además de una interfaz dinámica fácil de usar para explorar los efectos de las opciones de parámetros y métodos, Bio3D-web también registra la entrada completa del usuario y los resultados gráficos subsiguientes de la sesión de un usuario como un informe reproducible compartible en formatos PDF, DOC y HTML. Las sesiones de usuario se pueden guardar y volver a cargar en el futuro y completar los resultados descargados e interpretados por el paquete Bio3D R en la máquina local de un usuario.
Bio3D-web es impulsado por el Bio3D R paquete para el análisis de la estructura biomolecular, la secuencia y la simulación molecular de datos [ 8 , 16] . En particular, los algoritmos Bio3D para la identificación de núcleos rígidos 8 , superposición, análisis de componentes principales(PCA) 8 y el análisis de modo normal de conjunto (eNMA) 16 forman la base de la aplicación. También utilizamos protocolos Bio3D que dependen de pHMMER 17 para la identificación de estructuras proteicas relacionadas, y MUSCULO 18 para la alineación de múltiples secuencias. Las anotaciones de estructura y secuencia se derivan a través de las utilidades de Bio3D de las bases de datos 19 del PDSB de RCSB y PFAM 20 . Bio3D-web puede ser ejecutado desde nuestro servidor en línea o instalado localmente en cualquier computadora que ejecute R. Bio3D-web está abierto a todos los usuarios y se ofrece de forma gratuita bajo una licencia de código abierto GPL-3 desde http: // thegrantlab. Org / bio3d / webapps
Bio3D-web puede ser utilizado para explorar interactivamente y mapear los estados estructurales, dinámicos y funcionales de las proteínas de las estructuras cristalográficas disponibles. Además, los resultados de agrupación basados en NMA y PCA, junto con las anotaciones y el análisis basado en secuencias, pueden ser particularmente útiles para seleccionar estructuras representativas para análisis más largos tales como acoplamiento de moléculas pequeñas o simulaciones de dinámica molecular. Por lo tanto Bio3D-web facilita el análisis avanzado de la bioinformática estructural para un rango más amplio de investigadores al reducir el nivel requerido de experiencia técnica. El diseño actual de Bio3D-web enfatiza la simplicidad sobre la inclusión exhaustiva de los muchos métodos de análisis disponibles en el paquete completo Bio3D autónomo. En muchos casos se prevé que los investigadores utilizarán Bio3D-web para comprender las tendencias generales en su familia de proteínas o superfamilia de interés, lo que podría informar a más análisis especializados. Bio3D-web es elPor lo tanto, diseñados para explorar rápidamente conjuntos de datos de estructura biomolecular y actuar como una herramienta generadora de hipótesis. Animamos a los usuarios a seguir explorando sus datos proporcionando un ejemplo de código Bio3D en el informe reproducible que también almacena todos los detalles de la consulta y los resultados del análisis.
En el protocolo de ejemplo representativo anterior, mostramos la capacidad de Bio3D-web para revelar las características estructurales de las transiciones conformacionales funcionales de Adk. Las aplicaciones adicionales de Bio3D-web incluyen análisis estructural y dinámico de estructuras de PDB cargadas por usuarios. Por ejemplo, el usuario puede cargar nuevas estructuras o incluso secuencias de proteínas para su análisis. Los pasos de análisis mencionados anteriormente, especialmente el paso eNMA, pueden revelar las tendencias locales y globales en movimientos de proteínas, con movimientos colectivos de importancia funcional. La comparación con las estructuras de apo también puede revelar características de uniones no unidas a transiciones conformacionales unidas. Ejemplos adicionales de aplicación aUna gama de diferentes familias de proteínas se proporcionan en línea.
Aunque todas las proteínas son entidades flexibles y dinámicas, no todas las proteínas tienen estructuras de resolución atómica disponibles en una gama de estados diferentes ( por ejemplo, estados activos e inactivos). Nuestra visión del espacio de la estructura de proteínas es, por tanto, limitada y, por lo tanto, la percepción obtenida a partir de herramientas como Bio3D-web es necesariamente también limitada para ciertas proteínas. Sin embargo, con los avances tecnológicos actuales y las nuevas iniciativas para la genómica estructural, el protocolo presentado aquí se convertirá cada vez más en una ruta importante para conocer mejor las relaciones estructura-función. Un paso crítico, que es particularmente importante cuando se analizan proteínas más distantes, es la aparición potencial de errores de alineación en la pestaña ALIGN. Los errores de alineación inevitablemente se producirán cuando la similitud de secuencia cae por debajo del 30% y el usuario debe, en tales casos, verificar y corregir la alineación de secuenciaEn la pestaña ALINEAR. Los errores de alineación posiblemente resultarán en estructuras superpuestas incorrectas en la pestaña FIT y enmascararán las variaciones conformacionales más relevantes para el PCA subsiguiente. Además, el usuario debe ser consciente de los residuos que faltan en las estructuras de PDB seleccionadas, como en la implementación actual PCA sólo se puede realizar en residuos de proteínas en el que todas las estructuras tienen su correspondiente átomo de carbono alfa resuelto. En consecuencia, si un PDB seleccionado tiene residuos no resueltos para una región particular de la proteína, esta región se omitirá de PCA.
Bio3D-web se limita actualmente al análisis de estructuras de PDB de cadena única. En consecuencia, los movimientos funcionales que ocurren en el nivel cuaternario no pueden ser explorados usando el protocolo actual. Aunque actualmente estamos desarrollando nuevos algoritmos para incluir este tipo de análisis en Bio3D-web, la única opción actual es a través del uso convencional de Bio3D.
Bio3D-web es la única aplicación en líneaQue permite consultar e identificar conjuntos de estructuras, interpretar sus patrones de secuencia y variabilidad estructural y extraer información mecanicista tanto del análisis como de la predicción de su plasticidad estructural. Una amplia gama de herramientas de visualización molecular y servidores en línea permiten a los investigadores explorar y analizar estructuras biomoleculares individuales. Sin embargo, las herramientas existentes para el análisis de la secuencia, la estructura y la dinámica de las grandes familias heterogéneas de proteínas a menudo requieren conocimientos computacionales significativos y, por lo general, sólo son accesibles a los usuarios con habilidades de programación relevantes. Por ejemplo, el paquete Bio3D requiere R 8 , ProDy requiere python y Maven requiere conocimientos de Matlab 9 , 10 . Bio3D-web en contraste no requiere ningún conocimiento de programación y, por tanto, aumenta la accesibilidad y disminuye la barrera de entrada a la realización avanzada secuencia comparativa, estructura y dyAnálisis de la calidad. Además, la preparación, curación, anotación y limpieza de estructuras moleculares que es frecuentemente necesario para un análisis eficiente se incluye con el servicio Bio3D-web. Además, la restricción para realizar este análisis en recursos computacionales capaces se ve aliviada por nuestra instancia de servidor que permite el análisis a gran escala de muchas estructuras que pueden ser iniciadas y controladas desde cualquier navegador web moderno.
El desarrollo abierto de Bio3D-web está en curso (ver https://bitbucket.org/Grantlab/bio3d). Continuamos agregando nueva funcionalidad de análisis y mejorando los métodos existentes. El desarrollo futuro se centrará en la adición de PCA basada en la matriz de distancia y PCA torsional, enfoques de conservación de secuencias más extensos que incluyen un componente filogenético, identificación del sitio de unión del conjunto y nuevos enfoques para el análisis dinámico de redes entre familias de proteínas. A este respecto, la aplicación web actual representa el punto de partidaT para muchos otros flujos de trabajo de análisis bioinformático estructural colaborativo permitiendo pasos reproducibles y compartibles en conjuntos de estructura experimental definidos por el usuario. También planificamos el apoyo futuro de conjuntos de coordenadas de unidades biológicas reconstruidas además de cadenas individuales y múltiples de la unidad asimétrica de estructuras de PDB. Las características adicionales incluirán el ahorro y carga mejorados de espacios de trabajo colaborativos junto con una posibilidad de deshacer.
Bio3D-web es una aplicación en línea para el análisis interactivo de datos de estructura biomolecular. Bio3D-web se ejecuta en cualquier navegador Web moderno y proporciona funcionalidad para: (1) La identificación de conjuntos de estructuras de proteínas relacionadas con los umbrales de similitud especificados por el usuario; (2) Su superposición de alineación y estructura múltiple; (3) Análisis de la secuencia y la conservación de la estructura; (4) Cartografía de la relación interconformidad con el análisis del componente principal, y (5) comparación de la dinámica interna predicha a través del conjunto niAnálisis de modo malo. Esta funcionalidad integrada proporciona un flujo de trabajo completo para la investigación de relaciones estructura-secuencia-dinámica dentro de familias de proteínas y superfamilias. Además de una conveniente interfaz dinámica fácil de usar para explorar los efectos de las opciones de parámetros y métodos, Bio3D-web también registra la entrada completa del usuario y los resultados gráficos subsiguientes de la sesión de un usuario. Esto permite a los usuarios compartir y reproducir fácilmente la secuencia de pasos de análisis que crearon sus resultados. Bio3D-web se implementa completamente en el lenguaje R y se basa en los paquetes Bio3D y Shiny R. Puede ejecutarse desde nuestro servidor en línea o instalarse localmente en cualquier computadora que ejecute R. Esto incluye la instalación del servidor local para proporcionar una instancia multiusuario personalizada con acceso a conjuntos de datos estructurales prioritarios como los comunes en la industria farmacéutica. El código fuente completo y la extensa documentación se proporcionan bajo una licencia de código abierto GPL-3 de: http://thegrantlab.org/ Bio3d / webapps
The authors have nothing to disclose.
Damos las gracias al Dr. Guido Scarabelli y Hongyang Li para las pruebas extensas durante el desarrollo, así como la comunidad de usuarios de Bio3D y los participantes del taller de bioinformática estructural de la Universidad de Bergen para comentarios y comentarios que han mejorado esta aplicación.
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |