Un protocole pour l'étude en ligne des relations protéines-structure-structure dynamique utilisant Bio3D-web est présenté.
Nous démontrons l'utilisation de Bio3D-web pour l'analyse interactive des données de la structure biomoléculaire. L'application Bio3D-web fournit une fonctionnalité en ligne pour: (1) L'identification des ensembles de structures de protéines connexes aux seuils de similarité spécifiés par l'utilisateur; (2) L'alignement multiple et la superposition de structure; (3) Analyse de conservation de séquences et de structures; (4) Mapping relation interconforme avec l'analyse des composantes principales, et (5) comparaison de la dynamique interne prédite par l'analyse du mode normal d'ensemble. Cette fonctionnalité intégrée fournit un flux de travail en ligne complet pour étudier les relations structure-structure-dynamique dans les familles de protéines et les superfamillies.
La banque de données sur les protéines (PDB) contient maintenant plus de 120 000 structures protéiques – dont beaucoup sont de même famille de protéines mais résolus dans différentes conditions expérimentales. Ces structures multiples représentent une ressource précieuse pour comprendre les subtilités de la forme et de la fonction des protéines. Par exemple, la comparaison rigoureuse de ces ensembles de structures peut révéler des mécanismes moléculaires importants 1 , 2 , 3 et informer sur la dynamique conformationnelle impliquée dans des processus comprenant la liaison du ligand, la catalyse enzymatique et la reconnaissance bi-moléculaire 4 , 5 , 6 , 7 . De nouvelles idées peuvent être obtenues à partir de l'analyse détaillée à grande échelle de la séquence, de la structure et de la dynamique des familles de protéines. Cependant, cela nécessite généralement une bioinfection considérableL'expertise ormatique et informatique ainsi que la familiarité avec les systèmes protéiques étudiés. Par exemple, les logiciels tels que Bio3D, ProDy et Maven nécessitent une programmation dans R, Python et Matlab, respectivement 8 , 9 , 10 . À l'inverse, les outils en ligne d'analyse de la flexibilité structurelle sont généralement limités à l'étude des structures individuelles 11 , 12 . Une exception à cet égard est le serveur WebNM @ récemment développé, qui permet de comparer les modèles de flexibilité obtenus à partir de l'analyse en mode normal (NMA) de plusieurs structures précisées par les utilisateurs 13 . Cependant, ce serveur manque d'une procédure automatisée pour l'identification de structures à des fins de comparaison, leur alignement ou une analyse ultérieure au-delà de NMA. Une autre contribution récente est la base de données PDBFlex en ligne, qui présente pré-cAnalyse omputative des structures PDB partageant une identité de séquence de 95% ou plus 14 . Cependant, l'analyse des ensembles de structures plus divers n'est actuellement pas disponible.
Nous avons précédemment présenté Bio3D-web: une application Web facile à utiliser pour l'analyse de la relation protéine-structure-structure-dynamique 15 . Bio3D-web est unique en fournissant une fonctionnalité intégrée facile à utiliser pour l'identification, la comparaison et l'analyse détaillée des grands ensembles de structures homologues en ligne. Nous présentons ici un protocole détaillé pour l'étude en ligne de la relation protéine-structure-structure dynamique à l'aide de Bio3D-web. Bio3D-web offre une variété de fonctions pour supporter les cinq grandes étapes de l'analyse des données présentées à la figure 1 et discutées en détail ci-dessous. Ces étapes constituent un flux de travail qui s'étend de la séquence de requête ou de l'entrée de la structure, à travers plusieurs niveaux d'analyse séquentielle-structure-dynamique, au résuméEt génération de rapport. Les résultats sont disponibles immédiatement grâce à de vastes fonctionnalités de visualisation et de traçage dans le navigateur, ainsi que par le téléchargement de fichiers de résultats dans les formats couramment utilisés. En plus d'une interface dynamique pratique et facile à utiliser pour explorer les effets des choix de paramètres et de méthodes, Bio3D-web enregistre également l'entrée complète de l'utilisateur et les résultats graphiques ultérieurs de la session d'un utilisateur comme un rapport reproductible pouvant être reproduit dans les formats PDF, DOC et HTML. Les sessions utilisateur peuvent être sauvegardées et rechargées à l'avenir et compléter les résultats téléchargés et interprétés par le paquet Bio3D R sur la machine locale d'un utilisateur.
Bio3D-web est alimenté par le paquet Bio3D R pour l'analyse de la structure biomoléculaire, des séquences et des données de simulation moléculaire 8 , 16 . En particulier, les algorithmes Bio3D pour l'identification du noyau rigide 8 , superposition, analyse de composante principale(PCA) 8 et l'analyse de mode normal d'ensemble (eNMA) 16 forment la base de l'application. Nous utilisons également des protocoles Bio3D qui dépendent de pHMMER 17 pour l'identification des structures protéiques apparentées et du MUSCLE 18 pour l'alignement des séquences multiples. Les annotations de structure et de séquence sont dérivées via les utilitaires Bio3D à partir des bases de données RCSB PDB 19 et PFAM 20 . Bio3D-web peut être exécuté à partir de notre serveur en ligne ou installé localement sur n'importe quel ordinateur exécutant R. Bio3D-web est ouvert à tous les utilisateurs et est fourni gratuitement sous une licence open-source GPL-3 à partir de: http: // thegrantlab. Org / bio3d / webapps
Bio3D-web peut être utilisé pour explorer et cartographier de manière interactive les états structurels, dynamiques et fonctionnels des protéines à partir des structures cristallographiques disponibles. En outre, les résultats de clustering basés sur NMA et PCA, ainsi que les annotations et l'analyse basée sur la séquence, peuvent être particulièrement utiles pour sélectionner des structures représentatives pour une analyse plus longue, comme des simulations d'ensemble de petites molécules ou des dynamiques moléculaires. Bio3D-web facilite ainsi une analyse de la bioinformatique structurale avancée pour une plus large gamme de chercheurs en réduisant le niveau d'expertise technique requis. La conception actuelle de Bio3D-web met l'accent sur la simplicité au sujet de l'inclusion exhaustive des nombreuses méthodes d'analyse disponibles dans le package bio3D autonome complet. Dans de nombreux cas, il est envisagé que les chercheurs utilisent Bio3D-web pour comprendre les tendances générales de leur famille de protéines ou de leur superfamille d'intérêt, ce qui pourrait ensuite éclairer des analyses plus spécialisées. Bio3D-web est leConçu pour explorer rapidement les ensembles de données de structure biomoléculaire et servir d'outil générateur d'hypothèses. Nous encourageons les utilisateurs à explorer davantage leurs données en fournissant un exemple de code Bio3D dans le rapport reproductible qui stocke également tous les détails de la requête et les résultats de l'analyse.
Dans le protocole d'exemple représentatif ci-dessus, nous montrons la capacité de Bio3D-web à révéler les caractéristiques structurelles des transitions conformationnelles fonctionnelles d'Adk. Les applications supplémentaires de Bio3D-web incluent une analyse structurelle et dynamique des structures PDB chargées par l'utilisateur. Par exemple, l'utilisateur peut télécharger de nouvelles structures ou même des séquences de protéines pour l'analyse. Les étapes d'analyse mentionnées plus tôt, en particulier l'étape de l'eNMA, peuvent révéler les tendances locales et mondiales dans les mouvements de protéines, les mouvements collectifs ayant une signification fonctionnelle. La comparaison avec les structures apo peut également révéler des caractéristiques des transitions conformationnelles non liées aux contraintes. Des exemples supplémentaires d'application àUne gamme de familles de protéines différentes sont fournies en ligne.
Bien que toutes les protéines soient des entités flexibles et dynamiques, toutes les protéines ne possèdent pas de structures de résolution atomique disponibles dans une gamme d'états différents ( p. Ex. États actifs et inactifs). Notre vision de l'espace structure protéique est donc limitée et, par conséquent, l'information obtenue à partir d'outils tels que Bio3D-web est nécessairement également limitée pour certaines protéines. Cependant, avec les progrès technologiques actuels et les nouvelles initiatives pour la génomique structurelle, le protocole présenté ici deviendra de plus en plus un chemin important pour mieux comprendre les relations structure-fonction importantes. Une étape critique, particulièrement importante lors de l'analyse de protéines plus éloignées, est l'apparition potentielle d'erreurs d'alignement dans l'onglet ALIGN. Les erreurs d'alignement se produiront inévitablement lorsque la similitude des séquences baisse en dessous de 30% et que l'utilisateur doit, dans de tels cas, vérifier et corriger l'alignement des séquencesDans l'onglet ALIGN. Les erreurs d'alignement entraîneront éventuellement des structures superposées incorrectes dans l'onglet FIT et masqueront les variations de conformation les plus pertinentes pour la PCA suivante. En outre, l'utilisateur doit être conscient des résidus manquants dans les structures de PDB sélectionnées, comme dans la mise en œuvre actuelle, PCA ne peut être effectué que sur des résidus de protéines dans lesquels toutes les structures ont leur atome alpha de carbone correspondant. Par conséquent, si une PDB sélectionnée a des résidus non résolus pour une région particulière de la protéine, cette région sera omise de PCA.
Bio3D-web est actuellement limité à l'analyse des structures PDB à chaîne unique. Par conséquent, les mouvements fonctionnels se produisant au niveau quaternaire ne peuvent pas être explorés en utilisant le protocole actuel. Bien que nous développions actuellement de nouveaux algorithmes pour inclure une telle analyse dans Bio3D-web, la seule option actuelle est l'utilisation conventionnelle de Bio3D.
Bio3D-web est la seule application en lignePermettant d'interroger et d'identifier des ensembles de structures, d'interpréter leurs schémas de séquence et de leur variabilité structurelle, et d'extraire des informations mécanistes à la fois de l'analyse et de la prédiction de leur plasticité structurale. Une large gamme d'outils de visualisation moléculaire et de serveurs en ligne permettent aux chercheurs d'explorer et d'analyser des structures biomoleculaires individuelles. Cependant, les outils existants pour l'analyse de la séquence, de la structure et de la dynamique des grandes familles de protéines hétérogènes nécessitent souvent une expertise informatique importante et restent généralement accessibles uniquement aux utilisateurs possédant des compétences de programmation pertinentes. Par exemple, le paquet Bio3D nécessite R 8 , ProDy nécessite python et Maven requiert le savoir Matlab 9 , 10 . Bio3D-web en revanche ne nécessite pas de connaissances de programmation et augmente ainsi l'accessibilité et diminue la barrière d'entrée pour effectuer une séquence comparative avancée, la structure et dyAnalyse de la namique. En outre, la préparation, la conservation, l'annotation et le nettoyage des structures moléculaires souvent nécessaires à une analyse efficace sont inclus dans le service Web Bio3D. De plus, la restriction à l'exécution d'une telle analyse sur des ressources informatiques capables est atténuée par notre instance de serveur qui permet une analyse à grande échelle de nombreuses structures pouvant être initiées et contrôlées à partir de n'importe quel navigateur Web moderne.
Le développement ouvert de Bio3D-web est en cours (voir https://bitbucket.org/Grantlab/bio3d). Nous continuons d'ajouter de nouvelles fonctionnalités d'analyse et d'améliorer les méthodes existantes. Le développement futur se concentrera sur l'ajout de PCA basée sur la matrice de distance et de PCA torsionnelle, des approches de conservation de séquences plus étendues qui incluent un composant phylogénétique, une identification du site de liaison d'ensemble et de nouvelles approches pour l'analyse de réseau dynamique dans les familles de protéines. À cet égard, l'application Web actuelle représente le point de départT pour de nombreux autres workflows d'analyse de la bioinformatique structurale collaborative en permettant des étapes reproductibles et partageables sur des ensembles de structures expérimentales définis par l'utilisateur. Nous prévoyons également le soutien futur des ensembles de coordonnées des unités biologiques reconstruites en plus des chaînes individuelles et multiples de l'unité asymétrique des structures PDB. Les fonctionnalités supplémentaires incluent une sauvegarde et un chargement améliorés des espaces de travail collaboratifs avec une possibilité d'annulation.
Bio3D-web est une application en ligne pour une analyse interactive des données de structure biomoléculaire. Bio3D-web fonctionne sur n'importe quel navigateur Web moderne et fournit des fonctionnalités pour: (1) L'identification des ensembles de structures de protéines connexes aux seuils de similarité spécifiés par l'utilisateur; (2) L'alignement multiple et la superposition de structure; (3) Analyse de conservation de séquences et de structures; (4) Cartographie relationnelle interconformité avec analyse de composante principale, et (5) comparaison de la dynamique interne prédite par l'ensemble niAnalyse de mode mal. Cette fonctionnalité intégrée fournit un flux de travail complet pour l'étude des relations structure-structure-dynamique au sein des familles de protéines et des superfamilles. En plus d'une interface dynamique pratique et facile à utiliser pour explorer les effets des choix de paramètres et de méthodes, Bio3D-web enregistre également l'entrée complète de l'utilisateur et les résultats graphiques ultérieurs de la session d'un utilisateur. Cela permet aux utilisateurs de partager et de reproduire facilement la séquence des étapes d'analyse qui ont créé leurs résultats. Bio3D-web est entièrement implémenté dans le langage R et repose sur les paquets Bio3D et Shiny R. Il peut être exécuté à partir de notre serveur en ligne ou installé localement sur n'importe quel ordinateur exécutant R. Cela inclut l'installation du serveur local pour fournir une instance multi-utilisateur personnalisée avec accès à des ensembles de données structurelles prioritaires tels que ceux communs dans l'industrie pharmaceutique. Le code source complet et la documentation complète sont fournis sous licence GPL-3 à partir de: http://thegrantlab.org/ Bio3d / webapps
The authors have nothing to disclose.
Nous remercions le Dr Guido Scarabelli et Hongyang Li pour des tests approfondis tout au long du développement, ainsi que la communauté des utilisateurs Bio3D et les participants à l'atelier de bioinformatique structurale de l'Université de Bergen pour les commentaires et les commentaires qui ont amélioré cette application.
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |