É apresentado um protocolo para a investigação on-line sobre a relação proteína-estrutura-dinâmica usando Bio3D-web.
Demonstamos o uso da Bio3D-web para análise interativa de dados de estrutura biomolecular. O aplicativo Bio3D-web oferece funcionalidade on-line para: (1) A identificação de conjuntos de estruturas protéicas relacionadas aos limites de similaridade especificados pelo usuário; (2) Seu alinhamento múltiplo e estrutura superposição; (3) Análise de conservação de seqüência e estrutura; (4) Mapeamento de relacionamento entre confórmeros com análise de componentes principais e (5) comparação de dinâmicas internas previstas através de análise de modo normal de conjunto. Essa funcionalidade integrada fornece um fluxo de trabalho completo em linha para investigar relacionamentos estrutura-estrutura-estrutura dentro de famílias de proteínas e superfamílias.
O banco de dados de proteína (PDB) agora contém mais de 120.000 estruturas de proteína – muitas das quais são da mesma família de proteínas, mas resolvidas em diferentes condições experimentais. Essas múltiplas estruturas representam um recurso inestimável para entender as complexidades da forma e função da proteína. Por exemplo, a comparação rigorosa desses conjuntos estruturais pode revelar importantes mecanismos moleculares 1 , 2 , 3 e informar sobre dinâmicas conformacionais envolvidas em processos, incluindo ligação de ligando, catálise enzimática e reconhecimento bi-molecular 4 , 5 , 6 , 7 . Novos insights podem ser obtidos com a análise detalhada em larga escala da sequência, estrutura e dinâmica das famílias de proteínas. No entanto, isso normalmente requer bioinfia considerávelConhecimentos de programação ormática e informática, juntamente com a familiaridade com os sistemas de proteínas em estudo. Por exemplo, pacotes de software como Bio3D, ProDy e Maven requerem programação em R, Python e Matlab, respectivamente 8 , 9 , 10 . Por outro lado, as ferramentas on-line para análise de flexibilidade estrutural são geralmente limitadas à investigação de estruturas individuais 11 , 12 . Uma excepção a este respeito é o servidor WebNM @ recentemente desenvolvido, que permite a comparação de padrões de flexibilidade obtidos da análise de modo normal (NMA) de várias estruturas pré-alinhadas especificadas pelo usuário 13 . No entanto, este servidor não possui um procedimento automatizado para a identificação de estruturas para comparação, seu alinhamento ou análise posterior além da NMA. Outra contribuição recente é o banco de dados PDBFlex on-line, que apresenta pré-cAnálise computorizada de estruturas PDB compartilhando identidade de sequência de 95% ou superior 14 . No entanto, a análise de conjuntos de estruturas mais diversas não está disponível no momento.
Nós já apresentamos o Bio3D-web – um aplicativo web fácil de usar para a análise das relações de estrutura-estrutura-estrutura-dinâmica 15 . O Bio3D-web é único no fornecimento de funcionalidade integrada fácil de usar para a identificação, comparação e análise detalhada de grandes conjuntos de estruturas homólogas online. Aqui apresentamos um protocolo detalhado para a investigação on-line da relação proteína-sequência-estrutura-dinâmica usando Bio3D-web. O Bio3D-web fornece uma variedade de funções para suportar os cinco principais passos da análise de dados mostrados na Figura 1 e discutidos em detalhes abaixo. Essas etapas constituem um fluxo de trabalho que abrange a seqüência de consulta ou a entrada da estrutura, através de vários níveis de análise de seqüência-estrutura-dinâmica, para resumirE geração de relatórios. Os resultados estão disponíveis imediatamente através de extensas aplicações de visualização e planejamento no navegador, bem como através do download de arquivos de resultados em formatos comumente usados. Além de uma interface dinâmica fácil de usar para explorar os efeitos das opções de parâmetros e métodos, a Bio3D-web também registra a entrada completa do usuário e os resultados gráficos subseqüentes da sessão de um usuário como um relatório reproduzível compartilhável em formatos PDF, DOC e HTML. As sessões do usuário podem ser salvas e recarregadas em tempos futuros e resultados completos baixados e interpretados pelo pacote Bio3D R na máquina local de um usuário.
A Bio3D-web é alimentada pelo pacote Bio3D R para análise de dados de simulação biológica, sequência e simulação biomolecular 8 , 16 . Em particular, algoritmos Bio3D para identificação de núcleo rígido 8 , superposição, análise de componentes principais(PCA) 8 e a análise de modo normal de conjunto (eNMA) 16 formam a base da aplicação. Também utilizamos protocolos Bio3D que dependem do pHMMER 17 para identificação de estruturas protéicas relacionadas e MUSCLE 18 para alinhamento de sequências múltiplas. As anotações de estrutura e sequência são derivadas através de utilitários Bio3D a partir dos bancos de dados RCSB PDB 19 e PFAM 20 . O Bio3D-web pode ser executado a partir de nosso servidor on-line ou instalado localmente em qualquer computador que esteja executando o R. Bio3D-web está aberto a todos os usuários e é fornecido gratuitamente sob uma licença de código aberto GPL-3 de: http: // thegrantlab. Org / bio3d / webapps
Bio3D-web pode ser usado para explorar e mapear os estados estruturais, dinâmicos e funcionais das proteínas das estruturas cristalográficas disponíveis. Além disso, os resultados de agrupamento baseados em NMA e PCA, juntamente com as anotações e análises baseadas em seqüências, podem ser particularmente úteis para selecionar estruturas representativas para análises mais demoradas, como simulações de pequena molécula de acoplamento ou dinâmica molecular. A Bio3D-web facilita análises de bioinformática estrutural avançada para uma gama mais ampla de pesquisadores, reduzindo o nível de conhecimento técnico exigido. O design atual da Bio3D-web enfatiza a simplicidade sobre a inclusão exaustiva dos muitos métodos de análise disponíveis no pacote Bio3D autônomo completo. Em muitos casos, prevê-se que os pesquisadores usem o Bio3D-web para entender as tendências gerais em sua família de proteínas ou superfamília de interesse, o que pode então informar análises mais especializadas. Bio3D-web é oAntes projetado para explorar rapidamente os conjuntos de dados da estrutura biomolécula e atuar como uma ferramenta geradora de hipóteses. Incentivamos os usuários a explorar seus dados fornecendo o exemplo de código Bio3D no relatório reprodutível que também armazena todos os detalhes da consulta e os resultados da análise.
No exemplo representativo do exemplo acima, mostramos a capacidade da Bio3D-web para revelar as características estruturais das transições conformacionais funcionais da Adk. Aplicações adicionais do Bio3D-web incluem análise estrutural e dinâmica de estruturas PDB carregadas pelo usuário. Por exemplo, o usuário pode enviar novas estruturas ou mesmo seqüências de proteínas para análise. As etapas de análise mencionadas anteriormente, especialmente o passo de eNMA, podem revelar tendências locais e globais em movimentos de proteínas, com movimentos coletivos de significância funcional. A comparação com estruturas de apo também pode revelar características de transições conformacionais não ligadas a encadernadas. Exemplos adicionais de aplicação paraUma variedade de diferentes famílias de proteínas são fornecidas online.
Embora todas as proteínas sejam entidades flexíveis e dinâmicas, nem todas as proteínas possuem estruturas de resolução atômica disponíveis em uma variedade de estados diferentes ( por exemplo, estados ativos e inativos). Nossa visão do espaço da estrutura protéica é, portanto, limitada e, portanto, a visão obtida de ferramentas como a Bio3D-web também é necessariamente limitada para certas proteínas. No entanto, com os avanços tecnológicos atuais e as novas iniciativas para a genômica estrutural, o protocolo aqui apresentado se tornará cada vez mais um caminho importante para obter informações sobre relacionamentos estrutura-função importantes. Um passo crítico, que é particularmente importante ao analisar proteínas mais distantes, é o potencial surgimento de erros de alinhamento na guia ALIGN. Os erros de alinhamento inevitavelmente ocorrerão quando a semelhança da sequência cair abaixo de 30% e o usuário deve, nesses casos, verificar e corrigir o alinhamento da sequênciaNa guia ALIGN. Erros de alinhamento, possivelmente, resultarão em estruturas superpostas impostas na guia FIT e mascararão as variações conformacionais mais relevantes para o PCA subsequente. Além disso, o usuário deve estar ciente dos resíduos em falta nas estruturas de PDB selecionadas, como na implementação atual PCA só pode ser realizada em resíduos de proteína em que todas as estruturas têm o seu átomo de carbono alfa correspondente resolvido. Conseqüentemente, se um PDB selecionado tiver resíduos não resolvidos para uma região específica da proteína, esta região será omitida da PCA.
O Bio3D-web atualmente está limitado à análise de estruturas de PDB de cadeia única. Consequentemente, os movimentos funcionais que ocorrem no nível quaternário não podem ser explorados usando o protocolo atual. Embora atualmente estejamos desenvolvendo novos algoritmos para incluir essa análise no Bio3D-web, a única opção atual é através do uso convencional de Bio3D.
Bio3D-web é o único aplicativo onlineQue permite pesquisar e identificar conjuntos de estruturas, interpretar seus padrões de seqüência e variabilidade estrutural e extrair informações mecanicistas tanto da análise quanto da predição de sua plasticidade estrutural. Uma ampla gama de ferramentas de visualização molecular e servidores on-line permitem aos pesquisadores explorar e analisar estruturas biomoleculares individuais. No entanto, as ferramentas existentes para análise da seqüência, estrutura e dinâmica de grandes famílias de proteínas heterogêneas muitas vezes requerem conhecimentos computacionais significativos e, tipicamente, permanecem acessíveis apenas para usuários com habilidades de programação relevantes. Por exemplo, o pacote Bio3D requer R 8 , o ProDy requer python e Maven requer conhecimento 9 , 10 de Matlab. A Bio3D-web, em contraste, não requer conhecimento de programação e, assim, aumenta a acessibilidade e diminui a barreira de entrada para realizar uma seqüência comparativa avançada, estrutura e dyAnálise de namics. Além disso, a preparação, a cura, a anotação e a limpeza das estruturas moleculares que são freqüentemente necessárias para análises eficientes estão incluídas no serviço web Bio3D. Além disso, a restrição para realizar essa análise em recursos computacionais capazes é aliviada por nossa instância de servidor que permite a análise em grande escala de muitas estruturas que podem ser iniciadas e controladas a partir de qualquer navegador web moderno.
O desenvolvimento aberto do Bio3D-web está em andamento (consulte https://bitbucket.org/Grantlab/bio3d). Continuamos a adicionar novas funcionalidades de análise e a melhorar os métodos existentes. O desenvolvimento futuro incidirá na adição de PCA baseado em matriz de distância e PCA torsional, abordagens de conservação de seqüência mais extensas que incluam um componente filogenético, identificação de local de ligação de conjunto e novas abordagens para análise de rede dinâmica em famílias de proteínas. A este respeito, a aplicação web atual representa o ponto inicialT para muitos outros fluxos de trabalho de análise de bioinformática estrutural colaborativa, permitindo etapas reproduzíveis e compartilháveis em conjuntos de estrutura experimental definidos pelo usuário. Também planejamos o suporte futuro de conjuntos de coordenadas de unidades biológicas reconstruídas, além de cadeias individuais e múltiplas da unidade assimétrica de estruturas PDB. Recursos adicionais incluirão poupança e carregamento aprimorados de espaços de trabalho colaborativos, juntamente com uma possibilidade de desfazer.
Bio3D-web é um aplicativo on-line para análise interativa de dados de estrutura biomolecular. O Bio3D-web é executado em qualquer navegador da Web moderno e fornece funcionalidade para: (1) A identificação de conjuntos de estrutura de proteína relacionados aos limites específicos de similaridade do usuário; (2) Seu alinhamento múltiplo e estrutura superposição; (3) Análise de conservação de seqüência e estrutura; (4) Mapeamento de relacionamento entre confórmeros com análise de componente principal, e (5) comparação de dinâmicas internas previstas por conjunto nemAnálise de modo mal. Esta funcionalidade integrada fornece um fluxo de trabalho completo para a investigação de relacionamentos estrutura-estrutura-sequência dentro de famílias de proteínas e superfamílias. Além de uma interface dinâmica fácil de usar para explorar os efeitos das opções de parâmetros e métodos, o Bio3D-web também grava a entrada completa do usuário e os resultados gráficos subsequentes da sessão de um usuário. Isso permite aos usuários compartilhar e reproduzir facilmente a seqüência de etapas de análise que criaram seus resultados. O Bio3D-web é implementado inteiramente no idioma R e é baseado nos pacotes Bio3D e Shiny R. Pode ser executado a partir do nosso servidor on-line ou instalado localmente em qualquer computador rodando R. Isso inclui a instalação do servidor local para fornecer uma instância multiusuficiente personalizada com acesso a conjuntos de dados estruturais prioritários, como os comuns na indústria farmacêutica. O código fonte completo ea extensa documentação são fornecidos sob uma licença de código aberto GPL-3 de: http://thegrantlab.org/ Bio3d / webapps
The authors have nothing to disclose.
Agradecemos ao Dr. Guido Scarabelli e Hongyang Li por testes extensivos ao longo do desenvolvimento, bem como a comunidade de usuários Bio3D e os participantes da oficina de bioinformática estrutural da Universidade de Bergen para comentários e comentários que melhoraram esta aplicação.
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |