Summary

Investigando a Seqüência de Proteínas - Estrutura-dinâmica Relacionamentos com Bio3D-web

Published: July 16, 2017
doi:

Summary

É apresentado um protocolo para a investigação on-line sobre a relação proteína-estrutura-dinâmica usando Bio3D-web.

Abstract

Demonstamos o uso da Bio3D-web para análise interativa de dados de estrutura biomolecular. O aplicativo Bio3D-web oferece funcionalidade on-line para: (1) A identificação de conjuntos de estruturas protéicas relacionadas aos limites de similaridade especificados pelo usuário; (2) Seu alinhamento múltiplo e estrutura superposição; (3) Análise de conservação de seqüência e estrutura; (4) Mapeamento de relacionamento entre confórmeros com análise de componentes principais e (5) comparação de dinâmicas internas previstas através de análise de modo normal de conjunto. Essa funcionalidade integrada fornece um fluxo de trabalho completo em linha para investigar relacionamentos estrutura-estrutura-estrutura dentro de famílias de proteínas e superfamílias.

Introduction

O banco de dados de proteína (PDB) agora contém mais de 120.000 estruturas de proteína – muitas das quais são da mesma família de proteínas, mas resolvidas em diferentes condições experimentais. Essas múltiplas estruturas representam um recurso inestimável para entender as complexidades da forma e função da proteína. Por exemplo, a comparação rigorosa desses conjuntos estruturais pode revelar importantes mecanismos moleculares 1 , 2 , 3 e informar sobre dinâmicas conformacionais envolvidas em processos, incluindo ligação de ligando, catálise enzimática e reconhecimento bi-molecular 4 , 5 , 6 , 7 . Novos insights podem ser obtidos com a análise detalhada em larga escala da sequência, estrutura e dinâmica das famílias de proteínas. No entanto, isso normalmente requer bioinfia considerávelConhecimentos de programação ormática e informática, juntamente com a familiaridade com os sistemas de proteínas em estudo. Por exemplo, pacotes de software como Bio3D, ProDy e Maven requerem programação em R, Python e Matlab, respectivamente 8 , 9 , 10 . Por outro lado, as ferramentas on-line para análise de flexibilidade estrutural são geralmente limitadas à investigação de estruturas individuais 11 , 12 . Uma excepção a este respeito é o servidor WebNM @ recentemente desenvolvido, que permite a comparação de padrões de flexibilidade obtidos da análise de modo normal (NMA) de várias estruturas pré-alinhadas especificadas pelo usuário 13 . No entanto, este servidor não possui um procedimento automatizado para a identificação de estruturas para comparação, seu alinhamento ou análise posterior além da NMA. Outra contribuição recente é o banco de dados PDBFlex on-line, que apresenta pré-cAnálise computorizada de estruturas PDB compartilhando identidade de sequência de 95% ou superior 14 . No entanto, a análise de conjuntos de estruturas mais diversas não está disponível no momento.

Nós já apresentamos o Bio3D-web – um aplicativo web fácil de usar para a análise das relações de estrutura-estrutura-estrutura-dinâmica 15 . O Bio3D-web é único no fornecimento de funcionalidade integrada fácil de usar para a identificação, comparação e análise detalhada de grandes conjuntos de estruturas homólogas online. Aqui apresentamos um protocolo detalhado para a investigação on-line da relação proteína-sequência-estrutura-dinâmica usando Bio3D-web. O Bio3D-web fornece uma variedade de funções para suportar os cinco principais passos da análise de dados mostrados na Figura 1 e discutidos em detalhes abaixo. Essas etapas constituem um fluxo de trabalho que abrange a seqüência de consulta ou a entrada da estrutura, através de vários níveis de análise de seqüência-estrutura-dinâmica, para resumirE geração de relatórios. Os resultados estão disponíveis imediatamente através de extensas aplicações de visualização e planejamento no navegador, bem como através do download de arquivos de resultados em formatos comumente usados. Além de uma interface dinâmica fácil de usar para explorar os efeitos das opções de parâmetros e métodos, a Bio3D-web também registra a entrada completa do usuário e os resultados gráficos subseqüentes da sessão de um usuário como um relatório reproduzível compartilhável em formatos PDF, DOC e HTML. As sessões do usuário podem ser salvas e recarregadas em tempos futuros e resultados completos baixados e interpretados pelo pacote Bio3D R na máquina local de um usuário.

A Bio3D-web é alimentada pelo pacote Bio3D R para análise de dados de simulação biológica, sequência e simulação biomolecular 8 , 16 . Em particular, algoritmos Bio3D para identificação de núcleo rígido 8 , superposição, análise de componentes principais(PCA) 8 e a análise de modo normal de conjunto (eNMA) 16 formam a base da aplicação. Também utilizamos protocolos Bio3D que dependem do pHMMER 17 para identificação de estruturas protéicas relacionadas e MUSCLE 18 para alinhamento de sequências múltiplas. As anotações de estrutura e sequência são derivadas através de utilitários Bio3D a partir dos bancos de dados RCSB PDB 19 e PFAM 20 . O Bio3D-web pode ser executado a partir de nosso servidor on-line ou instalado localmente em qualquer computador que esteja executando o R. Bio3D-web está aberto a todos os usuários e é fornecido gratuitamente sob uma licença de código aberto GPL-3 de: http: // thegrantlab. Org / bio3d / webapps

Protocol

NOTA: Uma sessão típica da Bio3D-web passa por cinco etapas consecutivas e dependentes (veja a Figura 1 para uma representação esquemática). Cada etapa é implementada como uma guia de navegação consecutiva do aplicativo da Web, a saber, SEARCH, ALIGN, FIT, PCA e eNMA. 1. Pesquisa e seleção de estrutura (PESQUISA) Estrutura de entrada Obtenha o PDB ID da adenilato quinase (Adk), por exemplo , pesquisando o PDB [http://www.rcsb.org/pdb]. Alternativamente, obtenha a sequência de aminoácidos da proteína de interesse, por exemplo , da UniProt [http://uniprot.org]. Digite o ID do PDB de quatro caracteres longo para Adk ( por exemplo, 1AKE), ou cole uma seqüência de proteína, na caixa de texto no painel "Entrada de estrutura ou seqüência". Hit selection Clique no botão azul "Próximo" (Seleção de seleção) no primeiro painel ou simplesmente role para baixo para o painel B) "Selecionar seleção"Para uma análise mais aprofundada. Certifique-se de que o controle deslizante "Limite do número total de estruturas incluídas" é definido como seu valor máximo para incluir todas as estruturas acima do ponto de corte. Abaixe o "Ajustar o limite de BitScore de inclusão" para incluir sucessos mais distantes ou aumentá-lo para excluir. Filtragem de sucesso opcional Clique no botão azul "Próximo" (seleção de seleção) no primeiro painel ou simplesmente role para o painel C) "Filtragem opcional de estruturas relacionadas para análise posterior". Certifique-se de que os resultados selecionados representem estruturas relevantes, inspecionando detalhes da tabela, por exemplo , nome PDB, espécies e ligandos encadernados. Refine manualmente o subconjunto selecionado de estruturas, se necessário clicando nas linhas da tabela. NOTA: As linhas destacadas com uma cor azul representam IDs do PDB selecionadas para análise posterior nas guias posteriores. 2. Análise de Alinhamento de Sequências Múltiplas (ALIGN) Clique na guia ALIGN para executar o alinhamento de seqüência das estruturas selecionadas na guia SEARCH. Resumo de alinhamento Revise o resumo do alinhamento no painel A) "Resumo do alinhamento". Certifique-se de que as regiões de interesse estão alinhadas e não mascaradas por lacunas em uma ou mais estruturas. Se necessário, alternar as "Opções de edição do alinhamento da tela" e remover indícios de PDB indesejados, por exemplo , PDBs com resíduos ausentes. Análise de alinhamento de seqüência Clique no botão azul "Próximo" (Análise) para executar a análise de agrupamento baseada em seqüência das estruturas coletadas. Selecione a opção de plotagem Dendrograma. Ajuste o Cluster no controle deslizante de grupos K para particionar as estruturas em grupos k. Opcionalmente, altere o método de agrupamento, se desejado, ao alternar a caixa de seleção Mais opções de cluster e saída. </oL> Análise de conservação de resíduos Clique no botão azul "Próximo" (Conservação) para calcular a conservação de resíduos em coluna. Selecione os conjuntos de estrutura Alinhados para gerar um gráfico da conservação de resíduos em cada posição de alinhamento. Selecione Estruturas alinhadas com alinhamento de sementes de PFAM para mostrar a conservação calculada em relação ao alinhamento de sementes de PFAM associado contendo membros representativos da família. Exibição de alinhamento de seqüência Clique no botão azul "Próximo" (Alinhamento) para mostrar o alinhamento da sequência completa com a ferramenta de visualização do alinhamento no navegador. 3. Estrutura de montagem e análise (FIT) Execute a superposição da estrutura inserindo a guia FIT. Estrutura de superposição Alternar a caixa de seleção "Mostrar PDBs" para visualizar o protegido alinhadoN estruturas no navegador. Certifique-se de que as estruturas protéicas se sobrepõem a regiões correspondentes e relevantes por inspeções visuais. Clique e arraste o mouse sobre as estruturas para girar e role para ampliar. Ajuste a coloração das estruturas clicando nas "Opções de cor". As opções de coloração incluem a posição de alinhamento, variabilidade estrutural por posição, grupos de agrupamentos RMSD, grupos de sequências agrupadas, regiões alinhadas e estrutura secundária. Faça o download das estruturas superpostas como arquivos PDB convencionais ou como um único arquivo de sessão PyMOL para visualização em um programa de visualizador molecular especializado. Análise da estrutura Clique no botão azul "Próximo" (Análise) para executar o agrupamento baseado em estrutura das estruturas PDB coletadas. Alternar o RMSD Heatmap no menu suspenso Opções de traçar. Ajuste as opções de agrupamento, incluindo o próprio método de cluster, Ao trocar a caixa de seleção "Mais clustering e opções de saída". NOTA: Os dados do RMSD em partes podem também ser visualizados como um dendrograma, um histograma ou um mapa de calor. Flutuações de resíduos Clique no botão azul "Próximo" (RMSF) para ver a variabilidade estrutural de cada resíduo (mostrado como um gráfico RMSF) com elementos de estrutura secundária principais mostrados nas regiões marginais do eixo dos x. Alternar a caixa de seleção Mostrar B-fatores para sobrepor os fatores B cristalográficos da estrutura de referência no gráfico RMSF. 4. Análise de componentes principais (PCA) Execute a análise de componentes principais inserindo a aba "PCA". Visualização dos principais componentes Alternar a caixa de seleção "Mostrar PC Trajetória" para visualizar os movimentos descritos pelos PCs com a ferramenta de visualização no navegador. Certifique-se de que "PrinCipal Component 1 "é escolhido no primeiro menu suspenso. Para visualizar os movimentos descritos por outros PCs, escolha o PC desejado no menu suspenso "Escolher componente principal". Altere a coloração da trajetória no menu suspenso "Opções de cor". Escolha "Variabilidade por posição" das "Opções de cor" para colorir por magnitude de deslocamento. Clique no botão "Download PDB trajectory" no painel "Visualização de Componentes Principais" para obter uma visão de trajetória do movimento descrito pelos PCs. Clique no botão "Baixar PyMOL" arquivo de sessão para gerar um arquivo de sessão PyMOL dando os movimentos como um campo vetorial. Análise de conformidade Projectar as estruturas individuais em dois PCs selecionados, clicando no botão azul "Próximo" (Plot). Certifique-se de que "PC no eixo X" esteja configurado para 1, e "PC oN Y-axis "para 2. Para projetar as estruturas em outros PCs, ajuste a numeração do PC de acordo. Escolha "Cluster by PC Subspace" para colorir as estruturas no gráfico por cluster baseado em PC; "RMSD" para corar por agrupamento baseado em "RMSD"; E "Sequência" para colorir por agrupamento baseado em seqüência. Clique em qualquer ponto individual no gráfico para rotular as estruturas. Alternativamente, destaque uma ou mais estruturas na tabela "anotação PCA conformer plot" abaixo do enredo. Deslize os PCs no controle deslizante subespaço para incluir PCs mais / menos para o algoritmo de agrupamento. Contribuições de resíduos Calcule as contribuições de resíduos para os PC individuais, clicando no botão azul "Próximo" (Contribuições de resíduos). Trace as contribuições para computadores adicionais, incluindo o número do PC na caixa de texto "Escolher componente principal". Alternar o "Spread liNes "caixa de seleção evitar traçar as contribuições de resíduos em cima uns dos outros. Desligue a caixa de seleção "Multiline plot" para traçar as contribuições de resíduos em lotes separados. Alternar o "Mostrar RMSF" para incluir os valores RMSF (da guia FIT). 5. Ensemble Normal Mode Analysis (eNMA) Clique na guia eNMA para iniciar o cálculo dos modos normais (NMs). Estrutura do filtro Ajuste o número de estruturas reduzindo ou aumentando o "Limite" para inclusão / exclusão de estrutura. Clique no verde "Run Ensemble NMA" para iniciar o cálculo NMA. Visualização de modos normais Desça até o segundo painel da guia eNMA (visualização de modos normais) para visualização dos NMs. NOTA: Por padrão, o NM com a maior sobreposição (similaridade) ao PC-1 é exibido no visualJanela de ização. Para visualizar os movimentos descritos por outros NMs ou outras estruturas PDB, escolha o NM e a estrutura desejada nos menus suspensos "Escolha Modo" e "Mostrar NMs para estrutura" , respectivamente. Flutuações de resíduos Clique no botão azul "Próximo" (Flutuações) para calcular as flutuações de estrutura residual selecionadas para eNMA. Alternar o "Cluster by RMSD" para colorir os perfis de flutuação por agrupamento baseado em RMSD. Alternar o "Cluster by RMSIP" para colorir os perfis de flutuação por agrupamento baseado em RMSIP. Alterna a caixa de seleção "Linhas de propagação" para traçar os perfis de flutuação agrupados, um para o outro. Comparando NMA e PCA Clique no botão azul "Próximo" (PCA-vs-NMA) para calcular a semelhança entre os NMs individuais e PCs. Selecione um PDB ID no menu suspenso "Compare NMs of structure" para calcular a semelhança entre os NMs desta estrutura para os PCs calculados na guia PCA. Análise de sobreposição Clique no botão azul "Próximo" (análise de sobreposição) para calcular a sobreposição entre os NMs calculados e o vetor de diferença de estrutura entre duas estruturas selecionadas. Selecione uma identificação de PDB "referência" no menu suspenso "Comparar NMs of structure" e ou um ou mais IDs de PDB na tabela de estrutura para a comparação pairwise com o PDB de referência. Análise de agrupamento Clique no botão azul " Próximo" (Clustering) para executar o agrupamento de estrutura com base na semelhança de NM em pares (RMSIP).

Representative Results

Adenylate kinase (Adk) é uma enzima ubíqua que funciona para manter o equilíbrio entre nucleotídeos citoplasmáticos essenciais para muitos processos celulares. O Adk opera catalisando a transferência reversível de um grupo fosforil de ATP para AMP. Essa reação é acompanhada por transições conformacionais limitantes de taxa bem estudadas 3 , 21 . Aqui, analisamos todas as estruturas Adk atualmente disponíveis com Bio3D-web para revelar características detalhadas e princípios mecanicistas dessas transições essenciais. Podemos começar a análise Bio3D-web da Adk digitando o código RCSB PDB de qualquer estrutura Adk conhecida. Por exemplo, inserir o PDB ID 1AKE no painel A da guia SEARCH retorna 167 estruturas semelhantes a seqüências das quais os top 26 são selecionados automaticamente para análise posterior (veja o painel B). A anotação presenteEd no painel C indica que essas estruturas selecionadas são todas de E. coli, foram resolvidas por difração de raios X em uma gama de grupos espaciais; Têm uma gama de resolução de 1,63 a 2,8 Â e foram co-cristalizados com uma gama de diferentes ligandos (incluindo não ligandos, AMP, ADP, MG e o inibidor AP5). Observe que os detalhes de anotação adicionais podem ser exibidos clicando na opção "Mostrar / Ocultar Colunas" no painel C. O alinhamento de seqüência múltipla é realizado ao entrar na guia ALIGN. O primeiro painel da guia ALIGN exibe um resumo do alinhamento que fornece detalhes sobre o número de linhas de seqüência (equivalente ao número de estruturas PDB), bem como o número de posições ( ou seja , colunas de alinhamento). Isso inclui uma especificação do número de colunas que não possuem espaços e lacunas. A figura no lado direito da primeira linha fornece uma representação esquemática do alinhamento da seqüência. Aqui thAs áreas cinzentas representam posições não gap, enquanto as áreas brancas no alinhamento correspondem a lacunas. Uma representação da conservação da sequência é mostrada acima do alinhamento com áreas vermelhas indicando posições bem conservadas e branco indicando menos conservado. Observe que as seqüências nesta figura são ordenadas com base em sua similaridade fornecida pelo dendrograma de agrupamento no lado esquerdo. O segundo painel desta guia facilita ainda o agrupamento dos PDBs selecionados com base em sua similaridade de seqüência em pares, que pode ser visualizado como um dendrograma ou um mapa de calor. Por padrão, é mostrado um dendrograma (ou diagrama de árvore) que representa a disposição dos clusters. O eixo y do dendrograma representa a distância (em termos de identidade de sequência) entre os clusters. A superposição da estrutura é realizada automaticamente ao entrar na guia FIT. As estruturas sobrepostas, exibidas de forma interativa no painel A, indicaNa presença de uma região do núcleo relativamente rígida (abrangendo os resíduos 1-29, 68-117 e 161-214, veja o painel "detalhes do núcleo opcional e detalhes do RMSD" na parte inferior da guia FIT para obter detalhes). Duas outras regiões variáveis ​​de ligação a nucleótidos (resíduos 30-67 e 118-167) também são claramente visíveis ( Figura 2 ). O agrupamento baseado em RMSD agrupa essas estruturas em duas conformações distintas. Clicar na guia PCA mostra mais claramente a relação entre as estruturas em termos de deslocamentos dessas regiões que efetivamente se fecham sobre as espécies nucleotídicas ligadas em estruturas relacionadas ( Figura 2B e 2C ). A maioria das estruturas está na forma "fechada" (azul na Figura 2C ) e está associada a um ligando ou inibidor ligado. Em contraste, as conformações mais abertas são livres de inibidores de nucleótidos e inibidores. Isso é consistente comO vasto conjunto de pesquisas sobre a estrutura e a dinâmica de Adk, indicando que uma configuração aberta dessas regiões é necessária para a ligação de nucleotídeos e uma conformação fechada para transferência eficiente de fosforil e supressão de eventos de hidrólise prejudicial. É notável que um único PC capture 97% do deslocamento quadrático médio total neste conjunto de estruturas Adk e fornece uma descrição clara e convincente da transição aberta para fechada junto com as contribuições de resíduos individuais para esse deslocamento funcional (painel C do aplicativo E Figura 2 ). A visita da guia NMA e o aumento do número de estruturas consideradas para o cálculo (através da redução do ponto de corte para filtragem de estruturas semelhantes) indicam que as estruturas de estado aberto exibem dinâmicas locais e globais aprimoradas em comparação com as estruturas de formas fechadas ( Figura 2D e painel C do aplicativo) . Comparando PCA e NMA resultados paraEstruturas individuais (painel D) indicam que o primeiro modo de todas as estruturas abertas exibe uma sobreposição relativamente alta para o PC1 (com um valor médio de 0,37 ± 0,04). Em contraste, as estruturas de formas fechadas apresentam valores mais baixos (com uma média de 0,30 ± 0,01). Os valores de RMSIP para estruturas abertas (0,62 ± 0,003) também são superiores aos de estruturas fechadas (0,56 ± 0,008). Além disso, a análise de sobreposição mostra que os primeiros modos do estado aberto estão de acordo com a mudança conformacional que descreve a diferença dos estados aberto e fechado (painel E). O agrupamento baseado em valores do RMSIP novamente exibe uma partição consistente de estruturas de estado aberto e fechado (painel F). Coletivamente, esses resultados indicam a existência de dois estados conformacionais distintos para Adk. Estes diferem por um deslocamento coletivo de baixa freqüência de duas regiões do site de ligação a nucleótidos que exibem flexibi distintoLidades após a ligação de nucleótidos. Figura 1: Visão geral da Bio3D-web com capturas de tela das guias PCA e NMA. A Bio3D-web possui uma estrutura ou seqüência de proteína fornecida pelo usuário como entrada na guia SEARCH ( 1 ). O servidor fornece uma lista de estruturas relacionadas, que podem ser selecionadas para análise posterior. ( 2 ) A guia ALIGN fornece alinhamento de seqüência e análise das estruturas selecionadas na guia SEARCH. ( 3 ) Na guia FIT, todas as estruturas são sobrepostas e visualizadas em 3D, juntamente com os resultados da análise convencional da estrutura par-wise. ( 4 ) A análise do componente principal do conjunto de estrutura é realizada na aba PCA para caracterizar as relações entre confeitárias. ( 5 ) A análise do modo normal em cada estrutura pode ser realizada na guia eNMAPara explorar tendências dinâmicas para os estados estruturais disponíveis. Clique aqui para ver uma versão maior dessa figura. Figura 2: Resultados da análise Bio3D-web da adenilato quinase. ( A ) Estruturas PDB disponíveis de adenilato cinase sobrepostas no núcleo invariante identificado. As estruturas são coloridas de acordo com o agrupamento baseado em RMSD fornecido na guia FIT. ( B ) A visualização dos principais componentes está disponível na guia PCA para caracterizar as principais variações conformacionais no conjunto de dados. Aqui, a trajetória correspondente ao primeiro componente principal é mostrada na representação do tubo mostrando o movimento de fechamento em larga escala da proteína. ( C ) Estruturas são prOjected em seus dois primeiros componentes principais em um gráfico de conformer mostrando uma representação de baixa dimensão da variabilidade conformacional. Cada ponto (ou estrutura) é colorido de acordo com critérios especificados pelo usuário, neste caso, resultados de agrupamento baseados em PCA. ( D ) A análise de modo normal na guia eNMA sugere dinâmicas locais e globais aprimoradas para estruturas em aberto (vermelho) em comparação com as estruturas de forma fechada (azul). Clique aqui para ver uma versão maior dessa figura.

Discussion

Bio3D-web pode ser usado para explorar e mapear os estados estruturais, dinâmicos e funcionais das proteínas das estruturas cristalográficas disponíveis. Além disso, os resultados de agrupamento baseados em NMA e PCA, juntamente com as anotações e análises baseadas em seqüências, podem ser particularmente úteis para selecionar estruturas representativas para análises mais demoradas, como simulações de pequena molécula de acoplamento ou dinâmica molecular. A Bio3D-web facilita análises de bioinformática estrutural avançada para uma gama mais ampla de pesquisadores, reduzindo o nível de conhecimento técnico exigido. O design atual da Bio3D-web enfatiza a simplicidade sobre a inclusão exaustiva dos muitos métodos de análise disponíveis no pacote Bio3D autônomo completo. Em muitos casos, prevê-se que os pesquisadores usem o Bio3D-web para entender as tendências gerais em sua família de proteínas ou superfamília de interesse, o que pode então informar análises mais especializadas. Bio3D-web é oAntes projetado para explorar rapidamente os conjuntos de dados da estrutura biomolécula e atuar como uma ferramenta geradora de hipóteses. Incentivamos os usuários a explorar seus dados fornecendo o exemplo de código Bio3D no relatório reprodutível que também armazena todos os detalhes da consulta e os resultados da análise.

No exemplo representativo do exemplo acima, mostramos a capacidade da Bio3D-web para revelar as características estruturais das transições conformacionais funcionais da Adk. Aplicações adicionais do Bio3D-web incluem análise estrutural e dinâmica de estruturas PDB carregadas pelo usuário. Por exemplo, o usuário pode enviar novas estruturas ou mesmo seqüências de proteínas para análise. As etapas de análise mencionadas anteriormente, especialmente o passo de eNMA, podem revelar tendências locais e globais em movimentos de proteínas, com movimentos coletivos de significância funcional. A comparação com estruturas de apo também pode revelar características de transições conformacionais não ligadas a encadernadas. Exemplos adicionais de aplicação paraUma variedade de diferentes famílias de proteínas são fornecidas online.

Embora todas as proteínas sejam entidades flexíveis e dinâmicas, nem todas as proteínas possuem estruturas de resolução atômica disponíveis em uma variedade de estados diferentes ( por exemplo, estados ativos e inativos). Nossa visão do espaço da estrutura protéica é, portanto, limitada e, portanto, a visão obtida de ferramentas como a Bio3D-web também é necessariamente limitada para certas proteínas. No entanto, com os avanços tecnológicos atuais e as novas iniciativas para a genômica estrutural, o protocolo aqui apresentado se tornará cada vez mais um caminho importante para obter informações sobre relacionamentos estrutura-função importantes. Um passo crítico, que é particularmente importante ao analisar proteínas mais distantes, é o potencial surgimento de erros de alinhamento na guia ALIGN. Os erros de alinhamento inevitavelmente ocorrerão quando a semelhança da sequência cair abaixo de 30% e o usuário deve, nesses casos, verificar e corrigir o alinhamento da sequênciaNa guia ALIGN. Erros de alinhamento, possivelmente, resultarão em estruturas superpostas impostas na guia FIT e mascararão as variações conformacionais mais relevantes para o PCA subsequente. Além disso, o usuário deve estar ciente dos resíduos em falta nas estruturas de PDB selecionadas, como na implementação atual PCA só pode ser realizada em resíduos de proteína em que todas as estruturas têm o seu átomo de carbono alfa correspondente resolvido. Conseqüentemente, se um PDB selecionado tiver resíduos não resolvidos para uma região específica da proteína, esta região será omitida da PCA.

O Bio3D-web atualmente está limitado à análise de estruturas de PDB de cadeia única. Consequentemente, os movimentos funcionais que ocorrem no nível quaternário não podem ser explorados usando o protocolo atual. Embora atualmente estejamos desenvolvendo novos algoritmos para incluir essa análise no Bio3D-web, a única opção atual é através do uso convencional de Bio3D.

Bio3D-web é o único aplicativo onlineQue permite pesquisar e identificar conjuntos de estruturas, interpretar seus padrões de seqüência e variabilidade estrutural e extrair informações mecanicistas tanto da análise quanto da predição de sua plasticidade estrutural. Uma ampla gama de ferramentas de visualização molecular e servidores on-line permitem aos pesquisadores explorar e analisar estruturas biomoleculares individuais. No entanto, as ferramentas existentes para análise da seqüência, estrutura e dinâmica de grandes famílias de proteínas heterogêneas muitas vezes requerem conhecimentos computacionais significativos e, tipicamente, permanecem acessíveis apenas para usuários com habilidades de programação relevantes. Por exemplo, o pacote Bio3D requer R 8 , o ProDy requer python e Maven requer conhecimento 9 , 10 de Matlab. A Bio3D-web, em contraste, não requer conhecimento de programação e, assim, aumenta a acessibilidade e diminui a barreira de entrada para realizar uma seqüência comparativa avançada, estrutura e dyAnálise de namics. Além disso, a preparação, a cura, a anotação e a limpeza das estruturas moleculares que são freqüentemente necessárias para análises eficientes estão incluídas no serviço web Bio3D. Além disso, a restrição para realizar essa análise em recursos computacionais capazes é aliviada por nossa instância de servidor que permite a análise em grande escala de muitas estruturas que podem ser iniciadas e controladas a partir de qualquer navegador web moderno.

O desenvolvimento aberto do Bio3D-web está em andamento (consulte https://bitbucket.org/Grantlab/bio3d). Continuamos a adicionar novas funcionalidades de análise e a melhorar os métodos existentes. O desenvolvimento futuro incidirá na adição de PCA baseado em matriz de distância e PCA torsional, abordagens de conservação de seqüência mais extensas que incluam um componente filogenético, identificação de local de ligação de conjunto e novas abordagens para análise de rede dinâmica em famílias de proteínas. A este respeito, a aplicação web atual representa o ponto inicialT para muitos outros fluxos de trabalho de análise de bioinformática estrutural colaborativa, permitindo etapas reproduzíveis e compartilháveis ​​em conjuntos de estrutura experimental definidos pelo usuário. Também planejamos o suporte futuro de conjuntos de coordenadas de unidades biológicas reconstruídas, além de cadeias individuais e múltiplas da unidade assimétrica de estruturas PDB. Recursos adicionais incluirão poupança e carregamento aprimorados de espaços de trabalho colaborativos, juntamente com uma possibilidade de desfazer.

Bio3D-web é um aplicativo on-line para análise interativa de dados de estrutura biomolecular. O Bio3D-web é executado em qualquer navegador da Web moderno e fornece funcionalidade para: (1) A identificação de conjuntos de estrutura de proteína relacionados aos limites específicos de similaridade do usuário; (2) Seu alinhamento múltiplo e estrutura superposição; (3) Análise de conservação de seqüência e estrutura; (4) Mapeamento de relacionamento entre confórmeros com análise de componente principal, e (5) comparação de dinâmicas internas previstas por conjunto nemAnálise de modo mal. Esta funcionalidade integrada fornece um fluxo de trabalho completo para a investigação de relacionamentos estrutura-estrutura-sequência dentro de famílias de proteínas e superfamílias. Além de uma interface dinâmica fácil de usar para explorar os efeitos das opções de parâmetros e métodos, o Bio3D-web também grava a entrada completa do usuário e os resultados gráficos subsequentes da sessão de um usuário. Isso permite aos usuários compartilhar e reproduzir facilmente a seqüência de etapas de análise que criaram seus resultados. O Bio3D-web é implementado inteiramente no idioma R e é baseado nos pacotes Bio3D e Shiny R. Pode ser executado a partir do nosso servidor on-line ou instalado localmente em qualquer computador rodando R. Isso inclui a instalação do servidor local para fornecer uma instância multiusuficiente personalizada com acesso a conjuntos de dados estruturais prioritários, como os comuns na indústria farmacêutica. O código fonte completo ea extensa documentação são fornecidos sob uma licença de código aberto GPL-3 de: http://thegrantlab.org/ Bio3d / webapps

Disclosures

The authors have nothing to disclose.

Acknowledgements

Agradecemos ao Dr. Guido Scarabelli e Hongyang Li por testes extensivos ao longo do desenvolvimento, bem como a comunidade de usuários Bio3D e os participantes da oficina de bioinformática estrutural da Universidade de Bergen para comentários e comentários que melhoraram esta aplicação.

Materials

Bio3D-web
Web-site http://thegrantlab.org/bio3d-web/
Requirements Web browser

References

  1. Kornev, A. P., Taylor, S. S. Dynamics-Driven Allostery in Protein Kinases. Trends Biochem. Sci. 40 (11), 628-647 (2015).
  2. Yao, X. -. Q., Grant, B. J. Domain-opening and dynamic coupling in the α-subunit of heterotrimeric G proteins. Biophys. J. 105 (2), L08-L10 (2013).
  3. Henzler-Wildman, K. A., et al. Intrinsic motions along an enzymatic reaction trajectory. Nature. 450 (7171), 838-844 (2007).
  4. Boehr, D., Nussinov, R., Wright, P. The role of dynamic conformational ensembles in biomolecular recognition. Nat. Chem. Biol. 5 (11), 789-796 (2009).
  5. Teilum, K., Olsen, J. G., Kragelund, B. B. Functional aspects of protein flexibility. Cell Mol Life Sci. 66 (14), 2231-2247 (2009).
  6. Henzler-Wildman, K., Kern, D. Dynamic personalities of proteins. Nature. 450 (7172), 964-972 (2007).
  7. Grant, B. J., Gorfe, A. A., McCammon, J. A. Large conformational changes in proteins: signaling and other functions. Curr. Opin. Struct. Biol. 20 (2), 142-147 (2010).
  8. Grant, B. J., Rodrigues, A. P. C., ElSawy, K. M., McCammon, J. A., Caves, L. S. D. Bio3d: an R package for the comparative analysis of protein structures. Bioinformatics. 22 (21), 2695-2696 (2006).
  9. Bakan, A., Meireles, L. M., Bahar, I. ProDy: protein dynamics inferred from theory and experiments. Bioinformatics. 27 (11), 1575-1577 (2011).
  10. Zimmermann, M. T., Kloczkowski, A., Jernigan, R. L. MAVENs: motion analysis and visualization of elastic networks and structural ensembles. BMC Bioinformatics. 12 (1), 264 (2011).
  11. Yang, L. -. W., et al. oGNM: online computation of structural dynamics using the Gaussian Network Model. Nucleic Acids Res. 34, 24-31 (2006).
  12. Suhre, K., Sanejouand, Y. -. H. ElNemo: a normal mode web server for protein movement analysis and the generation of templates for molecular replacement. Nucleic Acids Res. 32, W610-W614 (2004).
  13. Tiwari, S. P., et al. WEBnm@ v2.0: Web server and services for comparing protein flexibility. BMC Bioinformatics. 15 (1), 427 (2014).
  14. Hrabe, T., et al. PDBFlex: exploring flexibility in protein structures. Nucleic Acids Res. 44, D423-D428 (2016).
  15. Skjærven, L., Jariwala, S., Yao, X. -. Q., Grant, B. J. Online interactive analysis of protein structure ensembles with Bio3D-web. Bioinformatics. , (2016).
  16. Skjærven, L., Yao, X., Scarabelli, G., Grant, B. J. Integrating protein structural dynamics and evolutionary analysis with Bio3D. BMC Bioinformatics. 15 (399), 1-11 (2014).
  17. Eddy, S. R. Accelerated Profile HMM Searches. PLoS Comput. Biol. 7 (10), (2011).
  18. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  19. Berman, H. M. The Protein Data Bank. Nucleic Acids Res. 28 (1), 235-242 (2000).
  20. Finn, R. D., et al. Pfam: the protein families database. Nucleic Acids Res. 42, D222-D230 (2014).
  21. Kerns, S. J., et al. The energy landscape of adenylate kinase during catalysis. Nat. Struct. Mol. Biol. 22 (2), 124-131 (2015).

Play Video

Cite This Article
Jariwala, S., Skjærven, L., Yao, X., Grant, B. J. Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web. J. Vis. Exp. (125), e55640, doi:10.3791/55640 (2017).

View Video