Summary

Indagine sulla proteina Sequenza-struttura-dinamica Relazioni con Bio3D-web

Published: July 16, 2017
doi:

Summary

Viene presentato un protocollo per l'analisi in linea delle relazioni tra proteine ​​sequenza-struttura-dinamiche utilizzando Bio3D-web.

Abstract

Abbiamo dimostrato l'utilizzo di Bio3D-web per l'analisi interattiva dei dati della struttura biomolecolare. L'applicazione Bio3D-web offre funzionalità online per: (1) l'identificazione della struttura proteica correlata si imposta in soglie specificate dall'utente di somiglianza; (2) la loro sovrapposizione multipla e la struttura della sovrapposizione; (3) Analisi di conservazione delle sequenze e delle strutture; (4) mappatura delle relazioni interconforme con l'analisi di componenti principali e (5) confronto delle dinamiche interne previste tramite analisi di modalità normale di ensemble. Questa funzionalità integrata fornisce un flusso di lavoro in linea completo per indagare le relazioni tra strutture e dinamiche sequenziali all'interno delle famiglie di proteine ​​e delle superfamiglie.

Introduction

La banca dati proteica (PDB) contiene ora più di 120.000 strutture proteiche – molte delle quali sono della stessa famiglia proteica ma risolte in condizioni sperimentali differenti. Queste strutture multiple rappresentano una risorsa inestimabile per comprendere le complessità della forma e della funzione proteica. Ad esempio, il confronto rigoroso di questi gruppi strutturali può rivelare meccanismi molecolari importanti 1 , 2 , 3 e informare sulle dinamiche conformazionali coinvolte nei processi, tra cui legame legame, catalisi enzimatica e riconoscimento bi-molecolare 4 , 5 , 6 , 7 . Nuove acquisizioni possono essere spesso ottenute dalla dettagliata analisi su larga scala della sequenza, struttura e dinamica delle famiglie proteiche. Tuttavia, ciò richiede in genere una notevole bioinfL'ormatica e la competenza di programmazione informatica insieme alla familiarità con i sistemi proteici in studio. Ad esempio, i pacchetti software come Bio3D, ProDy e Maven richiedono la programmazione in R, Python e Matlab rispettivamente 8 , 9 , 10 . Al contrario, gli strumenti online per l'analisi della flessibilità strutturale sono generalmente limitati all'indagine delle singole strutture 11 , 12 . Un'eccezione a questo proposito è il WebNM @ server di recente sviluppo, che consente il confronto tra modelli di flessibilità ottenuti dall'analisi di modalità normale (NMA) di diverse strutture specificate dall'utente precedentemente allineate 13 . Tuttavia, questo server non dispone di una procedura automatizzata per l'identificazione di strutture per il confronto, il loro allineamento o ulteriori analisi oltre la NMA. Un altro contributo recente è il database online PDBFlex, che presenta pre-cAnalisi ompleta delle strutture PDB che condividono l'identità di sequenza del 95% o superiore 14 . Tuttavia, l'analisi di set di strutture più diverse non è attualmente disponibile.

Abbiamo precedentemente presentato Bio3D-web – un'applicazione web facile da usare per l'analisi delle relazioni strutturali-sequenza-struttura-proteina 15 . Bio3D-web è unico nel fornire funzionalità integrate di facile utilizzo per l'identificazione, il confronto e l'analisi dettagliata dei grandi set di strutture omologhe on-line. Qui presentiamo un protocollo dettagliato per l'analisi in linea della relazione di struttura-dinamiche delle proteine ​​con Bio3D-web. Bio3D-web fornisce una varietà di funzioni per supportare i cinque principali passaggi di analisi dei dati mostrati in Figura 1 e discussi in dettaglio nel seguito. Queste fasi costituiscono un flusso di lavoro che si estende dalla sequenza di query o da input di struttura, attraverso diversi livelli di analisi di sequenza-struttura-dinamica, per riepilogareY generazione di report. I risultati sono disponibili immediatamente attraverso estese funzionalità di visualizzazione e tracciatura dei browser, nonché scaricando i file di risultati in formati comunemente utilizzati. Oltre ad una comoda interfaccia dinamica facile da usare per esplorare gli effetti delle scelte di parametri e metodologie, Bio3D-web registra anche l'intero input utente e i successivi risultati grafici della sessione dell'utente come rapporto riproducibile in formato PDF, DOC e HTML. Le sessioni utente possono essere salvate e ricaricate in tempi futuri e completare i risultati scaricati e ulteriormente interpretati dal pacchetto Bio3D R sulla macchina locale di un utente.

Bio3D-web è alimentato dal pacchetto Bio3D R per l'analisi della struttura biomolecolare, sequenza e dati di simulazione molecolare 8 , 16 . In particolare, gli algoritmi Bio3D per l'identificazione rigido-nucleo 8 , sovrapposizione, analisi dei componenti principali(PCA) 8 , e l'analisi di modalità normale (eNMA) 16 costituiscono la base dell'applicazione. Utilizziamo anche protocolli Bio3D che dipendono da pHMMER 17 per l'identificazione di strutture proteiche correlate e MUSCLE 18 per allineamento sequenziale multiplo. Le annotazioni della struttura e della sequenza vengono ricavate da utilità Bio3D dai database RCSB PDB 19 e PFAM 20 . Bio3D-web può essere eseguito dal nostro server online o installato localmente su qualsiasi computer che esegue R. Bio3D-web è aperto a tutti gli utenti e viene fornito gratuitamente sotto una licenza open-source GPL-3 da: http: // thegrantlab. org / bio3d / webapps

Protocol

NOTA: Una sessione tipica di Bio3D procede attraverso cinque passaggi consecutivi e dipendenti (vedere la figura 1 per una rappresentazione schematica). Ogni passaggio viene implementato come una scheda di navigazione consecutiva dell'applicazione web, ad esempio SEARCH, ALIGN, FIT, PCA e eNMA. 1. Ricerca e selezione strutture (SEARCH) Struttura di ingresso Ottieni l'ID PDB dell'adenilato-chinasi (Adk), ad esempio ricercando il PDB [http://www.rcsb.org/pdb]. In alternativa, ottenere la sequenza di aminoacidi proteica di interesse, ad esempio da UniProt [http://uniprot.org]. Inserisci l'ID PDB lungo quattro caratteri per Adk ( ad esempio 1AKE) o incolla una sequenza di protezioni nella casella di testo nella sezione "Struttura o sequenza di input". Seleziona la selezione Fai clic sul pulsante blu "Avanti" (Selezione hit) nel primo pannello o semplicemente scorri verso il basso per il pannello B) "Selezione hit"Per ulteriori analisi. Assicurarsi che il cursore "Limita il numero totale di strutture incluse" sia impostato sul suo valore massimo per includere tutte le strutture al di sopra della cutoff. Abbassa la "Regola l'intervallo di inclusione di BitScore" per includere i successi più distanti, o aumentarla per escludere. Filtraggio facciale facoltativo Fai clic sul pulsante blu "Avanti" (selezione del colpo) nel primo pannello o semplicemente scorri verso il basso sul pannello C) "Filtrazione facoltativa di strutture correlate per ulteriori analisi". Assicurati che i colpi selezionati rappresentino strutture rilevanti controllando i dettagli della tabella, ad esempio il nome PDB, le specie ei leganti legati. Se necessario, perfezionare manualmente il sottoinsieme selezionato delle strutture facendo clic sulle righe della tabella. NOTA: le righe evidenziate con un colore blu descrivono gli ID PDB selezionati per ulteriori analisi nelle schede successive. 2. Analisi di allineamento della sequenza multipla (ALIGN) Fare clic sulla scheda ALIGN per eseguire l'allineamento delle sequenze delle strutture selezionate dalla scheda RICERCA. Riepilogo di allineamento Esaminare il riepilogo di allineamento nel pannello A) "Riepilogo di allineamento". Assicurarsi che le regioni d'interesse siano allineate e non mascherate da spazi di una o più strutture. Se necessario, spostare le opzioni "Visualizza le opzioni di modifica dell'allineamento" e rimuovere gli ID PDB indesiderati, ad esempio PDB con residui mancanti. Analisi di allineamento delle sequenze Fai clic sul pulsante blu "Avanti" (analisi) per eseguire analisi cluster di sequenze sulle strutture raccolte. Selezionare l'opzione di trama Dendrogram. Regolare il cluster in slider di gruppi K per partizionare le strutture in gruppi k. Facoltativamente modificare il metodo di clustering se desiderato selezionando la casella di controllo Più opzioni di clustering e output. </ol> Analisi di conservazione residua Fai clic sul pulsante blu "Avanti" (Conservazione) per calcolare la conservazione del residuo in colonna. Selezionare i set di strutture allineati per generare una traccia della conservazione del residuo in ogni posizione di allineamento. Selezionare Strutture allineate con l'allineamento dei semi PFAM per mostrare la conservazione calcolata rispetto all'allineamento dei semi associato PFAM contenente membri rappresentativi della famiglia. Visualizzazione dell'allineamento delle sequenze Fare clic sul pulsante blu "Avanti" (Allineamento) per visualizzare l'allineamento della sequenza completa con lo strumento di visualizzazione dell'allineamento del browser. 3. Struttura e analisi (FIT) Eseguire la sovrapposizione della struttura immettendo la scheda FIT. Sovrapposizione della struttura Seleziona la casella di controllo "Mostra PDBs" per visualizzare le proteine ​​allineateN strutture in-browser. Assicurarsi che le strutture proteiche siano sovrapposte a regioni corrispondenti e pertinenti da ispezioni visive. Fare clic e trascinare il mouse sulle strutture per ruotare e scorrere fino allo zoom. Regolare la colorazione delle strutture cliccando su "Opzioni colore". Le opzioni di colorazione includono la posizione di allineamento, la variabilità strutturale per posizione, i gruppi di cluster RMSD, i gruppi di cluster di sequenze, le regioni allineate e la struttura secondaria. Scaricare le strutture sovrapposte come file PDB convenzionali o come singolo file di sessione PyMOL per la visualizzazione in un programma di visualizzazione molecolare specializzata. Analisi della struttura Fare clic sul pulsante "Avanti" (Analisi) blu per eseguire il clustering basato sulle strutture delle strutture PDB raccolte. Consente di attivare la finestra Heatmap RMSD nel menu a discesa opzioni Plot. Regolare le opzioni di clustering, incluso il metodo di clustering stesso, Selezionando la casella di controllo "Altre opzioni di clustering e output". NOTA: I dati RMSD in parallelo possono essere visualizzati anche come un dendrogramma, un istogramma o una mappa di calore. Fluttuazioni residue Fare clic sul pulsante "Avanti" (RMSF) blu per visualizzare la variabilità strutturale di ciascun residuo (mostrato come una trama RMSF) con i principali elementi della struttura secondaria mostrati nelle regioni marginali dell'asse x. Selezionare la casella di controllo Mostra fattori B per sovrapporre i fattori B cristallografici della struttura di riferimento sulla trama RMSF. 4. Principal Component Analysis (PCA) Eseguire l'analisi dei componenti principali inserendo la scheda "PCA". Visualizzazione dei componenti principali Seleziona la casella di controllo "Mostra traiettoria PC" per visualizzare i movimenti descritti dai PC con lo strumento di visualizzazione in-browser. Assicurarsi che "PrinComponente 1 "viene scelto dal primo menu a discesa. Per visualizzare i moti descritti da altri PC, scegliere il PC desiderato dal menu a discesa "Scegli il componente principale". Modificare la colorazione della traiettoria dal menu a discesa "Opzioni colore". Scegliere "Variabilità per posizione" dalle "Opzioni di colore" per colore a magnitudo di spostamento. Fai clic sul pulsante "Scarica la traiettoria PDB" nel pannello "Principal Component Visualization" per ottenere una vista traiettoria del movimento descritto dai PC. Fai clic sul pulsante "Scarica PyMOL" per generare un file di sessione PyMOL che fornisce i moti come campo vettoriale. Analisi del costruttore Proietta le singole strutture su due PC selezionati facendo clic sul pulsante blu "Next" (Plot). Assicurarsi che "PC sull'asse X" sia impostato su 1 e "PC oN asse Y "a 2. Per proiettare le strutture su altri PC, regolare adeguatamente la numerazione del PC. Scegliere "Cluster by Subspace PC" per colorare le strutture nella trama mediante clustering su PC; "RMSD" da colorare mediante clustering basato su "RMSD"; E "Sequenza" per colorare mediante clustering a sequenza. Clicca su qualsiasi punto individuale nella trama per etichettare le strutture. In alternativa, evidenziare una o più strutture nella tabella "annotazione di progettazione conforme PCA" sotto la trama. Far scorrere i PC nel cursore dello spazio secondario per includere più o meno PC per l'algoritmo di clustering. Contributi residui Calcola i contributi residui nei singoli PC facendo clic sul pulsante blu "Avanti" (contributi residui). Inserisci i contributi per i PC aggiuntivi includendo il numero di PC nella casella di testo "Scegli componente principale". Attiva la voce "Spread liNomi "evitano di plottare i contributi dei residui sopra l'altro. Disattiva la casella di controllo "Multiline plot" per tracciare i contributi residui in appositi diagrammi. Attiva la voce "Mostra RMSF" per includere i valori RMSF (dalla scheda FIT). 5. Analisi dell'analisi di modalità normale (eNMA) Fare clic sulla scheda eNMA per avviare il calcolo dei normali modi (NMs). Struttura del filtro Regolare il numero di strutture abbassando o aumentando il "Cutoff" per l'inclusione / esclusione della struttura. Fai clic sul pulsante "Run Ensemble NMA" verde per avviare il calcolo NMA. Visualizzazione dei modi normali Scorri verso il basso fino al secondo pannello della scheda eNMA (Visualizzazione modi normali) per la visualizzazione delle NM. NOTA: per impostazione predefinita, l'NM con la sovrapposizione più alta (somiglianza) con PC-1 viene visualizzata nella visualizzazioneFinestre. Per visualizzare i moti descritti da altri NMs o altre strutture PDB, scegliere la struttura NM e struttura desiderata rispettivamente dai menu a discesa "Scegli la modalità" e "Mostra NM per struttura" . Fluttuazioni residue Fare clic sul pulsante blu "Next" (fluttuazioni) per calcolare le fluttuazioni residue delle strutture selezionate per eNMA. Attiva il "Cluster by RMSD" per colorare i profili di fluttuazione tramite clustering basati su RMSD. Attivare il "Cluster by RMSIP" per colorare i profili di fluttuazione tramite clustering basato su RMSIP. Consente di attivare la casella di controllo "Linee di diffusione" per tracciare i profili di fluttuazione raggruppati separati l'uno dall'altro. Confronto tra NMA e PCA Fai clic sul pulsante blu "Avanti" (PCA-vs-NMA) per calcolare la somiglianza tra i singoli NM ei PC. Selezionare un PDB ID dal menu a discesa "Confronta NMs of structure" per calcolare la somiglianza tra i NM di questa struttura ai PC calcolati nella scheda PCA. Analisi sovrapposte Fare clic sull'icona "Next" (Overlap analysis) blu per calcolare la sovrapposizione tra NMs calcolati e il vettore di differenza di struttura tra due strutture selezionate. Selezionare un ID PDB di riferimento dal menu a discesa "Confronta NMs di struttura" e uno o più ID PDB nella tabella struttura per il confronto paritario con il PDB di riferimento. Analisi clustering Fare clic sul pulsante blu " Avanti" (Clustering) per eseguire il clustering delle strutture basato sulla similitudine di coppia NM (RMSIP).

Representative Results

L'adenilato-chinasi (Adk) è un enzima onnipresente che funge da mantenimento dell'equilibrio tra nucleotidi citoplasmatici essenziali per molti processi cellulari. Adk opera catalizzando il trasferimento reversibile di un gruppo fosforile da ATP a AMP. Questa reazione è accompagnata da transizioni conformazionali limitative di velocità ben studiate 3 , 21 . Qui analizziamo tutte le strutture attualmente disponibili di Adk con Bio3D-web per rivelare le caratteristiche dettagliate ei principi meccanici di queste transizioni essenziali. Possiamo iniziare la nostra analisi Bio3D-web di Adk inserendo il codice PDB RCSB di qualsiasi struttura Adk conosciuta. Ad esempio, immettere il PDB ID 1AKE nel pannello A della scheda RICERCA restituisce le sequenze 167 di strutture analoghe da cui i primi 26 vengono automaticamente selezionati per ulteriori analisi (vedere il pannello B). L'annotazione presenteNel pannello C indica che queste strutture selezionate sono tutte di E. coli, sono state risolte per diffrazione in raggi X in una gamma di gruppi spaziali; Hanno una gamma di risoluzione da 1,63 a 2,8 Å e sono stati co-cristallizzati con una gamma di diversi ligandi (compresi non ligandi, AMP, ADP, MG e l'inibitore AP5). Si noti che ulteriori dettagli di annotazione possono essere visualizzati facendo clic sull'opzione "Mostra / Nascondi colonne" nel pannello C. All'allineamento della sequenza multipla viene eseguita dopo aver inserito la scheda ALIGN. Il primo pannello della scheda ALIGN visualizza un riepilogo dell'allineamento fornendo dettagli sul numero di righe di sequenza (equivalenti al numero di strutture PDB), nonché il numero di posizioni (ad es. Le colonne di allineamento). Ciò include una specifica del numero di colonne contenenti gap e non gap. La figura sul lato destro della prima riga fornisce una rappresentazione schematica dell'allineamento delle sequenze. Qui thLe aree grigie rappresentano posizioni non gap, mentre le aree bianche nell'allineamento corrispondono a vuoti. Una rappresentazione della sequenza di conservazione è mostrata sopra l'allineamento con aree rosse che indicano posizioni ben conservate e bianco che indica meno conservato. Si noti che le sequenze in questa figura sono ordinate in base alla loro somiglianza fornita dal dendrogram di clustering sul lato sinistro. Il secondo pannello di questa scheda agevola ulteriormente il raggruppamento dei PDB selezionati in base alla loro somiglianza di sequenza di coppia, che può essere visualizzata sia come un dendrogramma che una mappa di calore. Per impostazione predefinita, viene mostrato un dendrogramma (o un diagramma a albero) che rappresenta la disposizione dei cluster. L'asse y del dendrogram rappresenta la distanza (in termini di identità di sequenza) tra i cluster. La sovrapposizione della struttura viene eseguita automaticamente entrando nella scheda FIT. Le strutture sovrapposte, visualizzate interattivamente nel pannello A, indicanoLa presenza di una regione nucleare relativamente rigida (che comprende i residui 1-29, 68-117 e 161-214; vedere il pannello "dettagli opzionali e RMSD" nella parte inferiore della scheda FIT per dettagli). Sono anche chiaramente visibili altre due regioni di legame nucleotidico variabili (residui 30-67 e 118-167) ( Figura 2 ). I gruppi di clustering basati su RMSD creano queste strutture in due configurazioni distinte. Facendo clic sulla scheda PCA è più chiara la relazione tra le strutture in termini di spostamenti di queste regioni che si chiudono in modo efficace sulle specie nucleotide legate in strutture correlate ( Figura 2B e 2C ). La maggior parte delle strutture sono in forma "chiusa" (azzurro nella figura 2C ) e sono associate ad un legante legato o inibitore. In contrasto le più "aperte" conformazioni sono nucleotidi e inibitori liberi. Questo è coerente conIl vasto ricercatore sulla struttura e la dinamica di Adk che indica che è necessaria una configurazione aperta di queste regioni per il legame nucleotidico e una conformazione chiusa per un efficiente trasferimento di fosforilato e la soppressione di eventi idrolisi dannosi. È notevole che un singolo PC blocca il 97% dello spostamento quadrato medio totale in questo set di struttura Adk e fornisce una descrizione chiara e impellente della transizione aperta a chiusa insieme ai singoli contributi di residui a questo spostamento funzionale (pannello C dell'applicazione E la figura 2 ). Visitare la scheda NMA e aumentare il numero di strutture considerate per il calcolo (riducendo il taglio per il filtraggio di strutture simili) indica che le strutture di stato aperto mostrano dinamica locale e globale più avanzata rispetto alle strutture a forma di chiusura ( Figura 2D e pannello C dell'app) . Confronto tra PCA e NMA perLe singole strutture (pannello D) indica che il primo modo di tutte le strutture a forma aperta mostra un sovrapposizione relativamente elevata a PC1 (con un valore medio di 0,37 ± 0,04). Al contrario, le strutture a forma di chiusura mostrano valori inferiori (con una media di 0.30 ± 0.01). I valori RMSIP per strutture a forma aperta (0,62 ± 0,003) sono anche superiori a quelle delle strutture chiuse (0,56 ± 0,008). Inoltre, l'analisi di sovrapposizione mostra che i primi modi dello stato aperto sono in ottimo accordo con la modifica conformazionale che descrive la differenza degli stati aperti e chiusi (pannello E). Il clustering basato sui valori RMSIP visualizza ancora una partizione coerente delle strutture di stato aperto e chiuso (pannello F). Complessivamente questi risultati indicano l'esistenza di due principali stati conformazionali distinti per Adk. Questi differiscono da uno spostamento collettivo a bassa frequenza di due regioni del sito che legano nucleotidi che mostrano flessibili distintiLità sul legame nucleotidico. Figura 1: Panoramica web Bio3D con schermate delle schede PCA e NMA. Bio3D-web richiede una struttura o una sequenza di proteine ​​forniti dall'utente come input nella scheda RICERCA ( 1 ). Il server fornisce un elenco di strutture correlate, che possono essere selezionate per ulteriori analisi. ( 2 ) La scheda ALIGN fornisce l'allineamento delle sequenze e l'analisi delle strutture selezionate nella scheda RICERCA. ( 3 ) Nella scheda FIT tutte le strutture vengono sovrapposte e visualizzate in 3D insieme ai risultati dell'analisi tradizionale delle strutture a coppia. ( 4 ) L'analisi del componente principale del set di struttura viene eseguita nella scheda PCA per caratterizzare le relazioni interconforme. ( 5 ) L'analisi del modo normale su ogni struttura può essere eseguita nella scheda eNMAPer esplorare le tendenze dinamiche per gli stati strutturali disponibili. Clicca qui per visualizzare una versione più grande di questa figura. Figura 2: Risultati della analisi Bio3D-web di adenilato-chinasi. ( A ) Strutture PDB disponibili di adenilato-chinasi sovrapposte sul nucleo invariante identificato. Le strutture sono colorate in base al clustering basato su RMSD fornite nella scheda FIT. ( B ) La visualizzazione dei componenti principali è disponibile dalla scheda PCA per caratterizzare le principali variazioni conformazionali del set di dati. Qui la traiettoria corrispondente alla prima componente principale è mostrata nella rappresentazione del tubo che mostra il movimento di chiusura su larga scala della proteina. ( C ) Le strutture sono prOjected sulle loro due prime componenti principali in un diagramma conformer che mostra una rappresentazione a bassa dimensione della variabilità conformazionale. Ogni punto (o struttura) viene colorato in base ai criteri specificati dall'utente, in questo caso i risultati di clustering basati su PCA. ( D ) L'analisi di modalità normale nella scheda eNMA suggerisce una dinamica locale e globale avanzata per le strutture in stato aperto (rosso) rispetto alle strutture a forma di chiusura (blu). Clicca qui per visualizzare una versione più grande di questa figura.

Discussion

Bio3D-web può essere utilizzato per esplorare e mappare interamente gli stati strutturali, dinamici e funzionali delle proteine ​​dalle strutture cristallografiche disponibili. Inoltre, i risultati di clustering basati su NMA e PCA, insieme alle annotazioni e all'analisi a sequenza, possono essere particolarmente utili per la selezione di strutture rappresentative per un'analisi più lunga del tempo, come la simulazione di docking a piccole molecole o simulazioni di dinamica molecolare. Bio3D-web consente quindi un'analisi avanzata di bioinformatica strutturale per una vasta gamma di ricercatori riducendo il livello richiesto di competenze tecniche. Il progetto attuale di Bio3D-web sottolinea la semplicità per l'inclusione esaustiva dei numerosi metodi di analisi disponibili nel pieno pacchetto Bio3D autonomo. In molti casi si prevede che i ricercatori utilizzeranno Bio3D-web per comprendere le tendenze generali nella loro famiglia di proteine ​​o superfamilie di interesse, che possono quindi informare analisi più specializzate. Bio3D-web è ilProgettato per esplorare rapidamente i set di dati della struttura biomolecolare e per agire come strumento per generare ipotesi. Incoraggiamo gli utenti ad esplorare ulteriormente i loro dati fornendo codice Bio3D di esempio nel rapporto riproducibile che memorizza anche tutti i dettagli della query e i risultati dell'analisi.

Nel protocollo esemplificativo illustrato sopra, mostriamo la capacità di Bio3D-web di rivelare le caratteristiche strutturali delle transizioni funzionale conformazionali di Adk. Ulteriori applicazioni di Bio3D-web includono l'analisi strutturale e dinamica delle strutture PDB caricate dall'utente. Ad esempio, l'utente può caricare nuove strutture o addirittura sequenze di proteine ​​per l'analisi. Le fasi di analisi citate in precedenza, in particolare la fase eNMA, possono rivelare le tendenze locali e globali nei moti proteici, con motivi collettivi di significato funzionale. Il confronto con strukture apo può anche rivelare caratteristiche di non legate a transizioni conformazionali legate. Ulteriori esempi di applicazione aUna gamma di famiglie proteiche diverse vengono fornite online.

Anche se tutte le proteine ​​sono entità flessibili e dinamiche, non tutte le proteine ​​hanno strutture di risoluzione atomica disponibili in una gamma di stati diversi ( ad esempio stati attivi e inattivi). La nostra visione dello spazio della struttura proteica è quindi limitata e quindi la comprensione ottenuta da strumenti quali Bio3D-web è necessariamente limitata anche per alcune proteine. Tuttavia, con i progressi tecnologici attuali e le nuove iniziative per la genomica strutturale, il protocollo qui presentato diventerà sempre più un percorso importante per acquisire un'idea di importanti relazioni tra strutture e funzioni. Un passo critico, particolarmente importante quando si analizza le proteine ​​più distanti, è la nascita potenziale di errori di allineamento nella scheda ALIGN. Gli errori di allineamento avverranno inevitabilmente quando la somiglianza della sequenza scende al di sotto del 30% e in tal caso l'utente deve verificare e correggere l'allineamento delle sequenzeNella scheda ALIGN. Gli errori di allineamento potrebbero eventualmente provocare strutture non sovrapposte nella scheda FIT e mascherare le variazioni conformazionali più rilevanti per il PCA successivo. Inoltre, l'utente dovrebbe essere consapevole dei residui mancanti nelle strutture PDB selezionate, come nella presente attuazione PCA può essere eseguita solo sui residui proteici in cui tutte le strutture hanno il loro corrispondente atomo alfa di carbonio risolto. Di conseguenza, se un PDB selezionato ha residui irrisolti per una determinata regione della proteina questa regione verrà omessa da PCA.

Il Bio3D-web è attualmente limitato all'analisi delle strutture PDB a catena singola. Di conseguenza, i movimenti funzionali a livello quaternario non possono essere esplorati utilizzando il protocollo attuale. Anche se stiamo sviluppando nuovi algoritmi per includere tali analisi in Bio3D-web, l'unica opzione attuale è quella di utilizzare convenzionali Bio3D.

Bio3D-web è l'unico applicativo onlineIone che consente di interrogare e identificare set di strutture, interpretare i loro modelli di sequenza e variabilità strutturale e estrarre informazioni meccaniche sia dall'analisi che dalla predizione della loro plasticità strutturale. Una vasta gamma di strumenti di visualizzazione molecolare e server online consentono ai ricercatori di esplorare e analizzare le singole strutture biomolecolari. Tuttavia, gli strumenti esistenti per analizzare la sequenza, la struttura e le dinamiche delle famiglie di proteine ​​eterogenee di grandi dimensioni richiedono una significativa competenza computazionale e in genere rimangono accessibili solo agli utenti con competenze di programmazione pertinenti. Ad esempio, il pacchetto Bio3D richiede R 8 , ProDy richiede pitone e Maven richiede la conoscenza di Matlab 9 , 10 . Bio3D-web in contrasto non richiede conoscenze di programmazione e quindi aumenta l'accessibilità e diminuisce la barriera all'ingresso per eseguire avanzate sequenze comparative, struttura e dyAnalisi dei nomi. Inoltre, è incluso il servizio Bio3D-web per la preparazione, la cura, l'annotazione e la pulizia delle strutture molecolari spesso necessarie per un'analisi efficiente. Inoltre, la restrizione all'esecuzione di tali analisi sulle risorse computazionali possibili è attenuata dalla nostra istanza server che consente un'analisi su vasta scala di molte strutture che possono essere avviate e controllate da qualsiasi browser web moderno.

Lo sviluppo aperto di Bio3D-web è in corso (vedi https://bitbucket.org/Grantlab/bio3d). Continuiamo ad aggiungere nuove funzionalità di analisi e migliorare i metodi esistenti. Lo sviluppo futuro si concentrerà sull'aggiunta di PCA a base di matrici a distanza e PCA torsionale, più approfonditi approcci di conservazione della sequenza che includono una componente filogenetica, l'identificazione del sito di rilegatura dell'assemble, e nuovi approcci per l'analisi dinamica della rete in tutte le famiglie di proteine. A questo proposito l'attuale applicazione web rappresenta la punta di partenzaT per molti altri flussi di lavoro strutturali di analisi strutturale bioinformatica consentendo passi riproducibili e condivisi su set di strutture sperimentali definite dall'utente. Pianziamo anche il supporto futuro di gruppi di coordinate biologiche ricostruite in aggiunta alle catene individuali e molteplici dell'unità asimmetrica delle strutture PDB. Ulteriori funzioni includono il miglioramento del risparmio e il caricamento di spazi di lavoro collaborativi insieme ad una possibilità di annullamento.

Bio3D-web è un'applicazione online per l'analisi interattiva dei dati della struttura biomolecolare. Bio3D-web funziona su qualsiasi browser web moderno e fornisce funzionalità per: (1) l'identificazione della struttura proteica correlata imposta a soglie specificate dall'utente di somiglianza; (2) la loro sovrapposizione multipla e la struttura della sovrapposizione; (3) Analisi di conservazione delle sequenze e delle strutture; (4) mappatura delle relazioni interconforme con l'analisi di componenti principali e (5) confronto delle dinamiche interne previste tramite l'insieme eMal analisi di modalità. Questa funzionalità integrata fornisce un flusso di lavoro completo per l'analisi delle relazioni tra strutture e dinamiche sequenziali all'interno delle famiglie di proteine ​​e delle superfamiglie. Oltre ad una comoda interfaccia dinamica facile da usare per esplorare gli effetti delle scelte di parametri e metodi, Bio3D-web registra anche l'input completo dell'utente e i risultati grafici successivi della sessione di un utente. Questo consente agli utenti di condividere e riprodurre facilmente la sequenza di fasi di analisi che hanno creato i loro risultati. BIO3D-web è interamente attuato nel linguaggio R e si basa sui pacchetti Bio3D e Shiny R. Può essere eseguito dal nostro server online o installato localmente su qualsiasi computer che esegue R. Questo include l'installazione del server locale per fornire un'istanza multiutente personalizzata con accesso a set di dati strutturali prioritari come quelli comuni nell'industria farmaceutica. Il codice sorgente completo e un'ampia documentazione sono forniti con una licenza open source GPL-3 da: http://thegrantlab.org/ Bio3d / webapps

Disclosures

The authors have nothing to disclose.

Acknowledgements

Ringraziamo il dottor Guido Scarabelli e Hongyang Li per un ampio test durante lo sviluppo così come la comunità di utenti Bio3D e gli operatori della bioinformatica strutturale dell'Università di Bergen per commenti e commenti che hanno migliorato questa applicazione.

Materials

Bio3D-web
Web-site http://thegrantlab.org/bio3d-web/
Requirements Web browser

References

  1. Kornev, A. P., Taylor, S. S. Dynamics-Driven Allostery in Protein Kinases. Trends Biochem. Sci. 40 (11), 628-647 (2015).
  2. Yao, X. -. Q., Grant, B. J. Domain-opening and dynamic coupling in the α-subunit of heterotrimeric G proteins. Biophys. J. 105 (2), L08-L10 (2013).
  3. Henzler-Wildman, K. A., et al. Intrinsic motions along an enzymatic reaction trajectory. Nature. 450 (7171), 838-844 (2007).
  4. Boehr, D., Nussinov, R., Wright, P. The role of dynamic conformational ensembles in biomolecular recognition. Nat. Chem. Biol. 5 (11), 789-796 (2009).
  5. Teilum, K., Olsen, J. G., Kragelund, B. B. Functional aspects of protein flexibility. Cell Mol Life Sci. 66 (14), 2231-2247 (2009).
  6. Henzler-Wildman, K., Kern, D. Dynamic personalities of proteins. Nature. 450 (7172), 964-972 (2007).
  7. Grant, B. J., Gorfe, A. A., McCammon, J. A. Large conformational changes in proteins: signaling and other functions. Curr. Opin. Struct. Biol. 20 (2), 142-147 (2010).
  8. Grant, B. J., Rodrigues, A. P. C., ElSawy, K. M., McCammon, J. A., Caves, L. S. D. Bio3d: an R package for the comparative analysis of protein structures. Bioinformatics. 22 (21), 2695-2696 (2006).
  9. Bakan, A., Meireles, L. M., Bahar, I. ProDy: protein dynamics inferred from theory and experiments. Bioinformatics. 27 (11), 1575-1577 (2011).
  10. Zimmermann, M. T., Kloczkowski, A., Jernigan, R. L. MAVENs: motion analysis and visualization of elastic networks and structural ensembles. BMC Bioinformatics. 12 (1), 264 (2011).
  11. Yang, L. -. W., et al. oGNM: online computation of structural dynamics using the Gaussian Network Model. Nucleic Acids Res. 34, 24-31 (2006).
  12. Suhre, K., Sanejouand, Y. -. H. ElNemo: a normal mode web server for protein movement analysis and the generation of templates for molecular replacement. Nucleic Acids Res. 32, W610-W614 (2004).
  13. Tiwari, S. P., et al. WEBnm@ v2.0: Web server and services for comparing protein flexibility. BMC Bioinformatics. 15 (1), 427 (2014).
  14. Hrabe, T., et al. PDBFlex: exploring flexibility in protein structures. Nucleic Acids Res. 44, D423-D428 (2016).
  15. Skjærven, L., Jariwala, S., Yao, X. -. Q., Grant, B. J. Online interactive analysis of protein structure ensembles with Bio3D-web. Bioinformatics. , (2016).
  16. Skjærven, L., Yao, X., Scarabelli, G., Grant, B. J. Integrating protein structural dynamics and evolutionary analysis with Bio3D. BMC Bioinformatics. 15 (399), 1-11 (2014).
  17. Eddy, S. R. Accelerated Profile HMM Searches. PLoS Comput. Biol. 7 (10), (2011).
  18. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  19. Berman, H. M. The Protein Data Bank. Nucleic Acids Res. 28 (1), 235-242 (2000).
  20. Finn, R. D., et al. Pfam: the protein families database. Nucleic Acids Res. 42, D222-D230 (2014).
  21. Kerns, S. J., et al. The energy landscape of adenylate kinase during catalysis. Nat. Struct. Mol. Biol. 22 (2), 124-131 (2015).

Play Video

Cite This Article
Jariwala, S., Skjærven, L., Yao, X., Grant, B. J. Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web. J. Vis. Exp. (125), e55640, doi:10.3791/55640 (2017).

View Video