Viene presentato un protocollo per l'analisi in linea delle relazioni tra proteine sequenza-struttura-dinamiche utilizzando Bio3D-web.
Abbiamo dimostrato l'utilizzo di Bio3D-web per l'analisi interattiva dei dati della struttura biomolecolare. L'applicazione Bio3D-web offre funzionalità online per: (1) l'identificazione della struttura proteica correlata si imposta in soglie specificate dall'utente di somiglianza; (2) la loro sovrapposizione multipla e la struttura della sovrapposizione; (3) Analisi di conservazione delle sequenze e delle strutture; (4) mappatura delle relazioni interconforme con l'analisi di componenti principali e (5) confronto delle dinamiche interne previste tramite analisi di modalità normale di ensemble. Questa funzionalità integrata fornisce un flusso di lavoro in linea completo per indagare le relazioni tra strutture e dinamiche sequenziali all'interno delle famiglie di proteine e delle superfamiglie.
La banca dati proteica (PDB) contiene ora più di 120.000 strutture proteiche – molte delle quali sono della stessa famiglia proteica ma risolte in condizioni sperimentali differenti. Queste strutture multiple rappresentano una risorsa inestimabile per comprendere le complessità della forma e della funzione proteica. Ad esempio, il confronto rigoroso di questi gruppi strutturali può rivelare meccanismi molecolari importanti 1 , 2 , 3 e informare sulle dinamiche conformazionali coinvolte nei processi, tra cui legame legame, catalisi enzimatica e riconoscimento bi-molecolare 4 , 5 , 6 , 7 . Nuove acquisizioni possono essere spesso ottenute dalla dettagliata analisi su larga scala della sequenza, struttura e dinamica delle famiglie proteiche. Tuttavia, ciò richiede in genere una notevole bioinfL'ormatica e la competenza di programmazione informatica insieme alla familiarità con i sistemi proteici in studio. Ad esempio, i pacchetti software come Bio3D, ProDy e Maven richiedono la programmazione in R, Python e Matlab rispettivamente 8 , 9 , 10 . Al contrario, gli strumenti online per l'analisi della flessibilità strutturale sono generalmente limitati all'indagine delle singole strutture 11 , 12 . Un'eccezione a questo proposito è il WebNM @ server di recente sviluppo, che consente il confronto tra modelli di flessibilità ottenuti dall'analisi di modalità normale (NMA) di diverse strutture specificate dall'utente precedentemente allineate 13 . Tuttavia, questo server non dispone di una procedura automatizzata per l'identificazione di strutture per il confronto, il loro allineamento o ulteriori analisi oltre la NMA. Un altro contributo recente è il database online PDBFlex, che presenta pre-cAnalisi ompleta delle strutture PDB che condividono l'identità di sequenza del 95% o superiore 14 . Tuttavia, l'analisi di set di strutture più diverse non è attualmente disponibile.
Abbiamo precedentemente presentato Bio3D-web – un'applicazione web facile da usare per l'analisi delle relazioni strutturali-sequenza-struttura-proteina 15 . Bio3D-web è unico nel fornire funzionalità integrate di facile utilizzo per l'identificazione, il confronto e l'analisi dettagliata dei grandi set di strutture omologhe on-line. Qui presentiamo un protocollo dettagliato per l'analisi in linea della relazione di struttura-dinamiche delle proteine con Bio3D-web. Bio3D-web fornisce una varietà di funzioni per supportare i cinque principali passaggi di analisi dei dati mostrati in Figura 1 e discussi in dettaglio nel seguito. Queste fasi costituiscono un flusso di lavoro che si estende dalla sequenza di query o da input di struttura, attraverso diversi livelli di analisi di sequenza-struttura-dinamica, per riepilogareY generazione di report. I risultati sono disponibili immediatamente attraverso estese funzionalità di visualizzazione e tracciatura dei browser, nonché scaricando i file di risultati in formati comunemente utilizzati. Oltre ad una comoda interfaccia dinamica facile da usare per esplorare gli effetti delle scelte di parametri e metodologie, Bio3D-web registra anche l'intero input utente e i successivi risultati grafici della sessione dell'utente come rapporto riproducibile in formato PDF, DOC e HTML. Le sessioni utente possono essere salvate e ricaricate in tempi futuri e completare i risultati scaricati e ulteriormente interpretati dal pacchetto Bio3D R sulla macchina locale di un utente.
Bio3D-web è alimentato dal pacchetto Bio3D R per l'analisi della struttura biomolecolare, sequenza e dati di simulazione molecolare 8 , 16 . In particolare, gli algoritmi Bio3D per l'identificazione rigido-nucleo 8 , sovrapposizione, analisi dei componenti principali(PCA) 8 , e l'analisi di modalità normale (eNMA) 16 costituiscono la base dell'applicazione. Utilizziamo anche protocolli Bio3D che dipendono da pHMMER 17 per l'identificazione di strutture proteiche correlate e MUSCLE 18 per allineamento sequenziale multiplo. Le annotazioni della struttura e della sequenza vengono ricavate da utilità Bio3D dai database RCSB PDB 19 e PFAM 20 . Bio3D-web può essere eseguito dal nostro server online o installato localmente su qualsiasi computer che esegue R. Bio3D-web è aperto a tutti gli utenti e viene fornito gratuitamente sotto una licenza open-source GPL-3 da: http: // thegrantlab. org / bio3d / webapps
Bio3D-web può essere utilizzato per esplorare e mappare interamente gli stati strutturali, dinamici e funzionali delle proteine dalle strutture cristallografiche disponibili. Inoltre, i risultati di clustering basati su NMA e PCA, insieme alle annotazioni e all'analisi a sequenza, possono essere particolarmente utili per la selezione di strutture rappresentative per un'analisi più lunga del tempo, come la simulazione di docking a piccole molecole o simulazioni di dinamica molecolare. Bio3D-web consente quindi un'analisi avanzata di bioinformatica strutturale per una vasta gamma di ricercatori riducendo il livello richiesto di competenze tecniche. Il progetto attuale di Bio3D-web sottolinea la semplicità per l'inclusione esaustiva dei numerosi metodi di analisi disponibili nel pieno pacchetto Bio3D autonomo. In molti casi si prevede che i ricercatori utilizzeranno Bio3D-web per comprendere le tendenze generali nella loro famiglia di proteine o superfamilie di interesse, che possono quindi informare analisi più specializzate. Bio3D-web è ilProgettato per esplorare rapidamente i set di dati della struttura biomolecolare e per agire come strumento per generare ipotesi. Incoraggiamo gli utenti ad esplorare ulteriormente i loro dati fornendo codice Bio3D di esempio nel rapporto riproducibile che memorizza anche tutti i dettagli della query e i risultati dell'analisi.
Nel protocollo esemplificativo illustrato sopra, mostriamo la capacità di Bio3D-web di rivelare le caratteristiche strutturali delle transizioni funzionale conformazionali di Adk. Ulteriori applicazioni di Bio3D-web includono l'analisi strutturale e dinamica delle strutture PDB caricate dall'utente. Ad esempio, l'utente può caricare nuove strutture o addirittura sequenze di proteine per l'analisi. Le fasi di analisi citate in precedenza, in particolare la fase eNMA, possono rivelare le tendenze locali e globali nei moti proteici, con motivi collettivi di significato funzionale. Il confronto con strukture apo può anche rivelare caratteristiche di non legate a transizioni conformazionali legate. Ulteriori esempi di applicazione aUna gamma di famiglie proteiche diverse vengono fornite online.
Anche se tutte le proteine sono entità flessibili e dinamiche, non tutte le proteine hanno strutture di risoluzione atomica disponibili in una gamma di stati diversi ( ad esempio stati attivi e inattivi). La nostra visione dello spazio della struttura proteica è quindi limitata e quindi la comprensione ottenuta da strumenti quali Bio3D-web è necessariamente limitata anche per alcune proteine. Tuttavia, con i progressi tecnologici attuali e le nuove iniziative per la genomica strutturale, il protocollo qui presentato diventerà sempre più un percorso importante per acquisire un'idea di importanti relazioni tra strutture e funzioni. Un passo critico, particolarmente importante quando si analizza le proteine più distanti, è la nascita potenziale di errori di allineamento nella scheda ALIGN. Gli errori di allineamento avverranno inevitabilmente quando la somiglianza della sequenza scende al di sotto del 30% e in tal caso l'utente deve verificare e correggere l'allineamento delle sequenzeNella scheda ALIGN. Gli errori di allineamento potrebbero eventualmente provocare strutture non sovrapposte nella scheda FIT e mascherare le variazioni conformazionali più rilevanti per il PCA successivo. Inoltre, l'utente dovrebbe essere consapevole dei residui mancanti nelle strutture PDB selezionate, come nella presente attuazione PCA può essere eseguita solo sui residui proteici in cui tutte le strutture hanno il loro corrispondente atomo alfa di carbonio risolto. Di conseguenza, se un PDB selezionato ha residui irrisolti per una determinata regione della proteina questa regione verrà omessa da PCA.
Il Bio3D-web è attualmente limitato all'analisi delle strutture PDB a catena singola. Di conseguenza, i movimenti funzionali a livello quaternario non possono essere esplorati utilizzando il protocollo attuale. Anche se stiamo sviluppando nuovi algoritmi per includere tali analisi in Bio3D-web, l'unica opzione attuale è quella di utilizzare convenzionali Bio3D.
Bio3D-web è l'unico applicativo onlineIone che consente di interrogare e identificare set di strutture, interpretare i loro modelli di sequenza e variabilità strutturale e estrarre informazioni meccaniche sia dall'analisi che dalla predizione della loro plasticità strutturale. Una vasta gamma di strumenti di visualizzazione molecolare e server online consentono ai ricercatori di esplorare e analizzare le singole strutture biomolecolari. Tuttavia, gli strumenti esistenti per analizzare la sequenza, la struttura e le dinamiche delle famiglie di proteine eterogenee di grandi dimensioni richiedono una significativa competenza computazionale e in genere rimangono accessibili solo agli utenti con competenze di programmazione pertinenti. Ad esempio, il pacchetto Bio3D richiede R 8 , ProDy richiede pitone e Maven richiede la conoscenza di Matlab 9 , 10 . Bio3D-web in contrasto non richiede conoscenze di programmazione e quindi aumenta l'accessibilità e diminuisce la barriera all'ingresso per eseguire avanzate sequenze comparative, struttura e dyAnalisi dei nomi. Inoltre, è incluso il servizio Bio3D-web per la preparazione, la cura, l'annotazione e la pulizia delle strutture molecolari spesso necessarie per un'analisi efficiente. Inoltre, la restrizione all'esecuzione di tali analisi sulle risorse computazionali possibili è attenuata dalla nostra istanza server che consente un'analisi su vasta scala di molte strutture che possono essere avviate e controllate da qualsiasi browser web moderno.
Lo sviluppo aperto di Bio3D-web è in corso (vedi https://bitbucket.org/Grantlab/bio3d). Continuiamo ad aggiungere nuove funzionalità di analisi e migliorare i metodi esistenti. Lo sviluppo futuro si concentrerà sull'aggiunta di PCA a base di matrici a distanza e PCA torsionale, più approfonditi approcci di conservazione della sequenza che includono una componente filogenetica, l'identificazione del sito di rilegatura dell'assemble, e nuovi approcci per l'analisi dinamica della rete in tutte le famiglie di proteine. A questo proposito l'attuale applicazione web rappresenta la punta di partenzaT per molti altri flussi di lavoro strutturali di analisi strutturale bioinformatica consentendo passi riproducibili e condivisi su set di strutture sperimentali definite dall'utente. Pianziamo anche il supporto futuro di gruppi di coordinate biologiche ricostruite in aggiunta alle catene individuali e molteplici dell'unità asimmetrica delle strutture PDB. Ulteriori funzioni includono il miglioramento del risparmio e il caricamento di spazi di lavoro collaborativi insieme ad una possibilità di annullamento.
Bio3D-web è un'applicazione online per l'analisi interattiva dei dati della struttura biomolecolare. Bio3D-web funziona su qualsiasi browser web moderno e fornisce funzionalità per: (1) l'identificazione della struttura proteica correlata imposta a soglie specificate dall'utente di somiglianza; (2) la loro sovrapposizione multipla e la struttura della sovrapposizione; (3) Analisi di conservazione delle sequenze e delle strutture; (4) mappatura delle relazioni interconforme con l'analisi di componenti principali e (5) confronto delle dinamiche interne previste tramite l'insieme eMal analisi di modalità. Questa funzionalità integrata fornisce un flusso di lavoro completo per l'analisi delle relazioni tra strutture e dinamiche sequenziali all'interno delle famiglie di proteine e delle superfamiglie. Oltre ad una comoda interfaccia dinamica facile da usare per esplorare gli effetti delle scelte di parametri e metodi, Bio3D-web registra anche l'input completo dell'utente e i risultati grafici successivi della sessione di un utente. Questo consente agli utenti di condividere e riprodurre facilmente la sequenza di fasi di analisi che hanno creato i loro risultati. BIO3D-web è interamente attuato nel linguaggio R e si basa sui pacchetti Bio3D e Shiny R. Può essere eseguito dal nostro server online o installato localmente su qualsiasi computer che esegue R. Questo include l'installazione del server locale per fornire un'istanza multiutente personalizzata con accesso a set di dati strutturali prioritari come quelli comuni nell'industria farmaceutica. Il codice sorgente completo e un'ampia documentazione sono forniti con una licenza open source GPL-3 da: http://thegrantlab.org/ Bio3d / webapps
The authors have nothing to disclose.
Ringraziamo il dottor Guido Scarabelli e Hongyang Li per un ampio test durante lo sviluppo così come la comunità di utenti Bio3D e gli operatori della bioinformatica strutturale dell'Università di Bergen per commenti e commenti che hanno migliorato questa applicazione.
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |