Visual Dynamics è uno strumento open source che accelera le implementazioni e l’apprendimento nella simulazione della dinamica molecolare utilizzando Gromacs. Il protocollo presentato vi guiderà attraverso i passaggi per eseguire una simulazione proteina-ligando preparata in ACPYPE con facilità e i passaggi generali verso altri modelli di simulazione.
Visual Dynamics (VD) è uno strumento web che mira a facilitare l’uso e l’applicazione della Molecular Dynamics (MD) eseguita in Gromacs, consentendo agli utenti senza familiarità computazionale di eseguire simulazioni di breve durata per scopi di convalida, dimostrazione e insegnamento. È vero che i metodi quantistici sono i più accurati. Tuttavia, attualmente non esiste una fattibilità computazionale per eseguire gli esperimenti eseguiti da MD. Lo strumento qui descritto ha ricevuto continui miglioramenti nel corso degli ultimi due anni. Questo protocollo descriverà ciò che è necessario per eseguire una simulazione in VD con un complesso proteina-ligando precedentemente preparato in ACPYPE e alcune indicazioni generali sugli altri modelli di simulazione disponibili. Per la simulazione dettagliata, verrà utilizzata la proteina legante FK506 di Plasmodium vivax complessata con l’inibitore D5 (PDB ID: 4mgv) e verranno forniti tutti i file utilizzati. Si noti che questo protocollo indicherà ogni opzione da utilizzare per ottenere gli stessi risultati presentati, ma queste opzioni non sono necessariamente le uniche disponibili.
Secondo la definizione IUPAC, la MD è la procedura di simulazione che consiste nel calcolare il moto degli atomi in una molecola o di singoli atomi o molecole in solidi, liquidi e gas, secondo le leggi del moto di Newton. Le forze che agiscono sugli atomi, necessarie per simulare il loro movimento, sono comunemente calcolate utilizzando i campi di forza della meccanica molecolare1. Può essere applicato a qualsiasi fenomeno che cerchi di estrarre informazioni a livello molecolare e spesso atomico2.
La MD è una delle tecniche incorporate nella bioinformatica, in particolare nella bioinformatica strutturale. Con esso è possibile ottenere caratteristiche cinetiche e termodinamiche di strutture biomolecolari. Ad esempio, stabilità macromolecolare, identificazione di siti allosterici, chiarimento dei meccanismi di attività enzimatica, riconoscimento molecolare e proprietà di complessi con piccole molecole, associazione tra proteine, ripiegamento delle proteine e sua idratazione3. Inoltre, la MD consente un’ampia gamma di studi, tra cui la progettazione molecolare (ampiamente utilizzata nella progettazione di farmaci), per determinare la struttura e il suo raffinamento (raggi X, NMR e modellazione proteica)3. I risultati ottenuti al termine di un MD sono i più ricchi e completi in termini di simulazione non quantistica4. La MD classica è molto più efficiente di quanto ci si potrebbe aspettare da una considerazione completa della fisica dei sistemi biomolecolari a causa del numero di approssimazioni sostanziali. In particolare, gli effetti della dinamica quantistica vengono solitamente ignorati3. Tuttavia, l’implementazione di un esperimento MD non è banale5. Richiede la conoscenza dell’informatica, in particolare del terminale Linux, poiché la maggior parte dei software di bioinformatica strutturale è fatta per questo. Anche con questa conoscenza, l’apprendimento dei comandi e della parametrizzazione di Gromacs è un’altra curva di apprendimento ripida.
Dalla sua prima applicazione alla biologia nel 19776, molto si è evoluto grazie all’aumento dell’elaborazione computazionale e al miglioramento della codifica. Più di due decenni fa, è stato lanciato il primo software MD destinato ai problemi biologici, ovvero Gromacs7, AMBER8 e NAMD9.
Sin dalle loro prime versioni, questi software rimangono ancora oggi i più utilizzati e citati. Tuttavia, continuano con le stesse comuni difficoltà di implementazione che affliggono i ricercatori che non sono specialisti di computer5. Alcuni hanno passaggi di installazione e configurazione complessi, che a volte richiedono una conoscenza approfondita dell’hardware su cui verranno eseguiti per ottenere il massimo da esso e una documentazione tecnica altamente incentrata sul computer. È necessario un modo più semplice per interfacciarsi con loro, oltre alla riga di comando e ai parametri infiniti.
Un’interfaccia funge da intermediario tra il processo logico da eseguire e l’essere umano10. Il paradigma di esecuzione del software si è evoluto con il miglioramento delle risorse informatiche. Il primo paradigma digitale sono state le interfacce a riga di comando (CLI), seguite dall’evoluzione verso le note interfacce grafiche utente (GUI)11. Seguendo il ciclo evolutivo, l’interfaccia prodotta dal World Wide Web (o semplicemente WEB) è considerata un’evoluzione delle GUI11. Questi tre paradigmi attualmente coesistono a seconda degli sviluppatori. Le applicazioni CLI utilizzano comandi testuali sulla console del sistema operativo. Le applicazioni GUI, chiamate anche desktop grafici, utilizzano un’interfaccia grafica composta da finestre, pulsanti e altri componenti. È specifico e pre-programmato per un sistema operativo. La principale differenza rispetto alla CLI è l’uso del mouse come elemento aggiuntivo nell’interazione uomo-macchina12. Le applicazioni WEB, nonostante siano confuse con un’interfaccia grafica, sono più complesse da sviluppare ma sono più versatili e di gran lunga le più agili nel funzionamento. Inoltre, essi dipendono solo da un software di interpretazione, chiamato browser, che consente all’applicazione client di comunicare con il server attraverso una rete indipendente dal sistema operativo13.
I software di bioinformatica strutturale utilizzano più comunemente i paradigmi CLI e GUI. Alcuni esempi di software classici che utilizzano CLI sono Modeller14 per la modellazione di similarità, Autodock15 per il docking molecolare e Gromacs16 per la dinamica molecolare. Esempi di software che adottano il tipo GUI sono SwissPDBviewer17, Pymol18, VMD19, UCSF Chimera20, Autodock tools15, PyRx21, Biovia22, Maestro23 e Moe24, tra gli altri.
Con l’emergere delle tecnologie Hypertext Markup Language versione 5 (HTML5)25, Cascading Style Sheets (CSS)26 e Javascript27 , tra le altre, molte applicazioni di bioinformatica strutturale potrebbero essere portate sul WEB, diventando così più accessibili. Esempi di similarity modeling WEB server sono MODWEB28, che utilizza Modeller14 come back-end e Swissmodel29. Esempi di server di applicazioni web per il docking molecolare sono Haddock30, Swissdock31, Cluspro32, Dockthor33 e altri.
Mentre l’analisi strutturale, la modellazione e le metodologie di docking si sono evolute dai paradigmi CLI alla GUI e infine al WEB, MD continua ad essere per lo più supportato dall’esecuzione della riga di comando (tipo CLI). Sono emerse alcune buone iniziative per migliorare questo panorama. Esempi di queste iniziative sono l’implementazione di plug-in in software esistenti, come il plug-in QwikMD per VMD34, il plug-in GROMACS per PyMOL e l’opzione di simulazione dinamica molecolare in UCSF Chimera20, alcune nuove e più semplici applicazioni CLI, come ASGARD35, Gmx_qk36 e CHAPERONg37, e una robusta piattaforma web, BioBB-Wfs38. Sebbene l’uso di questi plugin e applicazioni sia un progresso, la loro implementazione è ancora una sfida per la maggior parte dei ricercatori non qualificati. Le difficoltà più comuni includono problemi di installazione e configurazione del software MD, che spesso compromettono la piena esecuzione della simulazione5.
Nel 2022, il software Visual Dynamics per la simulazione computazionale basata sul web è stato reso disponibile dal Laboratório de Bioinformática e Química Medicinal presso Fiocruz Rondônia39. La sua versione iniziale è stata costruita in Python e Flask, consentendo simulazioni di sistemi con proteine libere (apoenzimi) per soli 2 ns. Successivamente, è stato migliorato per includere una versione di simulazione automatizzata con ligandi preparati utilizzando PRODRG40.
VD è stato creato per assistere tutti i ricercatori nel campo della biofisica strutturale, della biotecnologia e delle aree correlate che hanno limitazioni nella conoscenza computazionale; lo strumento consente a questi ricercatori di testare le loro ipotesi che coinvolgono simulazioni MD da qualsiasi sistema operativo e senza l’accesso a un computer ad alte prestazioni (HPC). Lo scopo di questo lavoro è quello di presentare le nuove funzionalità di Visual Dynamics versione 3.0. Inoltre, mira a introdurre un protocollo di utilizzo aggiornato per lo strumento e ad evidenziare le limitazioni da affrontare in futuro, insieme alle statistiche di utilizzo fino al momento attuale (Figura 1).
Automatizzare i processi non è facile, ma è anche meno difficile che riprogrammare un sistema da zero. Gromacs è attualmente il software di simulazione molecolare più popolare ed è costantemente aggiornato. Il Dipartimento di Chimica Biofisica dell’Università di Groningen lo ha inizialmente sviluppato, ed è ora gestito dal Laboratorio di Scienze della Vita dell’Università di Stoccolma43.
Per ogni nuovo utente, l’apprendimento delle tecniche di simulazione è un …
The authors have nothing to disclose.
Questo lavoro è stato sostenuto dalla Fundação Oswaldo Cruz (Fiocruz), dalla Fundação para o Desenvolvimento Científico e Tecnológico em Saúde (Fiotec), dall’Instituto Nacional de Ciência e Tecnologia de Epidemiologia da Amazônia Ocidental – INCT-EpiAmO, dalla Fundação Rondônia de Amparo ao Desenvolvimento das Ações Científicas e Tecnológicas e à Pesquisa do Estado de Rondônia (FAPERO), il Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) e il Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq).
ACPYPE Server | Bio2Byte | Available at https://www.bio2byte.be/acpype/ | |
GRACE software | Plasma Laboratory at the Weizmann Institute of Science | Available at https://plasma-gate.weizmann.ac.il/Grace/ | |
GROMACS software | GROMACS Team | Installation instructions at https://manual.gromacs.org/current/install-guide/index.html | |
The structure of the FK506-binding protein From Plasmodium vivax complexed with the inhibitor D5 |
RCSB Protein Data Bank | Available at https://www.rcsb.org/structure/4mgv Already contains the ligand complexed to the macromolecule. |