Een protocol voor het online onderzoek van eiwitsequentie-structuur-dynamiek relaties met behulp van Bio3D-web wordt gepresenteerd.
We tonen het gebruik van Bio3D-web voor de interactieve analyse van biomoleculaire structuurgegevens. De Bio3D-webtoepassing biedt online functionaliteit voor: (1) De identificatie van gerelateerde eiwitstructuren stelt aan de door gebruikers vastgestelde drempels van gelijkenis; (2) Hun meerdere uitlijning en structuur superpositie; (3) Conserveringsanalyse van sequentie en structuur; (4) Inter-conformer relatie mapping met hoofdcomponent analyse, en (5) vergelijking van voorspelde interne dynamiek via ensemble normal mode analyse. Deze geïntegreerde functionaliteit biedt een complete online workflow voor het onderzoeken van sequentie-structuur-dynamische relaties binnen eiwitfamilies en superfamilies.
De eiwitdatabank (PDB) bevat nu meer dan 120.000 eiwitstructuren – veel daarvan zijn van dezelfde eiwitfamilie maar worden opgelost onder verschillende experimentele omstandigheden. Deze meervoudige structuren vormen een waardevolle bron voor het begrijpen van de ingewikkeldheden van eiwitvorm en -functie. Bijvoorbeeld, de nauwkeurige vergelijking van deze structuurensembles kan belangrijke moleculaire mechanismen 1 , 2 , 3 onthullen en informeren over conformational dynamics betrokken bij processen die ligandbinding, enzymatische katalyse en bi-moleculaire herkenning 4 , 5 , 6 , 7 omvatten. Nieuwe inzichten kunnen vaak worden verkregen uit de gedetailleerde grootschalige analyse van de sequentie, structuur en dynamiek van eiwitfamilies. Dit vereist echter meestal aanzienlijke bioinfOrmatiek en computerprogrammeringskunde, samen met bekendheid met de onderzochte proteïnesystemen. Bijvoorbeeld, softwarepakketten zoals Bio3D, ProDy en Maven vereisen programmering in respectievelijk R, Python en Matlab, respectievelijk 8 , 9 , 10 . Omgekeerd zijn online tools voor analyse van structurele flexibiliteit over het algemeen beperkt tot het onderzoek van individuele structuren 11 , 12 . Een uitzondering in dit verband is de recent ontwikkelde WebNM @ -server, die het mogelijk maakt om de flexibiliteitspatronen te vergelijken die zijn verkregen uit de normale modusanalyse (NMA) van een aantal vooraf gedefinieerde gebruikersspecifieke structuren 13 . Deze server ontbreekt echter een geautomatiseerde procedure voor het identificeren van structuren voor vergelijking, hun uitlijning of verdere analyse buiten NMA. Een andere recente bijdrage is de online PDBFlex database, die pre-c presenteertOmgekeerde analyse van PDB-structuren die 95% of meer sequentieidentiteit delen 14 . Echter, analyse van meer uiteenlopende structuur sets is momenteel niet beschikbaar.
We hebben eerder Bio3D-web gepresenteerd – een makkelijk te gebruiken webapplicatie voor de analyse van eiwitsequentie-structuur-dynamische relaties 15 . Bio3D-web is uniek in het leveren van eenvoudig geïntegreerde functionaliteit voor de identificatie, vergelijking en gedetailleerde analyse van grote homologe structuur sets online. Hier presenteren wij een gedetailleerd protocol voor het online onderzoek van eiwitsequentie-structuur-dynamiek relatie met behulp van Bio3D-web. Bio3D-web biedt een verscheidenheid aan functies om de vijf belangrijkste stappen van data-analyse, zoals weergegeven in figuur 1, te ondersteunen en in detail hieronder te bespreken. Deze stappen vormen een workflow die zich uitstreekt van querysequentie of structuurinvoer, door meerdere niveaus van sequentie-structuur-dynamische analyse, om samen te vattenY rapportage generatie. Resultaten zijn direct beschikbaar via uitgebreide in-browser visualisatie en plot-apparaten, evenals door het downloaden van resultaatbestanden in veelgebruikte formaten. Naast een handige, makkelijk te gebruiken dynamische interface voor het verkennen van de effecten van parameter- en methodekeuzes, registreert Bio3D-web ook de volledige gebruikersinvoer en daaropvolgende grafische resultaten van de sessie van een gebruiker als een bruikbaar reproduceerbaar rapport in PDF-, DOC- en HTML-formaten. Gebruikersessies kunnen worden opgeslagen en herladen op toekomstige tijden en afronden resultaten worden gedownload en verder geïnterpreteerd door het Bio3D R-pakket op de lokale machine van een gebruiker.
Bio3D-web wordt aangedreven door het Bio3D R pakket voor analyse van biomoleculaire structuur, sequentie en moleculaire simulatie data 8 , 16 . In het bijzonder, Bio3D-algoritmes voor het identificeren van starre kernen 8 , superpositie, hoofdcomponent analyse(PCA) 8 , en ensemble normal mode analyse (eNMA) 16 vormen de basis van de applicatie. We gebruiken ook Bio3D-protocollen die afhankelijk zijn van pHMMER 17 voor de identificatie van gerelateerde eiwitstructuren, en MUSCLE 18 voor meerdere sequentie-uitlijning. Structuur- en volgorde annotaties worden afgeleid via Bio3D utilities uit de RCSB PDB 19 en PFAM databases 20 . Bio3D-web kan worden uitgevoerd vanuit onze online-server of op een computer geïnstalleerd op een computer die rijdt. Bio3D-web is open voor alle gebruikers en wordt gratis geleverd onder een GPL-3 open source licentie van: http: // thegrantlab. org / bio3d / webapps
Bio3D-web kan gebruikt worden om de structurele, dynamische en functionele staat van eiwitten interactief te onderzoeken en te plukken uit beschikbare kristallografische structuren. Bovendien kunnen de NMA- en PCA-gebaseerde clusteringsresultaten, samen met de annotaties en sequentie gebaseerde analyse, bijzonder nuttig zijn voor het selecteren van representatieve structuren voor meer tijdrovende analyse, zoals ensemble small molecule docking of moleculaire dynamische simulaties. Bio3D-web vergemakkelijkt dus geavanceerde structurele bioinformatica analyse voor een breder scala van onderzoekers door het vereiste niveau van technische expertise te verminderen. Het huidige ontwerp van Bio3D-web benadrukt de eenvoud over het uitputtende opnemen van de vele analysemethoden die beschikbaar zijn in het volledige stand-alone Bio3D-pakket. In veel gevallen wordt verwacht dat onderzoekers Bio3D-web zullen gebruiken om algemene trends in hun eiwitfamilie of superfamilie van belang te begrijpen, die dan meer gespecialiseerde analyses kunnen informeren. Bio3D-web is deRefore ontworpen om snel de biomoleculaire structuurgegevens te onderzoeken en als een hypothese-genererende tool te fungeren. Wij raden gebruikers aan om hun gegevens verder te onderzoeken door voorbeeld Bio3D code in het reproduceerbare rapport te geven dat ook alle zoekgegevens en analyseresultaten opslaat.
In het bovenstaande representatieve voorbeeldprotocol tonen we de mogelijkheden van Bio3D-web om de structurele kenmerken van functionele conformational transitions van Adk te onthullen. Aanvullende toepassingen van Bio3D-web omvatten structurele en dynamische analyse van gebruikers-geüploade PDB structuren. Bijvoorbeeld kan de gebruiker nieuwe structuren of inderdaad eiwitsequenties uploaden voor analyse. De eerder genoemde analysestappen, met name de eNMA-stap, kunnen zowel lokale als globale trends in eiwitbewegingen onthullen, waarbij collectieve bewegingen functioneel zijn. Vergelijking met apo-structuren kan ook de kenmerken van onbound aan gebonden conformatie-overgangen onthullen. Aanvullende voorbeelden van toepassing opEen reeks verschillende eiwitfamilies worden online aangeboden.
Hoewel alle eiwitten flexibele en dynamische entiteiten zijn, hebben niet alle eiwitten atoomresolutiestructuren beschikbaar in een reeks verschillende staten ( bijv. Actieve en inactieve staten). Onze opvatting van de ruimte voor eiwitstructuur is dus een beperkte en daarom wordt het inzicht verkregen uit hulpmiddelen zoals Bio3D-web noodzakelijkerwijs ook beperkt voor bepaalde eiwitten. Echter, met de huidige technologische vooruitgang en nieuwe initiatieven voor structurele genomica wordt het hier gepresenteerde protocol steeds meer een belangrijke route om inzicht te krijgen in belangrijke structuur-functie relaties. Een kritische stap, die bijzonder belangrijk is bij het analyseren van meer verhoudingsgerelateerde eiwitten, is de mogelijke opkomst van uitlijnfouten in het ALIGN-tabblad. Uitlijning fouten zullen onvermijdelijk optreden wanneer de volgorde gelijkenis dalen tot onder 30% en de gebruiker moet in dergelijke gevallen dubbel controleren en corrigeer de volgorde uitlijningOp het tabblad ALIGN. Uitlijning fouten zullen mogelijk leiden tot onjuiste bovenliggende structuren op het tabblad FIT en maskeren de meest relevante conformatieve variaties voor de daaropvolgende PCA. Daarnaast moet de gebruiker zich bewust zijn van ontbrekende residuen in de geselecteerde PDB-structuren, aangezien in de huidige implementatie PCA alleen kan worden uitgevoerd op eiwitresiduen waarin alle structuren hun bijbehorende koolstofalfaatoom hebben opgelost. Als een geselecteerd VBB onopgeloste residuen heeft voor een bepaald gebied van het eiwit, zal deze regio derhalve van PCA worden weggelaten.
Bio3D-web is momenteel beperkt tot de analyse van single-chain PDB structuren. Bijgevolg kunnen functionele bewegingen die op het quaternaire niveau optreden niet worden onderzocht met behulp van het huidige protocol. Hoewel we momenteel nieuwe algoritmen ontwikkelen om zo'n analyse in Bio3D-web op te nemen, is de enige huidige optie via conventioneel Bio3D-gebruik.
Bio3D-web is de enige online applicatieIonen die het mogelijk maakt om structuur sets te vragen en te identificeren, hun patronen van volgorde en structurele variabiliteit te interpreteren en mechanistische informatie uit beide analyses en voorspelling van hun structurele plasticiteit te extraheren. Een breed scala van moleculaire visualisatie-instrumenten en online servers stelt onderzoekers in staat individuele biomoleculaire structuren te verkennen en te analyseren. Echter, bestaande instrumenten voor analyse van de sequentie, structuur en dynamiek van grote heterogene eiwitfamilies vereisen vaak significante computervaardigheid en zijn meestal alleen toegankelijk voor gebruikers met relevante programmeringsvaardigheden. Bijvoorbeeld, de Bio3D pakketvereisten R8, prody vereist python en Maven vereist Matlab kennis 9, 10. Bio3D-web in contrast vereist geen programmeringskennis en verhoogt daarmee de toegankelijkheid en vermindert de toegangsbarrière voor het uitvoeren van geavanceerde vergelijkende volgorde, structuur en dyNamiekanalyse. Bovendien is de voorbereiding, curatie, annotatie en opruiming van moleculaire structuren die vaak nodig zijn voor efficiënte analyse opgenomen in de Bio3D-webservice. Bovendien wordt de beperking van het uitvoeren van dergelijke analyses op geschikte computergebruiken vergemakkelijkt door onze server-instantie die grootschalige analyse mogelijk maakt van veel structuren die kunnen worden geïnitieerd en gecontroleerd vanuit elke moderne webbrowser.
Open ontwikkeling van Bio3D-web is aan het gangen (zie https://bitbucket.org/Grantlab/bio3d). We blijven doorgaan met nieuwe analysefuncties en bestaande methodes verbeteren. Toekomstige ontwikkeling zal zich richten op de toevoeging van PCA en PCA op afstand matrix, uitgebreidere sequentiebehoud benaderingen die een fylogenetische component bevatten, identificatie van het bindend bindingssysteem en nieuwe benaderingen voor dynamische netwerkanalyse in eiwitfamilies. In dit opzicht vertegenwoordigt de huidige webapplicatie de startpuntT voor veel andere samenwerkende structurele bioinformatic analyse werkstromen door het mogelijk maken van reproduceerbare en deelbare stappen op gebruikers gedefinieerde experimentele structuur sets. We plannen ook toekomstige ondersteuning van gereconstrueerde biologische eenheidscoördinatensets naast individuele en meerdere ketens uit de asymmetrische eenheid PDB-structuren. Extra functies omvatten verbeterde besparing en laden van samenwerkende werkruimten, samen met een mogelijkheid om ongedaan te maken.
Bio3D-web is een online applicatie voor interactieve analyse van biomoleculaire structuurgegevens. Bio3D-web draait op elke moderne webbrowser en biedt functionaliteit voor: (1) De identificatie van gerelateerde eiwitstructuren stelt op door de gebruiker gespecificeerde drempels van gelijkenis; (2) Hun meerdere uitlijning en structuur superpositie; (3) Conserveringsanalyse van sequentie en structuur; (4) Inter-conformer relatie mapping met hoofdcomponent analyse, en (5) vergelijking van voorspelde interne dynamiek via ensemble nochMal modus analyse. Deze geïntegreerde functionaliteit biedt een complete workflow voor het onderzoek naar sequentie-structuur-dynamische relaties binnen eiwitfamilies en superfamilies. Naast een handige, makkelijk te gebruiken dynamische interface voor het verkennen van de effecten van parameter- en methodekeuzes, registreert Bio3D-web ook de volledige gebruikersinvoer en daaropvolgende grafische resultaten van de sessie van een gebruiker. Hiermee kunnen gebruikers de volgorde van analysestages die de resultaten hebben gemaakt gemakkelijk delen en reproduceren. Bio3D-web is volledig geïmplementeerd in de R-taal en is gebaseerd op de Bio3D- en Shiny R-pakketten. Het kan worden uitgevoerd vanuit onze online server of lokaal geïnstalleerd op elke computer die R draait. Dit omvat de lokale serverinstallatie om een aangepaste multi-user-instantie te verschaffen met toegang tot prioritaire structurele datasets, zoals die in de farmaceutische industrie. Volledige broncode en uitgebreide documentatie wordt geleverd onder een GPL-3 open source licentie van: http://thegrantlab.org/ Bio3d / webapps
The authors have nothing to disclose.
Wij bedanken dr. Guido Scarabelli en Hongyang Li voor uitgebreide tests tijdens de ontwikkeling, de Bio3D gebruikersgemeenschap en de studenten van de Universiteit van Bergen, structurele bioinformatica workshop voor feedback en opmerkingen die deze applicatie hebben verbeterd.
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |