Ein Protokoll für die Online-Untersuchung von Proteinsequenz-Struktur-Dynamik-Beziehungen mit Bio3D-Web wird vorgestellt.
Wir zeigen die Nutzung von Bio3D-Web für die interaktive Analyse von biomolekularen Strukturdaten. Die Bio3D-Web-Anwendung bietet Online-Funktionalität für: (1) Die Identifizierung der verwandten Proteinstruktur setzt auf benutzerdefinierte Schwellenwerte der Ähnlichkeit; (2) Ihre mehrfache Ausrichtung und Strukturüberlagerung; (3) Sequenz- und Strukturerhaltungsanalyse; (4) Inter-Conformer-Relationship-Mapping mit Hauptkomponentenanalyse und (5) Vergleich der vorhergesagten internen Dynamik über Ensemble-Normalmodusanalyse. Diese integrierte Funktionalität bietet einen kompletten Online-Workflow zur Untersuchung von sequenzstruktur-dynamischen Beziehungen innerhalb von Proteinfamilien und Superfamilien.
Die Proteindatenbank (PDB) enthält jetzt mehr als 120.000 Proteinstrukturen – viele davon sind dieselbe Proteinfamilie, aber unter verschiedenen experimentellen Bedingungen gelöst. Diese mehrfachen Strukturen stellen eine unschätzbare Ressource für das Verständnis der Feinheiten der Proteinform und -funktion dar. Beispielsweise kann der rigorose Vergleich dieser Strukturensembles wichtige molekulare Mechanismen 1 , 2 , 3 aufzeigen und über die Konformationsdynamik informieren, die an Prozessen einschließlich der Ligandenbindung, der enzymatischen Katalyse und der biomolekularen Erkennung 4 , 5 , 6 , 7 beteiligt ist . Neue Erkenntnisse können oft aus der detaillierten Großanalyse der Sequenz, Struktur und Dynamik von Proteinfamilien gewonnen werden. Dies erfordert jedoch typischerweise ein beträchtliches BioinfOrmatik und Computerprogrammierkenntnisse zusammen mit der Vertrautheit mit den zu untersuchenden Proteinsystemen. Zum Beispiel benötigen Softwarepakete wie Bio3D, ProDy und Maven die Programmierung in R, Python und Matlab bzw. 8 , 9 , 10 . Umgekehrt sind Online-Tools zur Analyse der strukturellen Flexibilität im Allgemeinen auf die Untersuchung der einzelnen Strukturen 11 , 12 beschränkt . Eine Ausnahme in dieser Hinsicht ist der kürzlich entwickelte WebNM @ Server, der den Vergleich von Flexibilitätsmustern ermöglicht, die aus der Normalmodusanalyse (NMA) mehrerer vorjustierter benutzerdefinierter Strukturen erhalten wurden 13 . Jedoch fehlt diesem Server ein automatisiertes Verfahren zur Identifizierung von Strukturen zum Vergleich, deren Ausrichtung oder weitere Analyse über NMA hinaus. Ein weiterer neuer Beitrag ist die Online-PDBFlex-Datenbank, die Pre-c präsentiertGestoßene Analyse von PDB-Strukturen, die 95% oder höhere Sequenzidentität teilen 14 . Allerdings ist die Analyse von vielfältigeren Struktursets derzeit nicht verfügbar.
Wir haben bereits Bio3D-web präsentiert – eine einfach zu bedienende Webapplikation zur Analyse von Proteinsequenz-Struktur-dynamischen Beziehungen 15 . Bio3D-Web ist einzigartig in der Bereitstellung von einfach zu bedienenden integrierten Funktionalität für die Identifikation, Vergleich und detaillierte Analyse der großen homologen Struktur-Sets online. Hier stellen wir ein detailliertes Protokoll für die Online-Untersuchung der Proteinsequenz-Struktur-Dynamik-Beziehung mit Bio3D-Web vor. Bio3D-web bietet eine Vielzahl von Funktionen, um die fünf wichtigsten Schritte der Datenanalyse zu unterstützen, die in Abbildung 1 gezeigt sind und im Folgenden ausführlich diskutiert werden. Diese Schritte bilden einen Workflow, der sich von der Abfragesequenz oder der Struktureingabe über mehrere Ebenen der Sequenzstruktur-dynamischen Analyse erstreckt, um zusammenzufassenY berichtsgenerierung Die Ergebnisse sind sofort über umfangreiche In-Browser-Visualisierungs- und Plottergeräte sowie durch das Herunterladen von Ergebnisdateien in gängigen Formaten verfügbar. Neben einer komfortablen, einfach zu bedienenden, dynamischen Schnittstelle zur Erforschung der Effekte von Parameter- und Methodenwahlen zeichnet Bio3D-web auch die vollständigen Benutzereingaben und nachfolgenden grafischen Ergebnisse der Session eines Benutzers als einen spürbaren, reproduzierbaren Bericht in PDF-, DOC- und HTML-Formaten auf. User-Sessions können zu zukünftigen Zeiten gespeichert und neu geladen werden und komplette Ergebnisse heruntergeladen und weiter interpretiert werden durch das Bio3D R-Paket auf der lokalen Maschine eines Benutzers.
Bio3D-web wird durch das Bio3D R-Paket zur Analyse der biomolekularen Struktur, der Sequenz und der molekularen Simulationsdaten 8 , 16 angetrieben. Insbesondere Bio3D-Algorithmen zur starren Kernidentifikation 8 , Überlagerung, Hauptkomponentenanalyse(PCA) 8 und die Ensemble-Normalmodusanalyse (eNMA) 16 bilden die Basis der Anwendung. Wir nutzen auch Bio3D-Protokolle, die von pHMMER 17 für die Identifizierung verwandter Proteinstrukturen und MUSCLE 18 für die mehrfache Sequenzausrichtung abhängen. Struktur- und Sequenz-Annotationen werden über Bio3D-Dienstprogramme aus den RCSB-PDB 19- und PFAM-Datenbanken 20 abgeleitet . Bio3D-Web kann von unserem Online-Server aus betrieben werden oder lokal auf jedem Computer installiert werden. R. Bio3D-Web steht allen Benutzern offen und wird kostenlos unter einer GPL-3 Open-Source-Lizenz von: http: // thegrantlab zur Verfügung gestellt. Org / bio3d / webapps
Bio3D-web kann verwendet werden, um die strukturellen, dynamischen und funktionellen Zustände von Proteinen interaktiv aus den verfügbaren kristallographischen Strukturen zu untersuchen und abzubilden. Darüber hinaus können die NMA- und PCA-basierten Clustering-Ergebnisse zusammen mit den Annotationen und der sequenzbasierten Analyse besonders nützlich sein, um repräsentative Strukturen für eine zeitaufwändige Analyse, wie z. B. Ensemble-Kleinmolekül-Docking- oder Molekulardynamik-Simulationen, auszuwählen. Bio3D-web erleichtert damit die fortgeschrittene strukturelle Bioinformatik-Analyse für ein breiteres Spektrum von Forschern durch die Verringerung des erforderlichen Fachwissens. Das aktuelle Design von Bio3D-Web unterstreicht die Einfachheit über die umfassende Einbeziehung der vielen Analysemethoden, die im gesamten Standalone-Bio3D-Paket zur Verfügung stehen. In vielen Fällen ist es vorgesehen, dass die Forscher Bio3D-Web nutzen, um allgemeine Trends in ihrer Proteinfamilie oder Superfamilie von Interesse zu verstehen, die dann mehr spezialisierte Analysen informieren können. Bio3D-web ist dasUm die biomolekularen Strukturdatensätze schnell zu erforschen und als hypothesenerzeugendes Werkzeug zu fungieren. Wir ermutigen die Benutzer, ihre Daten weiter zu erforschen, indem sie den Bio3D-Code in dem reproduzierbaren Bericht bereitstellen, der auch alle Abfragedetails und Analyseergebnisse speichert.
In dem oben genannten repräsentativen Beispielprotokoll zeigen wir die Fähigkeit von Bio3D-web, die strukturellen Merkmale der funktionalen Konformationsübergänge von Adk aufzudecken. Zusätzliche Anwendungen von Bio3D-web beinhalten die Struktur- und Dynamikanalyse von vom Benutzer hochgeladenen PDB-Strukturen. Zum Beispiel kann der Benutzer neue Strukturen oder sogar Proteinsequenzen zur Analyse hochladen. Die zuvor erwähnten Analyseschritte, insbesondere der eNMA-Schritt, können sowohl lokale als auch globale Trends in Proteinbewegungen offenbaren, wobei kollektive Bewegungen von funktioneller Bedeutung sind. Der Vergleich mit Apo-Strukturen kann auch Merkmale von ungebundenen, gebundenen Konformationsübergängen zeigen. Weitere Anwendungsbeispiele fürEine Reihe von verschiedenen Proteinfamilien werden online zur Verfügung gestellt.
Obwohl alle Proteine flexible und dynamische Einheiten sind, haben nicht alle Proteine atomare Auflösungsstrukturen, die in verschiedenen Zuständen verfügbar sind ( zB aktive und inaktive Zustände). Unsere Sicht auf den Proteinstrukturraum ist somit begrenzt und daher ist die Einsicht aus Werkzeugen wie Bio3D-Web notwendigerweise auch für bestimmte Proteine begrenzt. Doch mit aktuellen technologischen Fortschritten und neuen Initiativen für die Strukturgenomik wird das hier vorgestellte Protokoll zunehmend zu einem wichtigen Weg, um Einblicke in wichtige Struktur-Funktions-Beziehungen zu gewinnen. Ein kritischer Schritt, der bei der Analyse von weiter entfernten Proteinen besonders wichtig ist, ist das mögliche Auftauchen von Ausrichtungsfehlern auf der Registerkarte ALIGN. Ausrichtungsfehler treten unvermeidlich auf, wenn die Sequenzähnlichkeit unter 30% sinkt und der Benutzer in solchen Fällen die Sequenzausrichtung überprüfen und korrigieren mussAuf der Registerkarte ALIGN. Ausrichtungsfehler führen möglicherweise zu falschen überlagerten Strukturen in der FIT-Registerkarte und maskieren die relevantesten Konformationsvariationen für den nachfolgenden PCA. Darüber hinaus sollte der Anwender sich über fehlende Reste in den ausgewählten PDB-Strukturen bewusst sein, wie bei der aktuellen Implementierung PCA kann nur an Proteinresten durchgeführt werden, bei denen alle Strukturen ihr entsprechendes Kohlenstoff-Alpha-Atom aufgelöst haben. Wenn folglich ein ausgewählter PDB ungelöste Reste für eine bestimmte Region des Proteins aufweist, wird diese Region von PCA weggelassen.
Bio3D-Web ist derzeit auf die Analyse von Single-Chain-PDB-Strukturen beschränkt. Folglich können Funktionsbewegungen, die auf der quaternären Ebene auftreten, nicht mit dem aktuellen Protokoll erforscht werden. Obwohl wir derzeit neue Algorithmen entwickeln, um solche Analysen in Bio3D-Web einzubeziehen, ist die einzige aktuelle Option durch konventionelle Bio3D-Nutzung.
Bio3D-Web ist die einzige Online-BewerbungIon, das es ermöglicht, Struktursets abzufragen und zu identifizieren, ihre Sequenzmuster und strukturelle Variabilität zu interpretieren und mechanistische Informationen sowohl von der Analyse als auch von der Vorhersage ihrer strukturellen Plastizität zu extrahieren. Eine breite Palette an molekularen Visualisierungswerkzeugen und Online-Servern ermöglicht es Forschern, einzelne biomolekulare Strukturen zu erforschen und zu analysieren. Allerdings erfordern die vorhandenen Werkzeuge für die Analyse der Sequenz, Struktur und Dynamik großer heterogener Proteinfamilien oftmals umfangreiche Rechenkenntnisse und sind in der Regel nur für Benutzer mit relevanten Programmierkenntnissen zugänglich. Zum Beispiel benötigt das Bio3D-Paket R 8 , ProDy benötigt Python und Maven erfordert Matlab-Kenntnisse 9 , 10 . Bio3D-Web im Gegensatz dazu erfordert keine Programmierkenntnisse und erhöht so die Zugänglichkeit und verringert die Eintrittsbarriere zur Durchführung fortgeschrittener Vergleichsfolge, Struktur und dyNamics analyse Darüber hinaus ist die Vorbereitung, Kuration, Annotation und Aufräumung von molekularen Strukturen, die häufig für eine effiziente Analyse notwendig ist, im Bio3D-Web Service enthalten. Darüber hinaus wird die Einschränkung für die Durchführung einer solchen Analyse auf fähige Berechnungsressourcen durch unsere Serverinstanz gemildert, die eine umfangreiche Analyse vieler Strukturen ermöglicht, die von jedem modernen Webbrowser initiiert und gesteuert werden können.
Die offene Entwicklung von Bio3D-Web ist im Gange (siehe https://bitbucket.org/Grantlab/bio3d). Wir setzen fort, neue Analysefunktionalität hinzuzufügen und bestehende Methoden zu verbessern. Die zukünftige Entwicklung konzentriert sich auf die Hinzufügung von Distanzmatrix-basierten PCA- und Torsions-PCA, umfangreichere Sequenz-Konservierungsansätze, die eine phylogenetische Komponente, Ensemble-Bindungsstellenidentifizierung und neue Ansätze für eine dynamische Netzwerkanalyse über Proteinfamilien beinhalten. In dieser Hinsicht repräsentiert die aktuelle Webanwendung den AnfangszeigerT für viele andere kollaborative strukturelle bioinformatische Analysen-Workflows, indem es reproduzierbare und zugängliche Schritte auf benutzerdefinierte experimentelle Struktur-Sets ermöglicht. Wir planen auch zukünftige Unterstützung von rekonstruierten biologischen Einheitskoordinatensätzen zusätzlich zu Einzel- und Mehrfachketten aus der asymmetrischen Einheit der PDB-Strukturen. Zusätzliche Features beinhalten das verbesserte Speichern und Laden von kollaborativen Arbeitsräumen zusammen mit einer Undo-Möglichkeit.
Bio3D-web ist eine Online-Anwendung für die interaktive Analyse von biomolekularen Strukturdaten. Bio3D-Web läuft auf jedem modernen Webbrowser und bietet Funktionalität für: (1) Die Identifizierung der verwandten Proteinstruktur setzt auf benutzerdefinierte Schwellenwerte der Ähnlichkeit; (2) Ihre mehrfache Ausrichtung und Strukturüberlagerung; (3) Sequenz- und Strukturerhaltungsanalyse; (4) Inter-Conformer-Relationship-Mapping mit Hauptkomponentenanalyse und (5) Vergleich der vorhergesagten internen Dynamik über Ensemble nochMal Modusanalyse Diese integrierte Funktionalität bietet einen kompletten Workflow für die Untersuchung von sequenzstruktur-dynamischen Beziehungen innerhalb von Proteinfamilien und Superfamilien. Zusätzlich zu einer bequemen, einfach zu bedienenden dynamischen Schnittstelle zur Erforschung der Effekte von Parameter- und Methodenwahlen zeichnet Bio3D-web auch die vollständigen Benutzereingaben und die nachfolgenden grafischen Ergebnisse einer Benutzersitzung auf. Dies ermöglicht es Benutzern, die Reihenfolge der Analyseschritte, die ihre Ergebnisse erstellt haben, einfach zu teilen und zu reproduzieren. Bio3D-Web ist vollständig in der R-Sprache implementiert und basiert auf den Paketen Bio3D und Shiny R. Es kann von unserem Online-Server ausgeführt werden oder lokal auf jedem Computer mit R installiert werden. Dies schließt lokale Server-Installation, um eine benutzerdefinierte Multi-User-Instanz mit Zugriff auf prioritäre strukturelle Datensätze wie die in der pharmazeutischen Industrie. Voller Quellcode und umfangreiche Dokumentation finden Sie unter einer GPL-3 Open-Source-Lizenz von: http://thegrantlab.org/ Bio3d / webapps
The authors have nothing to disclose.
Wir danken Dr. Guido Scarabelli und Hongyang Li für umfangreiche Tests während der gesamten Entwicklung sowie die Bio3D User Community und die University of Bergen strukturellen Bioinformatik Workshop Teilnehmer für Feedback und Kommentare, die diese Anwendung verbessert haben.
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |