Özet

Untersuchung der Proteinsequenz-Struktur-Dynamik Beziehungen zu Bio3D-Web

Published: July 16, 2017
doi:

Özet

Ein Protokoll für die Online-Untersuchung von Proteinsequenz-Struktur-Dynamik-Beziehungen mit Bio3D-Web wird vorgestellt.

Abstract

Wir zeigen die Nutzung von Bio3D-Web für die interaktive Analyse von biomolekularen Strukturdaten. Die Bio3D-Web-Anwendung bietet Online-Funktionalität für: (1) Die Identifizierung der verwandten Proteinstruktur setzt auf benutzerdefinierte Schwellenwerte der Ähnlichkeit; (2) Ihre mehrfache Ausrichtung und Strukturüberlagerung; (3) Sequenz- und Strukturerhaltungsanalyse; (4) Inter-Conformer-Relationship-Mapping mit Hauptkomponentenanalyse und (5) Vergleich der vorhergesagten internen Dynamik über Ensemble-Normalmodusanalyse. Diese integrierte Funktionalität bietet einen kompletten Online-Workflow zur Untersuchung von sequenzstruktur-dynamischen Beziehungen innerhalb von Proteinfamilien und Superfamilien.

Introduction

Die Proteindatenbank (PDB) enthält jetzt mehr als 120.000 Proteinstrukturen – viele davon sind dieselbe Proteinfamilie, aber unter verschiedenen experimentellen Bedingungen gelöst. Diese mehrfachen Strukturen stellen eine unschätzbare Ressource für das Verständnis der Feinheiten der Proteinform und -funktion dar. Beispielsweise kann der rigorose Vergleich dieser Strukturensembles wichtige molekulare Mechanismen 1 , 2 , 3 aufzeigen und über die Konformationsdynamik informieren, die an Prozessen einschließlich der Ligandenbindung, der enzymatischen Katalyse und der biomolekularen Erkennung 4 , 5 , 6 , 7 beteiligt ist . Neue Erkenntnisse können oft aus der detaillierten Großanalyse der Sequenz, Struktur und Dynamik von Proteinfamilien gewonnen werden. Dies erfordert jedoch typischerweise ein beträchtliches BioinfOrmatik und Computerprogrammierkenntnisse zusammen mit der Vertrautheit mit den zu untersuchenden Proteinsystemen. Zum Beispiel benötigen Softwarepakete wie Bio3D, ProDy und Maven die Programmierung in R, Python und Matlab bzw. 8 , 9 , 10 . Umgekehrt sind Online-Tools zur Analyse der strukturellen Flexibilität im Allgemeinen auf die Untersuchung der einzelnen Strukturen 11 , 12 beschränkt . Eine Ausnahme in dieser Hinsicht ist der kürzlich entwickelte WebNM @ Server, der den Vergleich von Flexibilitätsmustern ermöglicht, die aus der Normalmodusanalyse (NMA) mehrerer vorjustierter benutzerdefinierter Strukturen erhalten wurden 13 . Jedoch fehlt diesem Server ein automatisiertes Verfahren zur Identifizierung von Strukturen zum Vergleich, deren Ausrichtung oder weitere Analyse über NMA hinaus. Ein weiterer neuer Beitrag ist die Online-PDBFlex-Datenbank, die Pre-c präsentiertGestoßene Analyse von PDB-Strukturen, die 95% oder höhere Sequenzidentität teilen 14 . Allerdings ist die Analyse von vielfältigeren Struktursets derzeit nicht verfügbar.

Wir haben bereits Bio3D-web präsentiert – eine einfach zu bedienende Webapplikation zur Analyse von Proteinsequenz-Struktur-dynamischen Beziehungen 15 . Bio3D-Web ist einzigartig in der Bereitstellung von einfach zu bedienenden integrierten Funktionalität für die Identifikation, Vergleich und detaillierte Analyse der großen homologen Struktur-Sets online. Hier stellen wir ein detailliertes Protokoll für die Online-Untersuchung der Proteinsequenz-Struktur-Dynamik-Beziehung mit Bio3D-Web vor. Bio3D-web bietet eine Vielzahl von Funktionen, um die fünf wichtigsten Schritte der Datenanalyse zu unterstützen, die in Abbildung 1 gezeigt sind und im Folgenden ausführlich diskutiert werden. Diese Schritte bilden einen Workflow, der sich von der Abfragesequenz oder der Struktureingabe über mehrere Ebenen der Sequenzstruktur-dynamischen Analyse erstreckt, um zusammenzufassenY berichtsgenerierung Die Ergebnisse sind sofort über umfangreiche In-Browser-Visualisierungs- und Plottergeräte sowie durch das Herunterladen von Ergebnisdateien in gängigen Formaten verfügbar. Neben einer komfortablen, einfach zu bedienenden, dynamischen Schnittstelle zur Erforschung der Effekte von Parameter- und Methodenwahlen zeichnet Bio3D-web auch die vollständigen Benutzereingaben und nachfolgenden grafischen Ergebnisse der Session eines Benutzers als einen spürbaren, reproduzierbaren Bericht in PDF-, DOC- und HTML-Formaten auf. User-Sessions können zu zukünftigen Zeiten gespeichert und neu geladen werden und komplette Ergebnisse heruntergeladen und weiter interpretiert werden durch das Bio3D R-Paket auf der lokalen Maschine eines Benutzers.

Bio3D-web wird durch das Bio3D R-Paket zur Analyse der biomolekularen Struktur, der Sequenz und der molekularen Simulationsdaten 8 , 16 angetrieben. Insbesondere Bio3D-Algorithmen zur starren Kernidentifikation 8 , Überlagerung, Hauptkomponentenanalyse(PCA) 8 und die Ensemble-Normalmodusanalyse (eNMA) 16 bilden die Basis der Anwendung. Wir nutzen auch Bio3D-Protokolle, die von pHMMER 17 für die Identifizierung verwandter Proteinstrukturen und MUSCLE 18 für die mehrfache Sequenzausrichtung abhängen. Struktur- und Sequenz-Annotationen werden über Bio3D-Dienstprogramme aus den RCSB-PDB 19- und PFAM-Datenbanken 20 abgeleitet . Bio3D-Web kann von unserem Online-Server aus betrieben werden oder lokal auf jedem Computer installiert werden. R. Bio3D-Web steht allen Benutzern offen und wird kostenlos unter einer GPL-3 Open-Source-Lizenz von: http: // thegrantlab zur Verfügung gestellt. Org / bio3d / webapps

Protocol

HINWEIS: Eine typische Bio3D-Web-Sitzung verläuft durch fünf aufeinanderfolgende und abhängige Schritte (siehe Abbildung 1 für eine schematische Darstellung). Jeder Schritt wird als aufeinanderfolgende Navigationsregisterkarte der Webapplikation SEARCH, ALIGN, FIT, PCA und eNMA implementiert. 1. Struktursuche und Auswahl (SEARCH) Eingangsstruktur Erhalten Sie die PDB-ID der Adenylat-Kinase (Adk), zB durch die Suche nach dem PDB [http://www.rcsb.org/pdb]. Alternativ erhalten Sie die Protein-Aminosäuresequenz von Interesse, zB von UniProt [http://uniprot.org]. Geben Sie die vier Zeichen lange PDB-ID für Adk ( zB 1AKE) ein, oder fügen Sie eine Proteinsequenz in das Textfeld im Feld "Input-Struktur oder Sequenz" ein. Hit Auswahl Klicken Sie auf die blaue Schaltfläche "Weiter" (Hit Auswahl) im ersten Bedienfeld oder blättern Sie einfach nach unten. B) "Auswahl treffen"Zur weiteren analyse Vergewissern Sie sich, dass der Schieberegler "Gesamtzahl der enthaltenen Strukturen beschränken" auf seinen maximalen Wert gesetzt ist, um alle Strukturen über dem Cutoff zu enthalten. Senken Sie die "Anpassen der Einschluss BitScore Cutoff", um mehr entfernte Hits einzuschließen, oder erhöhen Sie es auszuschließen. Optionale Trefferfilterung Klicken Sie auf die blaue Schaltfläche "Weiter" (Hit Auswahl) im ersten Panel oder blättern Sie einfach nach unten C) "Optionale Filterung der zugehörigen Strukturen für die weitere Analyse". Vergewissern Sie sich, dass die ausgewählten Treffer relevante Strukturen darstellen, indem Sie Details der Tabelle, zB PDB-Namen, Spezies und gebundene Liganden, untersuchen. Manuelles Verfassen der ausgewählten Teilmenge von Strukturen, wenn nötig, indem man auf die Zeilen der Tabelle klickt. HINWEIS: Zeilen, die mit einer blauen Farbe hervorgehoben werden, zeigen PDB-IDs, die für weitere Analysen in nachfolgenden Registerkarten ausgewählt wurden. 2. Multiple Sequence Alignment Analysis (ALIGN) Klicken Sie auf die Registerkarte ALIGN, um die Sequenzausrichtung der ausgewählten Strukturen auf der Registerkarte SEARCH auszuführen. Ausrichtungsübersicht Überprüfen Sie die Ausrichtungsübersicht in Panel A) "Alignment Summary". Stellen Sie sicher, dass die interessierenden Regionen ausgerichtet sind und nicht durch Lücken in einer oder mehreren Strukturen maskiert sind. Wenn nötig, schalten Sie die "Display-Ausrichtungsbearbeitungsoptionen" und entfernen Sie unerwünschte PDB-IDs, z. B. PDBs mit fehlenden Resten. Sequenzausrichtungsanalyse Klicken Sie auf die blaue Schaltfläche "Weiter" (Analyse), um eine sequenzbasierte Clusteranalyse der gesammelten Strukturen durchzuführen. Wählen Sie die Plotoption Dendrogramm. Passen Sie den Cluster in den K-Gruppen-Schieberegler an, um die Strukturen in k-Gruppen zu partitionieren. Ändern Sie ggf. die Clustering-Methode, indem Sie das Kontrollkästchen Weitere Clustering- und Ausgabeoptionen umschalten. </oL> Rückstandskonservierungsanalyse Klicken Sie auf die blaue Schaltfläche "Weiter" (Konservierung), um die säulenweise Rückstände zu berechnen. Wählen Sie die Aligned-Struktur-Sets aus, um ein Diagramm der Rückstands-Konservierung an jeder Ausrichtungsposition zu erzeugen. Wählen Sie Strukturen, die mit der PFAM-Saatgutausrichtung ausgerichtet sind, um die Erhaltung zu erhalten, die in Bezug auf die zugehörige PFAM-Saatgutausrichtung berechnet wird, die repräsentative Mitglieder der Familie enthält. Sequenzausrichtung Klicken Sie auf die blaue Schaltfläche "Weiter" (Ausrichtung), um die vollständige Sequenzausrichtung mit dem Visualisierungswerkzeug im Browser anzuzeigen. 3. Struktur Anpassung und Analyse (FIT) Führen Sie die Strukturüberlagerung durch, indem Sie die Registerkarte FIT eingeben. Strukturüberlagerung Umschalten des Kontrollkästchens "Show PDBs", um das ausgerichtete Protei zu visualisierenN-Strukturen im Browser. Stellen Sie sicher, dass die Proteinstrukturen den entsprechenden und relevanten Regionen durch visuelle Inspektionen überlagert werden. Klicken und ziehen Sie die Maus über die Strukturen zu drehen, und blättern zu zoomen. Passen Sie die Farbgebung der Strukturen an, indem Sie auf die "Farboptionen" klicken. Farboptionen umfassen Ausrichtungsposition, strukturelle Variabilität pro Position, RMSD-Clustergruppen, Sequenzclustergruppen, ausgerichtete Regionen und Sekundärstruktur. Laden Sie die überlagerten Strukturen entweder als herkömmliche PDB-Dateien oder als einzelne PyMOL-Session-Datei zur Visualisierung in einem spezialisierten molekularen Viewer-Programm herunter. Strukturanalyse Klicken Sie auf die blaue Schaltfläche "Weiter" (Analyse), um eine strukturbasierte Clusterung der gesammelten PDB-Strukturen durchzuführen. Umschalten der RMSD-Heatmap im Dropdown-Menü Plotoptionen. Passen Sie die Clustering-Optionen an, einschließlich der Clustering-Methode selbst, Indem Sie das Kontrollkästchen "Mehr Clustering und Ausgabeoptionen" umschalten. HINWEIS: Pairwise RMSD-Daten können auch als Dendrogramm, Histogramm oder Wärmekarte visualisiert werden. Rückstandsschwankungen Klicken Sie auf die blaue Schaltfläche "Weiter" (RMSF), um die strukturelle Variabilität jedes Restes (als RMSF-Plot dargestellt) mit großen sekundären Strukturelementen, die in den Randbereichen der x-Achse dargestellt sind, zu betrachten. Um die kristallographischen B-Faktoren der Referenzstruktur auf das RMSF-Plot zu überlagern, schalte das Kontrollkästchen Show B-Faktoren ein. 4. Hauptkomponentenanalyse (PCA) Führen Sie die Hauptkomponentenanalyse durch, indem Sie die Registerkarte "PCA" eingeben. Visualisierung der Hauptkomponenten Schalten Sie das Kontrollkästchen "PC-Trajektorie anzeigen" ein, um die von den PCs mit dem In-Browser-Visualisierungstool beschriebenen Bewegungen zu visualisieren. Stellen Sie sicher, "PrinCipal Component 1 "wird aus dem ersten Dropdown-Menü ausgewählt. Um die von anderen PCs beschriebenen Bewegungen zu visualisieren, wählen Sie den gewünschten PC aus dem Dropdown-Menü "Select Principal Component". Ändern Sie die Farbgebung der Trajektorie aus dem Dropdown-Menü "Farboptionen". Wählen Sie "Variabilität pro Position" von den "Farboptionen" bis zur Farbverschiebung. Klicken Sie im Bedienfeld "Principal Component Visualization" auf die Schaltfläche "PDB-Trajektorie herunterladen", um eine Trajektorienansicht der von den PCs beschriebenen Bewegung zu erhalten. Klicken Sie auf die Schaltfläche "PyMOL herunterladen", um eine PyMOL-Sitzungsdatei zu erzeugen, die die Bewegungen als Vektorfeld angibt. Konformeranalyse Projizieren Sie die einzelnen Strukturen auf zwei ausgewählte PCs, indem Sie auf die blaue Schaltfläche "Weiter" klicken. Vergewissern Sie sich, dass "PC auf X-Achse" auf 1 gesetzt ist und "PC oN Y-Achse "bis 2. Um die Strukturen auf andere PCs zu projizieren, stellen Sie die PC-Nummerierung entsprechend ein. Wählen Sie "Cluster by PC Subspace", um die Strukturen im Plot durch PC-basiertes Clustering zu färben. "RMSD", um durch "RMSD-basiertes" Clustering zu färben; Und "Sequenz", um nach sequenzbasierter Clusterung zu färben. Klicken Sie auf alle einzelnen Punkte in der Handlung, um die Strukturen zu kennzeichnen. Alternativ markieren Sie eine oder mehrere Strukturen in der Tabelle "PCA Conformer Plot Annotation" unterhalb der Handlung. Schieben Sie die PCs im Subraum-Schieberegler auf, um mehr / weniger PCs für den Clustering-Algorithmus einzuschließen. Rückstandsbeiträge Berechnen Sie die Rückstandsbeiträge zu den einzelnen PCs, indem Sie auf die blaue Schaltfläche "Weiter" (Rückstandsbeiträge) klicken. Zeichnen Sie die Beiträge für weitere PCs, indem Sie die PC-Nummer in das Textfeld "Select Principal Component" einfügen. Toggle die "Spread liNes "Kontrollkästchen vermeiden, die Rückstandsbeiträge übereinander zu platzieren. Schalten Sie das Kontrollkästchen "Multiline Plot" aus, um die Rückstandsbeiträge in separaten Plots zu zeichnen. Schalten Sie die "Show RMSF" ein, um die RMSF-Werte (auf der Registerkarte FIT) einzuschließen. 5. Ensemble Normalmodusanalyse (eNMA) Klicken Sie auf die Registerkarte eNMA, um die normale Modi (NMs) zu berechnen. Filterstruktur Passen Sie die Anzahl der Strukturen an, indem Sie den "Cutoff" für die Strukturintegration / den Ausschluss senken oder erhöhen. Klicken Sie auf die grüne "Run Ensemble NMA", um die NMA-Berechnung zu starten. Normalmodi Visualisierung Scrollen Sie nach unten zum zweiten Panel der eNMA-Registerkarte (Normal Modes Visualization) zur Visualisierung der NMs. HINWEIS: Standardmäßig wird der NM mit der höchsten Überlappung (Ähnlichkeit) zu PC-1 im visuellen angezeigtFenster. Um die von anderen NMs oder anderen PDB-Strukturen beschriebenen Bewegungen zu visualisieren, wählen Sie die gewünschte NM und Struktur aus den Dropdown-Menüs "Select Mode" und "Show NMs for structure" . Rückstandsschwankungen Klicken Sie auf die blaue Schaltfläche "Next" (Fluctuations), um die rückstandsbedingten Fluktuationen der für eNMA ausgewählten Strukturen zu berechnen. Schalte den "Cluster von RMSD" ein, um die Fluktuationsprofile durch RMSD-basiertes Clustering zu färben. Schalte den "Cluster von RMSIP" ein, um die Fluktuationsprofile durch RMSIP-basiertes Clustering zu färben. Umschalten Sie das Kontrollkästchen "Spread Linien", um die gruppierten Fluktuationsprofile voneinander zu unterscheiden. Vergleich von NMA und PCA Klicken Sie auf die blaue Schaltfläche "Next" (PCA-vs-NMA), um die Ähnlichkeit zwischen den einzelnen NMs und PCs zu berechnen. Wählen Sie ein PDB-ID aus dem Dropdown-Menü "Vergleich NMs der Struktur", um die Ähnlichkeit zwischen den NMs dieser Struktur zu den im PCA-Tab berechneten PCs zu berechnen. Überlappungsanalyse Klicken Sie auf die blaue Schaltfläche "Weiter" (Überlappungsanalyse), um die Überlappung zwischen berechneten NMs und dem Strukturdifferenzvektor zwischen zwei ausgewählten Strukturen zu berechnen. Wählen Sie eine "Referenz" PDB ID aus dem Dropdown-Menü "Vergleich NMs der Struktur" und oder eine oder mehrere PDB-IDs in der Strukturtabelle für den paarweisen Vergleich mit dem Referenz-PDB. Clusteranalyse Klicken Sie auf die blaue Schaltfläche " Weiter" (Clustering), um das Strukturclustering basierend auf der paarweisen NM-Ähnlichkeit (RMSIP) auszuführen.

Representative Results

Adenylat-Kinase (Adk) ist ein ubiquitäres Enzym, das dazu dient, das Gleichgewicht zwischen zytoplasmatischen Nukleotiden, die für viele zelluläre Prozesse essentiell sind, zu erhalten. Adk arbeitet durch katalysieren der reversiblen Übertragung einer Phosphorylgruppe von ATP zu AMP. Diese Reaktion begleitet von gut untersuchten ratenbegrenzenden Konformationsübergängen 3 , 21 . Hier analysieren wir alle derzeit verfügbaren Adk-Strukturen mit Bio3D-web, um detaillierte Features und mechanistische Prinzipien dieser wesentlichen Übergänge zu vermitteln. Wir können unsere Bio3D-Web-Analyse von Adk beginnen, indem wir den RCSB-PDB-Code einer bekannten Adk-Struktur eingeben. Wenn zum Beispiel die Eingabe der PDB-ID 1AKE in Panel A der SEARCH-Registerkarte 167 Sequenz ähnliche Strukturen zurückgibt, aus denen die Top 26 automatisch zur weiteren Analyse ausgewählt werden (siehe Panel B). Die Annotation vorhandenEd in Panel C zeigt an, dass diese ausgewählten Strukturen alle von E. coli sind, wurden durch Röntgenbeugung in einem Bereich von Raumgruppen gelöst; Haben einen Auflösungsbereich von 1,63 bis 2,8 Å und wurden mit einer Reihe von verschiedenen Liganden (einschließlich keine Liganden, AMP, ADP, MG und dem Inhibitor AP5) co-kristallisiert. Beachten Sie, dass zusätzliche Anmerkungsdetails angezeigt werden können, indem Sie im Panel C auf "Show / Hide Columns" klicken. Bei der Eingabe der ALIGN-Registerkarte wird eine mehrfache Sequenzausrichtung durchgeführt. Die erste Tafel der ALIGN-Registerkarte zeigt eine Zusammenfassung der Ausrichtung an, die Details über die Anzahl der Sequenzzeilen (entspricht der Anzahl der PDB-Strukturen) sowie die Anzahl der Positionen ( dh Ausrichtungsspalten) enthält. Dies schließt eine Spezifikation der Anzahl der Spalt- und Spalt-Spalten ein. Die Figur auf der rechten Seite der ersten Reihe liefert eine schematische Darstellung der Sequenzausrichtung. Hier thE graue Bereiche repräsentieren Nichtspaltpositionen, während weiße Flächen in der Ausrichtung Lücken entsprechen. Eine Darstellung der Sequenzkonservierung ist oberhalb der Ausrichtung mit roten Bereichen gezeigt, die gut konservierte Positionen anzeigen, und Weiß, das weniger konserviert zeigt. Beachten Sie, dass die Sequenzen in dieser Figur auf der Grundlage ihrer Ähnlichkeit, die durch das Clustering-Dendrogramm auf der linken Seite zur Verfügung gestellt wird, geordnet sind. Das zweite Panel dieser Registerkarte erleichtert das Clustering der ausgewählten PDBs auf der Grundlage ihrer paarweisen Sequenzähnlichkeit, die entweder als Dendrogramm oder als Wärmekarte visualisiert werden kann. Standardmäßig ist ein Dendrogramm (oder Baumdiagramm) dargestellt, das die Anordnung von Clustern darstellt. Die y-Achse des Dendrogramms repräsentiert den Abstand (in Bezug auf die Sequenzidentität) zwischen den Clustern. Die Strukturüberlagerung erfolgt automatisch beim Eingeben der Registerkarte FIT. Die überlagerten Strukturen, die interaktiv in Panel A, Indica angezeigt werdenTe die Anwesenheit eines relativ starren Kernbereichs (mit den Resten 1-29, 68-117 und 161-214), siehe "optionale Kern- und RMSD-Details" an der Unterseite der FIT-Registerkarte für Details). Zwei weitere variable Nukleotid-bindende Regionen (Reste 30-67 und 118-167) sind ebenfalls deutlich sichtbar ( Abbildung 2 ). RMSD-basierte Clustering-Gruppen diese Strukturen in zwei verschiedene Konformationen. Ein Klick auf die PCA- Registerkarte zeigt deutlich die Beziehung zwischen den Strukturen in Bezug auf die Verschiebungen dieser Regionen, die effektiv über die gebundenen Nukleotidspezies in verwandten Strukturen schließen ( Abbildung 2B und 2C ). Die Mehrheit der Strukturen befindet sich in der "geschlossenen" Form (blau in Abbildung 2C ) und ist mit einem gebundenen Liganden oder Inhibitor assoziiert. Im Gegensatz dazu sind "offene" Konformationen Nukleotid und Inhibitor frei. Das ist im Einklang mitDie umfangreiche Erforschung der Adk-Struktur und -Dynamik, die darauf hinweist, dass eine offene Konfiguration dieser Regionen für die Nukleotidbindung und eine geschlossene Konformation für eine effiziente Phosphoryl-Übertragung und Unterdrückung von schädlichen Hydrolyse-Ereignissen erforderlich ist. Es ist bemerkenswert, dass ein einzelner PC 97% der gesamten mittleren quadratischen Verschiebung in diesem Adk-Struktur-Set erfasst und eine klare und überzeugende Beschreibung des offenen, geschlossenen Übergangs zusammen mit den einzelnen Restbeiträgen zu dieser funktionalen Verschiebung bereitstellt (Panel C der App Und Fig. 2 ). Der Besuch der NMA-Registerkarte und die Erhöhung der Anzahl der für die Berechnung berücksichtigten Strukturen (über die Verringerung des Cutoffs zum Filtern ähnlicher Strukturen) zeigt an, dass offene Zustandsstrukturen im Vergleich zu den geschlossenen Formularstrukturen eine verbesserte lokale und globale Dynamik aufweisen ( Abbildung 2D und Panel C von App) . Vergleich von PCA- und NMA-Ergebnissen fürEinzelne Strukturen (Panel D) zeigt an, dass der erste Modus aller offenen Formularstrukturen eine relativ hohe Überlappung zu PC1 (mit einem Mittelwert von 0,37 ± 0,04) aufweist. Im Gegensatz dazu zeigen geschlossene Formstrukturen niedrigere Werte (mit einem Mittelwert von 0,30 ± 0,01). RMSIP-Werte für offene Formstrukturen (0,62 ± 0,003) sind ebenfalls höher als die der geschlossenen Strukturen (0,56 ± 0,008). Darüber hinaus zeigt die Überlappungsanalyse, dass die ersten Modi des offenen Zustands in guter Übereinstimmung mit der Konformationsänderung sind, die die Differenz der offenen und geschlossenen Zustände (Tafel E) beschreibt. Das auf RMSIP-Werte basierende Clustering zeigt wieder eine konsistente Partitionierung von offenen und geschlossenen Zustandsstrukturen (Panel F). Gemeinsam zeigen diese Ergebnisse die Existenz von zwei großen deutlichen Konformationszuständen für Adk. Diese unterscheiden sich durch eine kollektive niederfrequente Verschiebung von zwei Nukleotid-Bindungsstellenregionen, die unterschiedliche Flexibi aufweisenBei der Nukleotidbindung. Abbildung 1: Bio3D-Web-Übersicht mit Screenshots der PCA- und NMA-Tabs. Bio3D-web nimmt eine vom Benutzer bereitgestellte Proteinstruktur oder Sequenz als Eingabe in die SEARCH-Registerkarte ( 1 ) ein. Der Server stellt eine Liste der verwandten Strukturen zur Verfügung, die für eine weitere Analyse ausgewählt werden können. ( 2 ) Die Registerkarte ALIGN bietet die Sequenzausrichtung und die Analyse der in der SEARCH-Registerkarte ausgewählten Strukturen. ( 3 ) Auf der Registerkarte FIT werden alle Strukturen in 3D überlagert und visualisiert, zusammen mit den Ergebnissen der konventionellen paarweisen Strukturanalyse. ( 4 ) Die Hauptkomponentenanalyse des Struktursatzes wird auf der Registerkarte PCA durchgeführt, um Interkonformer-Beziehungen zu charakterisieren. ( 5 ) Die normale Modusanalyse auf jeder Struktur kann auf der Registerkarte eNMA durchgeführt werdenDynamische Trends für die vorhandenen strukturellen Zustände zu erforschen. Bitte klicken Sie hier, um eine größere Version dieser Figur zu sehen. Abbildung 2: Ergebnisse der Bio3D-Web-Analyse der Adenylatkinase. ( A ) Verfügbare PDB-Strukturen der Adenylatkinase, die dem identifizierten invarianten Kern überlagert sind. Strukturen werden nach RMSD-basiertem Clustering gefärbt, das auf der Registerkarte FIT bereitgestellt wird. ( B ) Die Visualisierung der Hauptkomponenten ist auf der Registerkarte PCA verfügbar, um die wichtigsten Konformationsvariationen im Datensatz zu charakterisieren. Hier ist die Trajektorie, die der ersten Hauptkomponente entspricht, in der Rohrdarstellung gezeigt, die die großräumige Schließbewegung des Proteins zeigt. ( C ) Strukturen sind prAuf ihre beiden ersten Hauptkomponenten in einem Konformerplot, der eine niederdimensionale Darstellung der Konformationsvariabilität zeigt, Jeder Punkt (oder jede Struktur) wird nach benutzerdefinierten Kriterien gefärbt, in diesem Fall werden PCA-basierte Clusterergebnisse erzielt. ( D ) Die Normalmodusanalyse auf der Registerkarte eNMA schlägt eine verbesserte lokale und globale Dynamik für Strukturen im offenen Zustand (rot) im Vergleich zu den geschlossenen Formularen (blauen) Strukturen vor. Bitte klicken Sie hier, um eine größere Version dieser Figur zu sehen.

Discussion

Bio3D-web kann verwendet werden, um die strukturellen, dynamischen und funktionellen Zustände von Proteinen interaktiv aus den verfügbaren kristallographischen Strukturen zu untersuchen und abzubilden. Darüber hinaus können die NMA- und PCA-basierten Clustering-Ergebnisse zusammen mit den Annotationen und der sequenzbasierten Analyse besonders nützlich sein, um repräsentative Strukturen für eine zeitaufwändige Analyse, wie z. B. Ensemble-Kleinmolekül-Docking- oder Molekulardynamik-Simulationen, auszuwählen. Bio3D-web erleichtert damit die fortgeschrittene strukturelle Bioinformatik-Analyse für ein breiteres Spektrum von Forschern durch die Verringerung des erforderlichen Fachwissens. Das aktuelle Design von Bio3D-Web unterstreicht die Einfachheit über die umfassende Einbeziehung der vielen Analysemethoden, die im gesamten Standalone-Bio3D-Paket zur Verfügung stehen. In vielen Fällen ist es vorgesehen, dass die Forscher Bio3D-Web nutzen, um allgemeine Trends in ihrer Proteinfamilie oder Superfamilie von Interesse zu verstehen, die dann mehr spezialisierte Analysen informieren können. Bio3D-web ist dasUm die biomolekularen Strukturdatensätze schnell zu erforschen und als hypothesenerzeugendes Werkzeug zu fungieren. Wir ermutigen die Benutzer, ihre Daten weiter zu erforschen, indem sie den Bio3D-Code in dem reproduzierbaren Bericht bereitstellen, der auch alle Abfragedetails und Analyseergebnisse speichert.

In dem oben genannten repräsentativen Beispielprotokoll zeigen wir die Fähigkeit von Bio3D-web, die strukturellen Merkmale der funktionalen Konformationsübergänge von Adk aufzudecken. Zusätzliche Anwendungen von Bio3D-web beinhalten die Struktur- und Dynamikanalyse von vom Benutzer hochgeladenen PDB-Strukturen. Zum Beispiel kann der Benutzer neue Strukturen oder sogar Proteinsequenzen zur Analyse hochladen. Die zuvor erwähnten Analyseschritte, insbesondere der eNMA-Schritt, können sowohl lokale als auch globale Trends in Proteinbewegungen offenbaren, wobei kollektive Bewegungen von funktioneller Bedeutung sind. Der Vergleich mit Apo-Strukturen kann auch Merkmale von ungebundenen, gebundenen Konformationsübergängen zeigen. Weitere Anwendungsbeispiele fürEine Reihe von verschiedenen Proteinfamilien werden online zur Verfügung gestellt.

Obwohl alle Proteine ​​flexible und dynamische Einheiten sind, haben nicht alle Proteine ​​atomare Auflösungsstrukturen, die in verschiedenen Zuständen verfügbar sind ( zB aktive und inaktive Zustände). Unsere Sicht auf den Proteinstrukturraum ist somit begrenzt und daher ist die Einsicht aus Werkzeugen wie Bio3D-Web notwendigerweise auch für bestimmte Proteine ​​begrenzt. Doch mit aktuellen technologischen Fortschritten und neuen Initiativen für die Strukturgenomik wird das hier vorgestellte Protokoll zunehmend zu einem wichtigen Weg, um Einblicke in wichtige Struktur-Funktions-Beziehungen zu gewinnen. Ein kritischer Schritt, der bei der Analyse von weiter entfernten Proteinen besonders wichtig ist, ist das mögliche Auftauchen von Ausrichtungsfehlern auf der Registerkarte ALIGN. Ausrichtungsfehler treten unvermeidlich auf, wenn die Sequenzähnlichkeit unter 30% sinkt und der Benutzer in solchen Fällen die Sequenzausrichtung überprüfen und korrigieren mussAuf der Registerkarte ALIGN. Ausrichtungsfehler führen möglicherweise zu falschen überlagerten Strukturen in der FIT-Registerkarte und maskieren die relevantesten Konformationsvariationen für den nachfolgenden PCA. Darüber hinaus sollte der Anwender sich über fehlende Reste in den ausgewählten PDB-Strukturen bewusst sein, wie bei der aktuellen Implementierung PCA kann nur an Proteinresten durchgeführt werden, bei denen alle Strukturen ihr entsprechendes Kohlenstoff-Alpha-Atom aufgelöst haben. Wenn folglich ein ausgewählter PDB ungelöste Reste für eine bestimmte Region des Proteins aufweist, wird diese Region von PCA weggelassen.

Bio3D-Web ist derzeit auf die Analyse von Single-Chain-PDB-Strukturen beschränkt. Folglich können Funktionsbewegungen, die auf der quaternären Ebene auftreten, nicht mit dem aktuellen Protokoll erforscht werden. Obwohl wir derzeit neue Algorithmen entwickeln, um solche Analysen in Bio3D-Web einzubeziehen, ist die einzige aktuelle Option durch konventionelle Bio3D-Nutzung.

Bio3D-Web ist die einzige Online-BewerbungIon, das es ermöglicht, Struktursets abzufragen und zu identifizieren, ihre Sequenzmuster und strukturelle Variabilität zu interpretieren und mechanistische Informationen sowohl von der Analyse als auch von der Vorhersage ihrer strukturellen Plastizität zu extrahieren. Eine breite Palette an molekularen Visualisierungswerkzeugen und Online-Servern ermöglicht es Forschern, einzelne biomolekulare Strukturen zu erforschen und zu analysieren. Allerdings erfordern die vorhandenen Werkzeuge für die Analyse der Sequenz, Struktur und Dynamik großer heterogener Proteinfamilien oftmals umfangreiche Rechenkenntnisse und sind in der Regel nur für Benutzer mit relevanten Programmierkenntnissen zugänglich. Zum Beispiel benötigt das Bio3D-Paket R 8 , ProDy benötigt Python und Maven erfordert Matlab-Kenntnisse 9 , 10 . Bio3D-Web im Gegensatz dazu erfordert keine Programmierkenntnisse und erhöht so die Zugänglichkeit und verringert die Eintrittsbarriere zur Durchführung fortgeschrittener Vergleichsfolge, Struktur und dyNamics analyse Darüber hinaus ist die Vorbereitung, Kuration, Annotation und Aufräumung von molekularen Strukturen, die häufig für eine effiziente Analyse notwendig ist, im Bio3D-Web Service enthalten. Darüber hinaus wird die Einschränkung für die Durchführung einer solchen Analyse auf fähige Berechnungsressourcen durch unsere Serverinstanz gemildert, die eine umfangreiche Analyse vieler Strukturen ermöglicht, die von jedem modernen Webbrowser initiiert und gesteuert werden können.

Die offene Entwicklung von Bio3D-Web ist im Gange (siehe https://bitbucket.org/Grantlab/bio3d). Wir setzen fort, neue Analysefunktionalität hinzuzufügen und bestehende Methoden zu verbessern. Die zukünftige Entwicklung konzentriert sich auf die Hinzufügung von Distanzmatrix-basierten PCA- und Torsions-PCA, umfangreichere Sequenz-Konservierungsansätze, die eine phylogenetische Komponente, Ensemble-Bindungsstellenidentifizierung und neue Ansätze für eine dynamische Netzwerkanalyse über Proteinfamilien beinhalten. In dieser Hinsicht repräsentiert die aktuelle Webanwendung den AnfangszeigerT für viele andere kollaborative strukturelle bioinformatische Analysen-Workflows, indem es reproduzierbare und zugängliche Schritte auf benutzerdefinierte experimentelle Struktur-Sets ermöglicht. Wir planen auch zukünftige Unterstützung von rekonstruierten biologischen Einheitskoordinatensätzen zusätzlich zu Einzel- und Mehrfachketten aus der asymmetrischen Einheit der PDB-Strukturen. Zusätzliche Features beinhalten das verbesserte Speichern und Laden von kollaborativen Arbeitsräumen zusammen mit einer Undo-Möglichkeit.

Bio3D-web ist eine Online-Anwendung für die interaktive Analyse von biomolekularen Strukturdaten. Bio3D-Web läuft auf jedem modernen Webbrowser und bietet Funktionalität für: (1) Die Identifizierung der verwandten Proteinstruktur setzt auf benutzerdefinierte Schwellenwerte der Ähnlichkeit; (2) Ihre mehrfache Ausrichtung und Strukturüberlagerung; (3) Sequenz- und Strukturerhaltungsanalyse; (4) Inter-Conformer-Relationship-Mapping mit Hauptkomponentenanalyse und (5) Vergleich der vorhergesagten internen Dynamik über Ensemble nochMal Modusanalyse Diese integrierte Funktionalität bietet einen kompletten Workflow für die Untersuchung von sequenzstruktur-dynamischen Beziehungen innerhalb von Proteinfamilien und Superfamilien. Zusätzlich zu einer bequemen, einfach zu bedienenden dynamischen Schnittstelle zur Erforschung der Effekte von Parameter- und Methodenwahlen zeichnet Bio3D-web auch die vollständigen Benutzereingaben und die nachfolgenden grafischen Ergebnisse einer Benutzersitzung auf. Dies ermöglicht es Benutzern, die Reihenfolge der Analyseschritte, die ihre Ergebnisse erstellt haben, einfach zu teilen und zu reproduzieren. Bio3D-Web ist vollständig in der R-Sprache implementiert und basiert auf den Paketen Bio3D und Shiny R. Es kann von unserem Online-Server ausgeführt werden oder lokal auf jedem Computer mit R installiert werden. Dies schließt lokale Server-Installation, um eine benutzerdefinierte Multi-User-Instanz mit Zugriff auf prioritäre strukturelle Datensätze wie die in der pharmazeutischen Industrie. Voller Quellcode und umfangreiche Dokumentation finden Sie unter einer GPL-3 Open-Source-Lizenz von: http://thegrantlab.org/ Bio3d / webapps

Açıklamalar

The authors have nothing to disclose.

Acknowledgements

Wir danken Dr. Guido Scarabelli und Hongyang Li für umfangreiche Tests während der gesamten Entwicklung sowie die Bio3D User Community und die University of Bergen strukturellen Bioinformatik Workshop Teilnehmer für Feedback und Kommentare, die diese Anwendung verbessert haben.

Materials

Bio3D-web
Web-site http://thegrantlab.org/bio3d-web/
Requirements Web browser

Referanslar

  1. Kornev, A. P., Taylor, S. S. Dynamics-Driven Allostery in Protein Kinases. Trends Biochem. Sci. 40 (11), 628-647 (2015).
  2. Yao, X. -. Q., Grant, B. J. Domain-opening and dynamic coupling in the α-subunit of heterotrimeric G proteins. Biophys. J. 105 (2), L08-L10 (2013).
  3. Henzler-Wildman, K. A., et al. Intrinsic motions along an enzymatic reaction trajectory. Nature. 450 (7171), 838-844 (2007).
  4. Boehr, D., Nussinov, R., Wright, P. The role of dynamic conformational ensembles in biomolecular recognition. Nat. Chem. Biol. 5 (11), 789-796 (2009).
  5. Teilum, K., Olsen, J. G., Kragelund, B. B. Functional aspects of protein flexibility. Cell Mol Life Sci. 66 (14), 2231-2247 (2009).
  6. Henzler-Wildman, K., Kern, D. Dynamic personalities of proteins. Nature. 450 (7172), 964-972 (2007).
  7. Grant, B. J., Gorfe, A. A., McCammon, J. A. Large conformational changes in proteins: signaling and other functions. Curr. Opin. Struct. Biol. 20 (2), 142-147 (2010).
  8. Grant, B. J., Rodrigues, A. P. C., ElSawy, K. M., McCammon, J. A., Caves, L. S. D. Bio3d: an R package for the comparative analysis of protein structures. Biyoinformatik. 22 (21), 2695-2696 (2006).
  9. Bakan, A., Meireles, L. M., Bahar, I. ProDy: protein dynamics inferred from theory and experiments. Biyoinformatik. 27 (11), 1575-1577 (2011).
  10. Zimmermann, M. T., Kloczkowski, A., Jernigan, R. L. MAVENs: motion analysis and visualization of elastic networks and structural ensembles. BMC Bioinformatics. 12 (1), 264 (2011).
  11. Yang, L. -. W., et al. oGNM: online computation of structural dynamics using the Gaussian Network Model. Nucleic Acids Res. 34, 24-31 (2006).
  12. Suhre, K., Sanejouand, Y. -. H. ElNemo: a normal mode web server for protein movement analysis and the generation of templates for molecular replacement. Nucleic Acids Res. 32, W610-W614 (2004).
  13. Tiwari, S. P., et al. WEBnm@ v2.0: Web server and services for comparing protein flexibility. BMC Bioinformatics. 15 (1), 427 (2014).
  14. Hrabe, T., et al. PDBFlex: exploring flexibility in protein structures. Nucleic Acids Res. 44, D423-D428 (2016).
  15. Skjærven, L., Jariwala, S., Yao, X. -. Q., Grant, B. J. Online interactive analysis of protein structure ensembles with Bio3D-web. Biyoinformatik. , (2016).
  16. Skjærven, L., Yao, X., Scarabelli, G., Grant, B. J. Integrating protein structural dynamics and evolutionary analysis with Bio3D. BMC Bioinformatics. 15 (399), 1-11 (2014).
  17. Eddy, S. R. Accelerated Profile HMM Searches. PLoS Comput. Biol. 7 (10), (2011).
  18. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  19. Berman, H. M. The Protein Data Bank. Nucleic Acids Res. 28 (1), 235-242 (2000).
  20. Finn, R. D., et al. Pfam: the protein families database. Nucleic Acids Res. 42, D222-D230 (2014).
  21. Kerns, S. J., et al. The energy landscape of adenylate kinase during catalysis. Nat. Struct. Mol. Biol. 22 (2), 124-131 (2015).

Play Video

Bu Makaleden Alıntı Yapın
Jariwala, S., Skjærven, L., Yao, X., Grant, B. J. Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web. J. Vis. Exp. (125), e55640, doi:10.3791/55640 (2017).

View Video