Eine geradlinige und robuste Methode, um potenzielle regulatorische Motive in Zusammenarbeit regulierten Gene zu identifizieren wird vorgestellt. SCOPE erfordert keine User-Parameter und liefert Motive, die ausgezeichnete Kandidaten stellen für regulatorische Signale. Die Identifikation solcher Regulationssignale hilft, die zugrunde liegenden Biologie zu verstehen.
SCOPE ist ein Ensemble Motiv finder, dass Drei-Komponenten-Algorithmen verwendet, die parallel zu potenzieller regulatorischer Motive von Überrepräsentation und Motiv Position bevorzugt 1 zu identifizieren. Jede Komponente Algorithmus ist optimiert, um eine andere Art von Motiv zu finden. Indem man die besten dieser drei Ansätze, führt SCOPE besser als jede einzigen Algorithmus, auch in Gegenwart von verrauschten Daten 1. In diesem Artikel nutzen wir eine Web-Version von SCOPE 2, um Gene, die in Telomererhaltung mitwirken. SCOPE hat sich in mindestens zwei anderen Motiv Auffinden von Programmen 3,4 aufgenommen und hat in anderen Studien 5-8 verwendet worden.
Die drei Algorithmen, die SCOPE enthalten, sind BEAM 9, die nicht entartet Motive (ACCGGT) findet, PRISM 10, die entartete Motive (ASCGWT) findet, und Abstandshalter 11, die länger bipartite Motive (ACCnnnnnnnnGGT) findet. Diese drei Algorithmen wurden optimiert, um die entsprechenden Art von Motiv zu finden. Zusammen ermöglichen sie SCOPE extrem gute Leistung.
Sobald ein Gen gesetzt analysiert wurde und Kandidaten Motive identifiziert haben, können SCOPE für andere Gene, die das Motiv, das, wenn sie auf den ursprünglichen Satz hinzugefügt, das Motiv Score zu verbessern enthalten aussehen. Dies kann durch übermäßige Präsenz oder Motiv Positionsgebote auftreten. Arbeiten mit partiellen Gen-Sets, die biologisch Transkriptionsfaktorbindungsstellen überprüft haben, war SCOPE in der Lage, die meisten der Rest der Gene auch durch die gegebene Transkriptionsfaktor reguliert werden.
Die Ausgabe von SCOPE stellt Kandidaten Motive, ihre Bedeutung, und andere Informationen sowohl als Tisch als auch als grafische Motiv Karte. FAQs und Video-Tutorials sind bei der SCOPE-Website, die auch ein "Sample Search"-Taste, die dem Benutzer einen Probelauf durchführen können zur Verfügung.
Scope hat eine sehr benutzerfreundliche Oberfläche, die unerfahrene Anwender ermöglicht, den Algorithmus die volle Leistung, ohne dass ein Experte in der Bioinformatik von Motiv zu finden geworden zugreifen. Als Eingang kann SCOPE, eine Liste von Genen, oder FASTA-Sequenzen. Diese können im Browser Textfelder eingegeben werden, oder aus einer Datei gelesen. Die Ausgabe von SCOPE enthält eine Liste aller identifizierten Motive mit ihren Noten, Anzahl der Vorkommen, Anteil von Genen, die das Motiv, und der Algorithmus verwendet, um das Motiv zu erkennen. Für jedes Motiv, sind Ergebnis eines Konsenses Darstellung des Motivs, eine Sequenz-Logo, eine Position, Gewicht Matrix, und eine Liste der Instanzen für jedes Motiv Auftreten (mit genauen Positionen und "Strang" bezeichnet). Die Ergebnisse werden in einem Browser-Fenster und wahlweise auch per E-Mail zurück. Vorherige Arbeiten beschreiben die SCOPE-Algorithmen im Detail 1,2,9-11.
SCOPE stellt der Forscher mit einem leistungsfähigen Werkzeug für die Identifizierung von möglichen regulatorischen Motive in Mengen von koordinativ regulierten Gene zu verwenden. Der Anwender ist nicht erforderlich, um die Größe des Motivs oder die Anzahl der Vorkommen des Motivs wie viele andere Motive finden Sites erfordern erraten. Diese Parameter sind grundsätzlich unerkennbar, bis das Motiv erkannt wird. Das Interface ist sehr einfach sowohl für die Eingabe-Sequenzen oder Gen-Namen und für die Anzeige der Ausgabe.
SCOPE-Ausgang liefert detaillierte Informationen über alle Motive, die identifiziert werden, mit drei verschiedenen Arten von Motiv-Darstellung. Jede Instanz des Motivs in alle Gene mit Position und "Strang" aufgeführten Informationen. Grafische Ergebnisdarstellung in Form von Motiv-Karten bieten eine optische Anzeige, die einfach zu verstehen ist, und bietet eine intuitive Art und Weise, um Muster in den Motiven, die vorhanden sind zu sehen.
SCOPE ist sehr robust, um die Anwesenheit von Rauschen in den Daten. Typischerweise geschieht dies in Form von zusätzlichen Gene in der Startaufstellung, die nicht vielleicht tatsächlich mit dem Rest der Gene co-reguliert werden. Dies geschieht häufig, wenn beginnend mit Genen, die in Microarray-Experimenten co-exprimiert. Manchmal ist das Experiment ist laut, oder es können verschiedene Transkriptionsfaktoren in den experimentellen Bedingungen für die Microarray-Experiment verwendeten aktiviert werden. Diese verschiedenen Transkriptionsfaktoren wird wahrscheinlich je nach Zielort auf der DNA. Selbst in Gegenwart von 4-fach-fremde Gene (Lärm: Signal-Verhältnis ist 4:1), ist SCOPE noch hält 50% der Genauigkeit in der Vorhersage Seiten 1.
Obwohl SCOPE enthält über 2 Millionen Synonyme für Gen-Namen, es geht manchmal nicht, um einige Gene Namen zu identifizieren. Wir aktualisieren ständig unsere Synonym-Listen, aber manchmal feststellen, dass verschiedene Synonyme für das gleiche Gen verweisen. In diesen Fällen haben wir nicht die Synonyme wegen der Mehrdeutigkeit. Wenn Sie ein Gen Namen, die nicht von SCOPE gefunden haben, ist es empfehlenswert, dass Sie das Genom spezifischen Ort beziehen sich auf eine alternative Gen Namen in SCOPE Verwendung finden. Beispiele für entsprechende Gen-Namen für jede Art von SCOPE zur Verfügung gestellt.
SCOPE umfasst derzeit 72 Arten mit neuen Arten die ganze Zeit aufgenommen. Die Website enthält Video sowie FAQs helfen. Der Quellcode ist frei verfügbar für akademische Nutzer, indem er an RHG.
The authors have nothing to disclose.
Diese Arbeit wurde durch ein Stipendium der National Science Foundation, DBI-0445967 RHG unterstützt.