Un metodo straight-forward e robusto per identificare potenziali motivi di regolamentazione geni co-regolati è presentato. SCOPE non richiede alcun parametro utente e motivi ritorni che rappresentano ottimi candidati per i segnali regolamentari. L'identificazione di tali segnali regolatori aiuta a comprendere la biologia di base.
SCOPE è un mirino motivo ensemble che utilizza tre algoritmi di componenti in parallelo per identificare i potenziali motivi di regolamentazione da parte sovra-rappresentazione e la posizione preferenza motivo 1. Ogni componente algoritmo è ottimizzato per trovare un diverso tipo di motivo. Prendendo il meglio di questi tre approcci, ambito di applicazione si comporta meglio di qualsiasi algoritmo unico, anche in presenza di dati rumorosi 1. In questo articolo, utilizziamo una versione web di SCOPE 2 per esaminare i geni che sono coinvolti nella conservazione dei telomeri. SCOPE è stata incorporata in almeno due altro motivo trovare programmi 3,4 ed è stato utilizzato in altri studi 5-8.
I tre algoritmi che compongono SCOPE BEAM sono 9, che trova non degeneri motivi (ACCGGT), PRISM 10, che trova degenerare motivi (ASCGWT), e DISTANZIALE 11, che trova motivi più bipartito (ACCnnnnnnnnGGT). Questi tre algoritmi sono stati ottimizzati per trovare la loro corrispondente tipo di motivo. Insieme, essi permettono SCOPE per svolgere molto bene.
Una volta che un set di geni è stata analizzata e motivi candidato individuato, CAMPO DI APPLICAZIONE possono cercare altri geni che contengono il motivo che, se aggiunto al set originale, migliorerà il punteggio motivo. Questo può avvenire attraverso sovra-rappresentazione o la posizione preferenza motivo. Lavorare con i set di geni parziali che sono biologicamente verificato siti di legame fattore di trascrizione, ambito di applicazione è stata in grado di identificare la maggior parte del resto dei geni regolati anche dal fattore di trascrizione dato.
Uscita dal campo di applicazione mostra motivi candidato, il loro significato, e altre informazioni, sia come una tabella e una mappa come motivo grafico. Domande e tutorial video sono disponibili sul sito web SCOPE che comprende anche un "Cerca di esempio" pulsante che permette all'utente di effettuare un giro di prova.
Ambito di applicazione è un'interfaccia utente molto amichevole che consente agli utenti inesperti di accedere piena potenza dell'algoritmo senza dover diventare un esperto in bioinformatica di trovare motivo. Come input, ambito di applicazione può richiedere un elenco di geni o le sequenze FASTA. Questi possono essere inseriti in campi di testo del browser, o leggere da un file. L'uscita dal campo di applicazione contiene un elenco di tutti i motivi identificati con i loro punteggi, il numero di occorrenze, frazione di geni contenenti il motivo, e l'algoritmo utilizzato per identificare il motivo. Per ogni motivo, i dettagli risultato comprende una rappresentazione consenso del motivo, un logo sequenza, una matrice di peso posizione, e un elenco di istanze per ogni occorrenza motivo (con posizioni esatte e "filone" indicato). I risultati sono restituiti in una finestra del browser e anche opzionalmente via email. Precedenti lavori descrivere gli algoritmi in dettaglio 1,2,9-11 SCOPE.
SCOPE offre al ricercatore un potente strumento da utilizzare per l'identificazione di potenziali motivi regolamentari in set di geni regolati coordinatamente. L'utente non è tenuto a indovinare le dimensioni del motivo o il numero di occorrenze del motivo ben altro motivo trovare siti richiedono. Questi parametri sono sostanzialmente inconoscibile fino a quando il motivo è identificato. L'interfaccia è molto semplice, sia per l'inserimento di sequenze di geni o di nomi e per vedere l'uscita.
Uscita SCOPE fornisce informazioni dettagliate su tutti i motivi che sono identificate, utilizzando tre diversi modi di rappresentazione motivo. Ogni istanza del motivo in tutti i geni è presente con la posizione e le informazioni "filone". Risultati grafici sotto forma di mappe motivo a fornire una rappresentazione visiva che è facile da capire e fornisce un modo intuitivo per vedere i modelli nei motivi che sono presenti.
SCOPE è molto robusto per la presenza di rumore nei dati. In genere, questa assume la forma di geni in più essere presente nel set di partenza che non potrebbe in realtà essere co-regolati con il resto dei geni. Questo accade spesso quando si inizia con i geni che sono co-espressi in esperimenti di microarray. A volte l'esperimento è rumoroso, o ci possono essere numerosi fattori di trascrizione attivati nelle condizioni sperimentali utilizzati per l'esperimento microarray. Questi diversi fattori di trascrizione dovrà probabilmente diversi siti bersaglio sul DNA. Anche in presenza di geni estranei di 4 volte (rumore: rapporto segnale è 4:1), SCOPE è conserva ancora il 50% della sua accuratezza nel predire siti 1.
Sebbene ambito contiene oltre 2 milioni di sinonimi per i nomi dei geni, non riesce a volte a identificare alcuni nomi di geni. Stiamo aggiornando costantemente le nostre liste sinonimo, ma a volte trovare sinonimi che si riferiscono a diversi dello stesso gene. In questi casi, non includono i sinonimi causa dell'ambiguità. se hai un nome del gene che non si trova da portata, si consiglia di consultare il sito specifico del genoma per trovare un nome alternativo da utilizzare in gene SCOPE. Esempi di nomi gene appropriate per ogni specie sono forniti da SCOPE.
Ambito contiene attualmente 72 specie con nuove specie che viene aggiunto per tutto il tempo. Il sito web contiene video di aiutare così come FAQ. Il codice sorgente è liberamente disponibile per gli utenti accademica scrivendo a RHG.
The authors have nothing to disclose.
Questa ricerca è stata sostenuta da una sovvenzione per RHG dalla National Science Foundation, DBI-0445967.