Um método simples e direta e robusta para identificar potenciais motivos regulamentares em co-regulados genes é apresentado. SCOPE não requer quaisquer parâmetros de usuário e retorna motivos que representam excelentes candidatos para sinais de regulamentação. A identificação de tais sinais regulamentares ajuda a compreender a biologia subjacente.
SCOPE é um finder motivo ensemble que utiliza três algoritmos de componentes em paralelo para identificar potenciais motivos de regulamentação por sobre-representação e de preferência motivo a posição 1. Cada componente é otimizado algoritmo para encontrar um tipo diferente de motivo. Ao tomar o melhor destes três abordagens, SCOPE desempenho melhor do que qualquer algoritmo único, mesmo na presença de dados ruidosos 1. Neste artigo, vamos utilizar uma versão web do SCOPE 2 a examinar genes que estão envolvidos na manutenção dos telômeros. SCOPE foi incorporado pelo menos dois outro motivo encontrar programas 3,4 e tem sido usada em outros estudos 5-8.
Os três algoritmos que compõem SCOPE são BEAM 9, que não encontra motivos degenerada (ACCGGT), PRISM 10, que encontra motivos degenerada (ASCGWT), e SPACER 11, que encontra motivos mais bipartido (ACCnnnnnnnnGGT). Estes três algoritmos foram otimizados para encontrar o seu tipo correspondente do motivo. Juntos, eles permitem SCOPE para executar muito bem.
Uma vez que um conjunto de genes tem sido analisado e motivos candidato identificado, SCOPE pode olhar para outros genes que contêm o motivo que, quando adicionado ao conjunto original, irá melhorar a pontuação motivo. Isso pode ocorrer através de uma sobre-representação ou de preferência de posicionamento motivo. Trabalhando com conjuntos de gene parcial que biologicamente verificada sites de fator de transcrição de ligação, SCOPE foi capaz de identificar a maioria do resto dos genes também regulado pelo fator de transcrição dado.
Saída do SCOPE mostra motivos candidato, o seu significado, e outras informações tanto como uma mesa e como um mapa motivo gráfica. FAQs e tutoriais em vídeo estão disponíveis no site da SCOPE que também inclui um "Sample Search" botão que permite ao usuário realizar um ensaio.
Âmbito tem uma interface muito amigável que permite que usuários novatos para acessar potência total do algoritmo sem ter que se tornar um especialista no tema da bioinformática achado. Como entrada, SCOPE pode levar uma lista de genes ou seqüências FASTA. Estes podem ser inseridos em campos de texto browser, ou ler de um arquivo. A saída do SCOPE contém uma lista de todos os motivos identificados com sua pontuação, número de ocorrências, a fração de genes contendo o motivo, eo algoritmo usado para identificar o motivo. Para cada tema, os detalhes resultado inclui uma representação de consenso do motivo, um logotipo seqüência, a matriz de pesos posição, e uma lista de instâncias para cada ocorrência motif (com posições exatas e "vertente" indicado). Resultados são retornados em uma janela do navegador e também opcionalmente por e-mail. Trabalhos anteriores descrevem os algoritmos SCOPE em detalhe 1,2,9-11.
ÂMBITO fornece ao pesquisador uma poderosa ferramenta a ser usada para a identificação de potenciais motivos regulamentares em conjuntos de genes coordenadamente regulado. O usuário não é obrigado a adivinhar o tamanho do motivo ou o número de ocorrências do motivo como motivo encontrar muitos outros sites exigem. Estes parâmetros são basicamente desconhecido até que o motivo é identificado. A interface é muito simples, tanto para entrar ou seqüências de gene nomes, e para ver a saída.
ÂMBITO saída fornece informações detalhadas sobre todos os temas que são identificados, usando três diferentes formas de representação motivo. Cada instância do motivo em todos os genes é listado com a posição e "fio" de informação. Resultados gráficos na forma de mapas motivo fornecer uma exibição visual que é fácil de compreender e fornece uma maneira intuitiva de ver padrões nos motivos que estão presentes.
SCOPE é muito robusto para a presença de ruído nos dados. Normalmente, este assume a forma de genes extras estar presente no conjunto de partida que não pode realmente ser co-regulado com o resto dos genes. Isto acontece muitas vezes quando se inicia com os genes que são co-expressas em experimentos de microarray. Às vezes, a experiência é barulhento, ou pode haver vários fatores de transcrição ativados em condições experimentais utilizadas para o experimento de microarray. Estes fatores de transcrição diferentes, provavelmente têm sites diferentes do alvo no DNA. Mesmo na presença de 4 vezes genes estranhos (ruído: relação sinal é 4:1), o escopo é ainda mantém 50% de sua precisão em predizer locais 1.
Embora SCOPE contém mais de 2 milhões sinônimos para nomes de gene, que às vezes não consegue identificar alguns nomes de genes. Nós estamos constantemente atualizando nossas listas de sinônimo, mas às vezes acham que sinônimos diferentes referem-se ao mesmo gene. Nesses casos, nós não incluímos os sinônimos por causa da ambigüidade. se você tiver um nome de gene que não é encontrado por escopo, é recomendado que você consulte o site do genoma específica para encontrar um nome de gene alternativa para uso em SCOPE. Exemplos de nomes de gene apropriado para cada espécie são fornecidas pelo SCOPE.
SCOPE atualmente contém 72 espécies com espécies novas que estão sendo adicionados o tempo todo. O site contém vídeo ajuda, assim como FAQs. Código-fonte está disponível gratuitamente para usuários acadêmicos, escrevendo para RHG.
The authors have nothing to disclose.
Esta pesquisa foi suportada por uma concessão para RHG da National Science Foundation, DBI-0445967.