Un método sencillo y robusto para identificar los posibles motivos de reglamentación en la co-genes regulados se presenta. Ámbito de aplicación no requiere ningún parámetro de usuario y vuelve motivos que representan excelentes candidatos para las señales de regulación. La identificación de tales señales reguladoras ayuda a entender la biología subyacente.
SCOPE es un buscador de motivos conjunto que utiliza tres algoritmos de componentes en paralelo para identificar los posibles motivos de reglamentación por la sobre-representación y la preferencia motivo de la posición 1. Cada algoritmo componente se ha optimizado para encontrar otro tipo de motivo. Al tomar lo mejor de estos tres enfoques, alcance un mejor rendimiento que cualquier algoritmo único, incluso en la presencia de datos ruidosos 1. En este artículo, utilizamos una versión web de SCOPE 2 a examinar los genes que están involucrados en el mantenimiento de los telómeros. ALCANCE se ha incorporado en al menos dos motivos para encontrar otros programas de 3,4 y se ha utilizado en otros estudios 5-8.
Los tres algoritmos que conforman alcance son HAZ 9, que se encuentra no degenerados motivos (ACCGGT), PRISM 10, que se encuentra degenerada motivos (ASCGWT) y el espaciador 11, que se encuentra más motivos bipartito (ACCnnnnnnnnGGT). Estos tres algoritmos se han optimizado para encontrar su correspondiente tipo de motivo. En conjunto, permiten llevar a cabo ALCANCE muy bien.
Una vez que un conjunto de genes se ha analizado e identificado los motivos candidato, ámbito de aplicación puede buscar otros genes que contienen el motivo de que, cuando se añade a la serie original, será motivo de mejorar la puntuación. Esto puede ocurrir por sobre-representación o la preferencia de posición motivo. Trabajar con conjuntos de genes parciales que se han verificado biológicamente factor de transcripción sitios de unión, ámbito de aplicación es capaz de identificar la mayor parte del resto de los genes también está regulada por el factor de transcripción dada.
La producción de ALCANCE muestra motivos candidato, su significado, y otra información tanto en forma de tabla y como un mapa motivo gráfico. Preguntas frecuentes y tutoriales en vídeo están disponibles en el sitio web de alcance que también incluye un "ejemplo de búsqueda" botón que permite al usuario realizar una prueba.
Ámbito de aplicación tiene una interfaz de usuario muy amigable que permite a los usuarios novatos a acceder a la energía total del algoritmo sin tener que convertirse en un experto en el tema de bioinformática de la búsqueda. Como entrada, SCOPE puede tomar una lista de genes o secuencias FASTA. Estos se pueden introducir en los campos de texto del navegador, o leer de un archivo. La salida del ámbito contiene una lista de todos los motivos identificados con sus resultados, el número de ocurrencias, fracción de los genes que contiene el motivo, y el algoritmo utilizado para identificar el motivo. Para cada tema, detalles de los resultados incluyen una representación de consenso del motivo, una secuencia logo, una matriz de la posición de peso, y una lista de casos por cada ocurrencia motivo (con posiciones exactas y "cadena", indicó). Los resultados se devuelven en una ventana del navegador y, opcionalmente, también por correo electrónico. Trabajos anteriores describen los algoritmos de SCOPE en detalle 1,2,9-11.
ALCANCE proporciona al investigador una herramienta poderosa para usar para la identificación de los posibles motivos de reglamentación en conjuntos de genes regulados coordinadamente. El usuario no está obligado a adivinar el tamaño del motivo o el número de ocurrencias del motivo como motivo la búsqueda de muchos otros sitios requieren. Estos parámetros son básicamente desconocido hasta que el motivo se identifica. La interfaz es muy sencilla, tanto para entrar en las secuencias de genes o los nombres y para ver la salida.
ALCANCE salida proporciona información detallada sobre todos los motivos que se identifican, utilizando tres diferentes formas de representación motivo. Cada instancia del motivo en todos los genes está en la lista con información de posición y "cadena". Los resultados gráficos en forma de mapas motivo de ofrecer una pantalla de visualización que es fácil de entender y proporciona una manera intuitiva de ver patrones en los motivos que están presentes.
SCOPE es muy robusto a la presencia de ruido en los datos. Normalmente, esto toma la forma de genes extra que está presente en el conjunto de partida que en realidad no puede ser co-regulado con el resto de los genes. Esto sucede a menudo cuando se comienza con los genes que son co-expresados en los experimentos de microarrays. A veces, el experimento es ruidoso, o puede haber varios factores de transcripción activados en las condiciones experimentales utilizadas para el experimento de microarrays. Estos diferentes factores de transcripción es probable que hayan diferentes lugares de destino en el ADN. Incluso en la presencia de cuatro veces los genes extraños (ruido: relación señal es 4:1), el alcance es todavía mantiene el 50% de su exactitud en la predicción de los sitios 1.
Aunque ámbito contiene más de 2 millones de sinónimos de nombres de genes, a veces no logra identificar algunos nombres de genes. Estamos constantemente actualizando nuestras listas de sinónimos, pero a veces encontramos que los sinónimos se refieren a diferentes del mismo gen. En esos casos, no incluyen los sinónimos debido a la ambigüedad. si usted tiene un nombre de genes que no se encuentra en alcance, es recomendable que consulte el sitio específico del genoma para encontrar el nombre de un gen alternativo para el uso en su alcance. Algunos ejemplos de nombres de genes apropiados para cada especie se proporcionan por el ámbito.
ALCANCE actualmente contiene 72 especies con nuevas especies que se añade todo el tiempo. El sitio web contiene video de ayuda, así como preguntas frecuentes. El código fuente está disponible gratuitamente para los usuarios académicos por escrito a GD.
The authors have nothing to disclose.
Esta investigación fue financiada por una subvención a GHR de la Fundación Nacional de Ciencia, DBI-0445967.