Прямой и надежный метод для выявления потенциальных нормативных мотивы совместно регулируемых генов представлена. СФЕРА не требует каких-либо параметров пользователя и возвращает мотивы, которые представляют собой превосходные кандидаты для регуляторных сигналов. Выявление таких регуляторных сигналов помогает понять основные биологии.
SCOPE is an ensemble motif finder that uses three component algorithms in parallel to identify potential regulatory motifs by over-representation and motif position preference1. Each component algorithm is optimized to find a different kind of motif. By taking the best of these three approaches, SCOPE performs better than any single algorithm, even in the presence of noisy data1. In this article, we utilize a web version of SCOPE2 to examine genes that are involved in telomere maintenance. SCOPE has been incorporated into at least two other motif finding programs3,4 and has been used in other studies5-8.
The three algorithms that comprise SCOPE are BEAM9, which finds non-degenerate motifs (ACCGGT), PRISM10, which finds degenerate motifs (ASCGWT), and SPACER11, which finds longer bipartite motifs (ACCnnnnnnnnGGT). These three algorithms have been optimized to find their corresponding type of motif. Together, they allow SCOPE to perform extremely well.
Once a gene set has been analyzed and candidate motifs identified, SCOPE can look for other genes that contain the motif which, when added to the original set, will improve the motif score. This can occur through over-representation or motif position preference. Working with partial gene sets that have biologically verified transcription factor binding sites, SCOPE was able to identify most of the rest of the genes also regulated by the given transcription factor.
Output from SCOPE shows candidate motifs, their significance, and other information both as a table and as a graphical motif map. FAQs and video tutorials are available at the SCOPE web site which also includes a “Sample Search” button that allows the user to perform a trial run.
Scope has a very friendly user interface that enables novice users to access the algorithm’s full power without having to become an expert in the bioinformatics of motif finding. As input, SCOPE can take a list of genes, or FASTA sequences. These can be entered in browser text fields, or read from a file. The output from SCOPE contains a list of all identified motifs with their scores, number of occurrences, fraction of genes containing the motif, and the algorithm used to identify the motif. For each motif, result details include a consensus representation of the motif, a sequence logo, a position weight matrix, and a list of instances for every motif occurrence (with exact positions and “strand” indicated). Results are returned in a browser window and also optionally by email. Previous papers describe the SCOPE algorithms in detail1,2,9-11.
СФЕРА предоставляет исследователю мощный инструмент, используемый для идентификации потенциальных нормативных мотивы в наборах согласованно регулируемых генов. Пользователь не обязан догадываться о размере мотив или количество вхождений мотив как и многие другие мотив поиска сайтов требует. Эти параметры в основном непознаваем до мотив выявлено. Интерфейс программы очень простой, как для ввода последовательности или гена имена и для просмотра продукции.
СФЕРА выход предоставляет подробную информацию обо всех мотивов, которые определены, используя три различных способа мотива представления. Каждый экземпляр мотив во всех генов в списке с позиции и "нить" информации. Графический результаты в виде мотива карты обеспечивают визуальное отображение, что легко понять, и предоставляет интуитивно понятный способ увидеть закономерности в мотивах, которые присутствуют.
СФЕРА очень устойчивы к присутствии шума в данных. Как правило, это осуществляется в форме дополнительных генов, присутствующих в стартовый набор, который не может быть фактически совместно регулируется с остальными генами. Это часто происходит, когда, начиная с генами, которые являются со-выражается в микрочипов экспериментов. Иногда эксперимент шумно, или их может быть несколько факторов транскрипции активируется в экспериментальных условиях использовали для эксперимента микрочипов. Эти различные транскрипционные факторы, скорее всего, имеют различные сайты мишени на ДНК. Даже в присутствии 4-кратный посторонних генов (шума: сигнал соотношение 4:1), СФЕРА-прежнему сохраняет 50% своей точности в предсказании сайты 1.
Хотя СФЕРА содержит более 2 миллионов синонимы названий генов, она иногда не в состоянии идентифицировать некоторые гены имена. Мы постоянно обновляем наши списки синонимов, но иногда находят, что различные синонимы относятся к одному гену. В этих случаях, мы не включаем синонимы из-за двусмысленности. если у вас есть ген имя, не найдено СФЕРА ПРИМЕНЕНИЯ, рекомендуется, чтобы вы ссылаетесь на геном конкретного сайта, чтобы найти альтернативное имя ген использовать по своему масштабу. Примеры соответствующих названий генов для каждого вида предоставляются SCOPE.
СФЕРА в настоящее время содержит 72 видов, новых видов добавляются все время. Веб-сайт содержит видео помощи, а также часто задаваемые вопросы. Исходный код находится в свободном доступе для академических пользователей, написав по адресу RHG.
The authors have nothing to disclose.
Это исследование было поддержано грантом для RHG от Национального научного фонда, DBI-0445967.