共同調節遺伝子の潜在的な規制のモチーフを識別するために、単純明快かつ堅牢な方法が提示される。 SCOPEは、規制信号のための優れた候補者を表す任意のユーザのパラメータとリターンのモチーフを必要としません。そのような調節シグナルの同定には、基礎生物学を理解するのに役立ちます。
SCOPEは、過剰表現とモチーフの位置の設定1で潜在的な規制のモチーフを識別するために、並列で3つのコンポーネントのアルゴリズムを使用してアンサンブルのモチーフのファインダーです。各コンポーネントのアルゴリズムは、モチーフの異なる種類を見つけるために最適化されています。これら3つのアプローチのベストを取ることにより、SCOPEは、ノイズの多いデータ1の存在下で、任意の単一のアルゴリズムよりもパフォーマンスが良くなります。この記事では、テロメアの維持に関与する遺伝子を調べるためにスコープ2のWeb版を利用する。 SCOPEは、プログラム3,4を見つける少なくとも2つの他のモチーフに組み込まれており、他の研究5-8で使用されています。
SCOPEを構成する3つのアルゴリズムは、モチーフ(ASCGWT)、及び(ACCnnnnnnnnGGT)長い二部のモチーフを見つけるとスペーサ11を 、縮退が見つかる非退化モチーフ(ACCGGTを)見つけたビーム9、、プリズム10、です。これらの3つのアルゴリズムは、モチーフのそれらに対応するタイプを見つけるために最適化されています。一緒に、彼らは、SCOPEは非常によく実行することができます。
遺伝子セットを分析し、候補のモチーフが特定されたら、SCOPEは、元のセットに追加すると、モチーフのスコアを向上させる、モチーフを含む他の遺伝子を探すことができます。これは過剰表現やモチーフの位置の設定によって発生する可能性があります。生物学的に転写因子結合部位を確認してから部分的な遺伝子セットでの作業、SCOPEはまた、特定の転写因子によって制御される遺伝子の残りの大部分を識別することができた。
SCOPEからの出力は、候補をモチーフに、その意義、そしてテーブルのような、グラフィカルなモチーフのマップとしても他の情報を示しています。よくある質問とビデオチュートリアルは、ユーザが試運転を実行できるようにする"サンプルの検索"ボタンを含むスコープのウェブサイトで入手できます。
範囲は、初心者ユーザーがモチーフの発見のバイオインフォマティクスの専門家になることなく、アルゴリズムの完全な電源へのアクセスを可能にする非常に友好的なユーザインタフェースを持っています。入力として、SCOPEは、遺伝子、またはFASTAシーケンスのリストを取ることができます。これらは、ブラウザのテキストフィールドに入力、またはファイルから読み取ることができます。スコープからの出力は、そのスコア、出現回数、モチーフを含む遺伝子の割合で、モチーフを識別するために使用されるアルゴリズムと特定されたすべてのモチーフのリストが含まれています。それぞれのモチーフの場合、結果の詳細は、モチーフのコンセンサスの表現、シーケンスのロゴ、位置の重み行列、およびすべてのモチーフの発生のためのインスタンスのリストを(正確な位置と示されている"鎖"を持つ)が含まれます。結果がブラウザウィンドウにし、また必要に応じて電子メールで返送されています。以前の論文では詳細1,2,9-11のSCOPEのアルゴリズムを説明します。
SCOPEは協調制御される遺伝子のセット内の潜在的な規制モチーフの同定に使用する強力なツールと研究者を提供します。ユーザーは、モチーフの大きさや部位を必要を見つける他の多くのモチーフとしてモチーフの出現回数を推測する必要はありません。モチーフが識別されるまで、これらのパラメータは、基本的に不可知です。インタフェースは、配列または遺伝子名を入力するため、出力を表示するための両方非常に簡単です。
SCOPEの出力は、モチーフの表現の3つの異なる方法を使用して、識別されるモチーフのすべてについての詳細な情報を提供します。遺伝子のすべてのモチーフの各インスタンスは、位置と"鎖"の情報が記載されています。モチーフのマップの形でグラフィカルに結果が理解しやすいと存在するモチーフのパターンを確認するための直感的な方法を提供するビジュアル表示を提供します。
SCOPEは、データのノイズの存在に非常に堅牢です。通常、これは実際に遺伝子の残りの部分と同じ場所に規制されていない可能性があります開始セットに存在する余分な遺伝子の形式をとります。マイクロアレイ実験で共発現される遺伝子で始まるときによく起こります。時々の実験ではノイズが多い、またはマイクロアレイ実験に用いる実験条件で活性化いくつかの転写因子があるかもしれません。これらの異なる転写因子には、おそらくDNA上の異なる標的部位を持つことになります。であっても4倍外来遺伝子(ノイズ:信号の比は4:1である)の存在下で、SCOPEは、まだサイト1を予測する上で、その精度の50%を維持しています。
SCOPEは、遺伝子名の200万以上の同義語が含まれていますが、それは時々いくつかの遺伝子の名前を識別するために失敗します。我々は常に我々のシノニムのリストを更新するが、時には別の同義語は同じ遺伝子を参照していることを確認されています。これらのケースでは、我々は理由あいまいさの同義語が含まれていません。 [スコープで検出されない遺伝子の名前を持っている場合、それはあなたがスコープ内に使用する代替の遺伝子名を検索するゲノムの特定のサイトを参照することをお勧めします。それぞれの種のための適切な遺伝子名の例は、SCOPEで提供されています。
SCOPEは、現在すべての時間を追加される新しい種は72種が含まれています。ウェブサイトは、ビデオのヘルプだけでなく、よくある質問(FAQ)が含まれています。ソースコードは、RHGに書き込むことにより、アカデミックユーザーに自由にご利用いただけます。
The authors have nothing to disclose.
この研究は、国立科学財団、DBI – 0445967からRHGに助成金によって支えられている。