공동 규제 유전자의 잠재적인 규제 모티브를 식별하는 똑바로 전달하고 강력한 방법을 제공됩니다. 범위는 사용자 매개 변수 및 규제 신호 우수한 후보자를 나타내는 반환 주제가 필요하지 않습니다. 이러한 규제 신호의 식별은 기본 생물학을 이해하는데 도움이 될 것이다.
범위 이상 – 표현과 모티브의 게재 순위 환경 설정 1 잠재적인 규제 모티프를 확인하는 평행 세 구성 요소 알고리즘을 사용하여 앙상블의 모티프 찾기입니다. 각 구성 요소 알고리즘은 모티브의 다른 종류를 찾을 수 최적화되어 있습니다. 이 세 방법의 최선을 복용함으로써, 범위도 시끄러운 데이터 1의 면전에서, 어떤 하나의 알고리즘보다 수행합니다. 이 문서에서는, 우리는 telomere 유지 보수에 관련된 유전자를 검사 범위 2 웹 버전을 사용합니다. 범위가 프로그램 3,4를 찾는 적어도 다른 두 주제에 통합되어 연구와 다른 연구 5-8에서 사용되었습니다.
범위를 구성하는 세 개의 알고리즘이 아닌 타락한 주제 (ACCGGT)를 발견 BEAM 9, 주제 (ASCGWT)를 타락한 발견 PRISM 10, 그리고 더 이상 bipartite 모티브 (ACCnnnnnnnnGGT)를 발견 스페이서 11 일입니다. 이 세 가지 알고리즘은 모티브의 해당 유형을 찾아 최적화되었습니다. 함께, 그들은 범위가 매우 잘 수행할 수 있습니다.
유전자 집합 분석 및 후보 주제가 확인되면, 범위는 원래 집합에 추가하면 모티브 점수가 향상됩니다, 모티브를 포함하는 다른 유전자를 찾을 수 있습니다. 이것은 지나친 표현이나 모티프의 게재 순위 환경 설정을 통해 발생할 수 있습니다. 범위, 생물학 전사 인자 바인딩 사이트를 확인한 부분 유전자 세트와 함께 주어진 전사 인자에 의해 규제 유전자의 나머지의 대부분을 파악할 수있었습니다 작업.
범위에서 출력이 후보의 주제가, 그들의 중요성, 그리고 테이블과 그래픽 모티프지도로 모두 다른 정보를 보여줍니다. 미국의 소리는 이런 곳 및 비디오 자습서는 또한 사용자가 시운전을 수행할 수있는 '샘플 검색 "버튼을 포함하는 범위 웹 사이트에서 사용할 수 있습니다.
범위는 찾는 모티프의 생물 정보학 전문가가 될 필요없이 알고리즘의 전체 능력을 액세스할 수 초심자 사용자 수있는 매우 친숙한 사용자 인터페이스가 있습니다. 입력으로, 범위는 유전자 또는 FASTA 시퀀스의 목록을 취할 수 있습니다. 이들은 브라우저 텍스트 필드에 입력하거나, 파일에서 읽을 수 있습니다. 범위에서 출력은 자신의 점수, 일치하는 항목의 개수, 모티브를 포함하는 유전자의 일부분, 그리고 모티브를 식별하는 데 사용되는 알고리즘을 식별 모든 작품의 목록이 포함되어 있습니다. 각 주제에 대한, 결과의 세부 내용은 모티브의 합의 표현, 시퀀스 로고 위치 중량 매트릭스, 모든 모티프의 발생에 대한 인스턴스의 목록을 (정확한 위치 및 "스트랜드"표시)를 포함합니다. 결과는 브라우저 창에 또한 선택적으로 이메일로 반환됩니다. 이전 논문 상세 1,2,9-11의 범위 알고리즘을 설명합니다.
범위 coordinately 규제 유전자의 집합에서 잠재적인 규제 작품의 식별을 위해 사용하는 강력한 도구로 연구자를 제공합니다. 사용자는 주제 또는 사이트가 필요 찾는 많은 모티브로 주제의 발생의 숫자의 크기에 맞춰 필요하지 않습니다. 모티브가 확인하기 전까지 이러한 매개 변수는 기본적으로 불가합니다. 인터페이스는 순서이나 유전자 이름을 입력과 출력을 볼 수 모두 매우 간단합니다.
범위 출력 모티브 표현의 세 가지 다른 방법을 사용하여 식별하는 작품의 모든에 대한 자세한 정보를 제공합니다. 유전자의 모든 모티브의 각 인스턴스는 입장과 "스트랜드"정보와 함께 나열됩니다. 모티브지도의 형태로 그래픽 결과를 이해하기 쉽게 제시하는 주제에 패턴을 볼 수있는 직관적인 방법을 제공하는 시각적 표시를 제공합니다.
범위는 데이터에 노이즈가 존재하는 매우 강력한 것입니다. 일반적으로, 이것은 실제로 유전자의 나머지 부분과 함께 공동 규제되지 않는 시작 세트에 존재 여분의 유전자의 형태로 걸립니다. microarray 실험에서 공동 표현 유전자로 시작하는 경우에 이러한 문제가 종종 발생합니다. 때로는 실험 시끄러운, 또는 microarray 실험에 사용된 실험 조건에서 활성화 여러 전사 요소가있을 수 있습니다. 이러한 다양한 전사 요인 가능성이 DNA에 다른 타겟 사이트를합니다. 도 4 배 외부 유전자 (잡음 : 신호 비율 4시 1분입니다)의 면전에서, 범위는 여전히 사이트 1 예측의 정확성의 50 %를 유지합니다.
범위 유전자 이름 2 백만 이상의 동의어를 포함하고 있지만, 가끔은 유전자 이름을 식별하는 데 실패합니다. 우리는 끊임없이 우리의 동의어 목록을 업데이 트하지만, 때로는 다른 동의어는 동일한 유전자를 참조 것을 알게됩니다. 이러한 경우에, 우리는 때문에 모호함의 동의어를 포함하지 않습니다. 이 범위에 의해 발견되지 않은 유전자 이름이있다면, 그것은 당신이 범위에 사용할 수있는 다른 유전자 이름을 찾기 위해 게놈 특정 사이트를 참조하는 것이 좋습니다. 각 종족에 대한 적절한 유전자 이름의 예로는 범위가에 의해 제공됩니다.
범위는 현재 새로운 종이 항상 추가되는 72 종의 포함되어 있습니다. 웹 사이트는 동영상뿐만 아니라 미국의 소리는 이런 곳으로 도움이 포함되어 있습니다. 소스 코드는 RHG에 서면으로 학술 사용자가 자유롭게 사용할 수 있습니다.
The authors have nothing to disclose.
이 연구는 국립 과학 재단 (National Science Foundation), DBI – 0445967에서 RHG에 부여에 의해 지원되었다.