Summary

Coregulated Genler Potansiyel Düzenleme Motifler belirlenmesi için KAPSAMI

Published: May 31, 2011
doi:

Summary

Ortak düzenlenmiş genlerin potansiyel düzenleyici motifleri tanımlamak için ileri düz ve sağlam bir yöntem sunulmuştur. KAPSAMI herhangi bir kullanıcı parametreleri ve düzenleyici sinyaller için mükemmel adaylar temsil eden döner motifleri gerektirmez. Gibi düzenleyici sinyallerinin belirlenmesi temel biyolojisini anlamak için yardımcı olur.

Abstract

KAPSAMI bir topluluk motifi bulucu, temsil ve motif konum tercihi 1 potansiyel düzenleyici motifleri tanımlamak için üç bileşenli paralel algoritmaları kullanır . Her bileşen algoritması farklı bir tür motifi bulmak için optimize edilmiştir. Bu üç yaklaşımdan en iyi alarak, KAPSAM gürültülü veri 1 varlığında bile, herhangi tek bir algoritma daha iyi yapar. Bu makalede, biz KAPSAMI 2 telomer bakım yer alan genlerin incelemek için bir web sürümü kullanır. KAPSAMI programları 3,4 bulma, en az diğer iki motifin içine dahil edilmiştir ve diğer çalışmalar 5-8 kullanılmıştır .

KAPSAMI oluşturan üç algoritmaları olmayan dejenere motifleri (ACCGGT) bulur LEVENT 9, 10, motifleri (ASCGWT) dejenere bulur PRISM ve uzun iki taraflı motifleri (ACCnnnnnnnnGGT) bulur SPACER 11,. Bu üç algoritma motifi bunlara karşılık gelen türünü bulmak için optimize edilmiştir. Birlikte, KAPSAMI son derece iyi bir performans sağlar.

Bir gen analiz edilir ve aday motifleri tespit edildiğinde, KAPSAM orijinal set eklendiğinde, motif skoru artıracak motif içeren diğer genler için bakabilirsiniz. Bu temsil veya motif konum tercihi ile ortaya çıkabilir. KAPSAM, biyolojik transkripsiyon faktörü bağlayıcı siteler doğrulandıktan kısmi gen setleri ile verilen transkripsiyon faktörü tarafından düzenlenen genlerin geri kalanı çoğu tespit etmek mümkün oldu Çalışma.

KAPSAMI çıkış aday motifler, bunların önemi ve diğer bilgiler bir tablo ve grafiksel bir motif harita olarak göstermektedir. Sık Sorulan Sorular ve video eğitimlerini, kullanıcı bir deneme yapmak için izin veren bir "Örnek Ara" düğmesini de içeren KAPSAMI web sitesinde mevcuttur.

Kapsam acemi kullanıcılar bulma motifi biyoinformatik bir uzman olmak zorunda kalmadan algoritması tam güç erişim sağlayan bir çok kullanıcı dostu bir arayüze sahip. Girdi olarak, KAPSAM genler, ya da FASTA dizileri bir listesini alabilir. Bu tarayıcı metin alanlarına girilen ya da bir dosyadan okumak olabilir. KAPSAMI çıkış puanları, olayların sayısı, motif içeren genler fraksiyonu, motifi tanımlamak için kullanılan bir algoritma ile belirlenen tüm motifler bir listesini içerir. Her motif, sonuç detayları motifin bir fikir birliği temsil, bir dizi logosu, bir pozisyonda ağırlık matrisi ve (tam pozisyonları ve "iplikçik" belirtilen) her motif oluşumu için örneklerin bir listesini içermektedir. Sonuçlar bir tarayıcı penceresi ve ayrıca isteğe bağlı olarak e-posta ile iade edilir. Önceki kağıtları ayrıntılı 1,2,9-11 KAPSAMI algoritmaları açıklanmaktadır.

Protocol

<p class="jove_title"> 1. KAPSAMI tarafından analiz için düzenlenmiş olduğuna inanıyoruz genler için adlarının bir listesini hazırlayın.</p><p class="jove_content"> Bir metin dosyası olarak kaydet veya 3. adımda KAPSAMI yapıştırmak için panoya kopyalayabilir. Dosya, herhangi bir ek bilgi doğrultusunda başına bir gen adı içermelidir. Alternatif olarak, FASTA dosyası olarak analiz edilmesi gereken gerçek dizilerini içeren bir liste hazırlayabilir.</p><p class="jove_title"> 2. Web tarayıcınızı başlatın ve URL bağlanmak:<a href="http://genie.dartmouth.edu/SCOPE/"> Http://genie.dartmouth.edu/SCOPE/</a</p><p class="jove_title"> 3. KAPSAMI analizini gerçekleştirmek için ihtiyaç duyduğu bilgileri girin.</p><p class="jove_content"> Ilk KAPSAMI sayfası Şekil 1'de gösterilmiştir. Bu adımda farklı bölümlerinde ele alınmaktadır.</p><ol><li> Inceleyerek olacak türü seçmek için 'Türler' açılan menüsünü kullanın. KAPSAMI inceleyerek herhangi bir aday motifi gerçekleşme arka plan frekanslarını hesaplamak için genomu ifade eder, çünkü doğru bir tür seçmek için önemlidir.</li><li> Intergenic veya sabit uzunluğunu seçmek için 'upstream dizisi "radyo düğmelerini kullanın. Intergenic bakıyorsun gen ve önceki (upstream) gen arasındaki tüm dizisini analiz eder. Farklı memba uzunlukları için kullanılan olacak anlamına gelecektir upstream nükleotidler mevcut genin başlangıcından itibaren tam bu sayı her genin sabit uzunlukta seçimi bakacağız. Bu durumda, KAPSAMI, her gen upstream dizisinin aynı uzunlukta inceleyeceğiz, önceki gen (veya içine doğru uzanır bile değil). Tipik olarak, 800 NTS seçmek için en iyi uzunluğunda, ancak bu türler ile değişebilir.</li><li> Sonraki gen liste metin kutusuna gen listesinde yapıştırarak, ya da daha önce oluşturduğunuz genlerin listesini içeren dosyayı seçmek için 'dosya seçin' düğmesine basarak ya da analiz ayarlamak ne gen KAPSAMI söylemek. Alternatif olarak, aynı metin kutusuna bir FASTA sıra dosyası yapıştırın.</li><li> Sayfa sonraki bölüm için bir onay kutusu içerir 'bulundu motifi (ler) içeren diğer genlerin genom inceleyin?' Bu seçenek beri KAPSAMI genom diğer tüm gen değerlendirmek için önemli bir analiz süresi ekleyebilirsiniz. Ancak, bu başlangıç ​​gen kümesi genler ile birlikte düzenlenir için iyi bir aday olan diğer genlerin belirlenmesinde çok yararlı olabilir. KAPSAMI analizleri nispeten hızlı olduğundan, ilk analizde bu kapalı bırakmanız tavsiye edilir. Her zaman sonuçları sayfasında analizi yeniden açık olabilir, sonuç bölümünde açıklanmıştır.</li><li> 'Sonuçlar içermelidir bölüm analizi dahil KAPSAMI istediğiniz bir motif girmek için kullanılabilir. Belirli bir motif arıyorsanız Bunu yapmak isteyebilirsiniz.</li><li> Sayfa son bölümünde, e-posta adresinizi ve analizi ile kaydedilmiş bir yorum girmek için kullanılabilir. Bu dolu olursa, KAPSAM sonuçlarını içeren bir web sayfasına bir bağlantı ile e-posta göndermek, ve aynı zamanda iki ekleri içerecektir. Bir insan okunabilir formatta tüm analiz sonuçları olan bir düz metin dosyası. İkinci ek KAPSAMI bir bilgisayar tarafından okunabilir bir formatta bulduğu her sonucu bir XML dosyası içerir. Sonuçlar üzerinde bazı ek bir analiz yapmak istiyorsanız, XML dosyası çok faydalı olur. Her iki dosya, e-posta ile gönderilmeden önce "sıkıştırılmış" dir.</li><li> Bu demo için, biz aynı bilgileri ile başlayacak. Bu gerekli bilgileri doldurup 'Örnek Ara' düğmesine basarak kolayca elde edilebilir. Şimdi bu düğmeye basın. Üç gen, siz ve diğer alanlar için uygun seçenekler için girilecektir. Olarak bırakın. Üç gen de telomer bakım dahil<em> Saccharomyces cerevisiae</em>. Formu doldurdu Şekil 2'de gösterilmiştir. Analiz başlatmak için sayfanın altındaki "Çalıştır KAPSAMI" düğmesine basın.</li></ol><p class="jove_title"> 4. Temsilcisi Sonuçlar:</p><p class="jove_content"> Analizin ana sonuçları Şekil 3'te gösterilmiştir. Sayfanın üst KAPSAMI bulundu motifleri hakkında bilgi bir tablo içerir. Ilk sütunu bulundu ve küçük renkli kareler, aşağıda gösterilen grafik motif harita için bir efsane olarak hizmet motiflerin bir listesini içerir. Herhangi bir motifin ekran renkli kutu (veya renkli kutu nerede olurdu) tıklayarak açık veya kapalı getirilebilir. Bu, daha az yaygın bir motif modellerini görmek zor olabilir, çok tekrarlanan motifler görüntülenmesini gizlemek için çok yararlı olabilir.</p><p class="jove_content"> Diğer veri sütunları Count (gen kümesinin tamamını bu motif oluşum sayısı), Sig değeri (bu motifin öneminin bir göstergesi), Kaplama (en az bir örneğini içeren sunulan genlerin yüzdesi bu motifi) ve Algoritma (motif tespit etmek için kullanılan üç bileşenli algoritmaları).</p><p class="jove_content"> Herhangi bir listede yer alan motifler tıkladığınızda bu motif için ayrıntılı bilgi içeren bir sayfa kullanıcı alacaktır. Şekil 4'te camgöbeği motifi (atgnnnnttg) sonuçları ayrıntılarını gösterilmiştir. Bir dizi logosu, bir pozisyon ağırlık matrisi ve konumlarını, ipliklerini ve genler tüm motif örnekleri bir liste: Bu sayfada, motif, üç şekilde temsil edilmektedir.</p><p class="jove_content"Sayfa aşağı Biraz ileride, bu motifi içeren diğer genler arıyor sonuçları ile ilgili bazı ek ayrıntılar. Görülebileceği gibi, bu durumda orijinal gen kümesi eklendiğinde aslında Sig değeri geliştirilmiş hangi motifi içeren 1344 diğer genlerin vardı. Bu genlere sahip KAPSAMI kurulum sayfası dönecektir 'arama kontrol genleri Ekle' basılması orijinal gen setine eklenen ve daha önce olduğu gibi parametreleri ayarlayabilirsiniz. Bu durumda, 10 ekstra genler orijinal üç eklenir.</p><p class="jove_content"> Şekil 5, bu motifin için ekstra genleri içeren analiz sonuçlarını gösterir. Orijinal üç gen (küçük harf) sonuçlarının altındaki. Bu ekstra genlerin upstream bölge motif desen baktığımızda açıkça benzer olduğunu gösterir. Aslında, orijinal üç gen olduğu gibi bu genlerin çoğunun telomer bakım dahil. Orijinal motif şimdi bu seti en yüksek puan motifi olduğunu da unutmayın.</p><p class="jove_content"> Başka bir set KAPSAMI sonuçları Şekil 6'da gösterilmiştir. Bu durumda, genlerin Saccharomyces cerevisiae ribozom biyogenezi dahil olanlar. Bu genler gerçekte ribozomun parçası değildir ama ribozomlar montaj sorumlu olan ve bir dizi değişiklik enzimler içerir. Resimde açık kırmızı ve yeşil motifli bu set genlerin yönetmelikte yer olması muhtemeldir güvenilir bir desen oluşturur. Biz bu model daha ayrıntılı olarak "modules" soruşturma ve daha sonra bir yayın hakkında rapor verecektir.</p><p class="jove_content"<img src="/files/ftp_upload/2703/2703fig1.jpg" alt="Figure 1"><strong> Şekil 1</strong>. Ana KAPSAMI giriş sayfası. Bu sayfa, analiz edilecek genler girmek için ve türlerini tanımlamak için kullanılır ve upstream bölgenin uzunluğu incelenecektir. İsteğe bağlı olarak, kullanıcı e-posta ile talep veya belirlenen herhangi bir motif için arama kısıtlamak. Video yardım da kullanılabilir.</p><p class="jove_content"<img src="/files/ftp_upload/2703/2703fig2.jpg" alt="Figure 2"><strong> Şekil 2</strong>. Ana değer KAPSAMI giriş sayfası bir arama yapmak için doldurulacaktır. Bu parametreler 'Örnek Ara' düğmesine basarak sonucu. Bu durumda, KAPSAMI tarafından bulundu motifleri içeren diğer genleri bulmak için onay kutusunu kontrol edilir. Bu seçenek, (genom her gen incelenir) ama ilginç anlayışlar sağlayabilir hesaplamak için daha uzun sürer.</p><p class="jove_content"<img src="/files/ftp_upload/2703/2703fig3.jpg" alt="Figure 3"><strong> Şekil 3</strong>. Ana KAPSAMI sonuç sayfası. Bu sayfa KAPSAMI arama sonuçları özetlemektedir. Tüm yüksek skorlama motifleri listesi ve renk kodlu motifi harita analiz genlerin tespit motifleri konumlandırma gösterir. Bir motif yanında renkli bir kutu tıklamak motifi harita açık veya kapalı, bu motifin ekran geçiş yapılır. Buna ek olarak bir önemi skoru (Sig değeri), (kapsama alanı) motif içeren genlerin kesir ve bu motifi bulmak için kullanılan algoritma da verilmiştir.</p><p class="jove_content"<img src="/files/ftp_upload/2703/2703fig4_1.jpg" alt="Figure 4 top"><img src="/files/ftp_upload/2703/2703fig4_2.jpg" alt="Figure 4 bottom"> Şekil 4</strong>. Bu sonuç ana sayfasında özel bir motif tıklandığında ayrıntı sayfası getirilir. Bu bireysel motif ayrıntıları gösterir. Sırası logosu, pozisyon ağırlık matrisi ve fikir birliği dizisi her motif örneklerini de sayfada listesinde farklı bir tür özet temsil eder. Orijinal arama ayarı kontrol edildi 'ekstra genleri bulmak bu yana bu sayfada, bu motifin içeren genom diğer genler hakkında bilgiler de var. Bu sayfada, bu sayfada belirtilen ekstra genler de dahil olmak üzere başka bir KAPSAMI çalışmasını başlatmak için de mümkündür.</p><p class="jove_content"<img src="/files/ftp_upload/2703/2703fig5.jpg" alt="Figure 5"> Şekil 5</strong>. Bu rakam için ekstra genlerin Şekil 4'te gösterildiği 'atgnnnnttg' motifi arıyor sonuçlarını gösterir. Orijinal üç gen motifi haritanın alt kısmında küçük harf. Ek genlerin büyük harf gösterilmiştir. Bu genlerin upstream bölgelerde motifleri net bir model yoktur. Nasıl tespit edilmiştir, çünkü 'ARA' olarak belirtilen motifi bir algoritma gösterir de dikkat edin. Aslında 5 maç<sup> Th</sup> Motifi bu analizde SPACER tarafından bulundu.</p><p class="jove_content"<img src="/files/ftp_upload/2703/2703fig6.jpg" alt="Figure 6"> Şekil 6</strong>. Saccharomyces cerevisiae ribozom biyogenezi ilgili genler için KAPSAMI çıktı. Korunmuş deseni motifleri 'aaawtttbh' (kırmızı) ve 'abctcatcd' (yeşil) yaklaşık 10-30 NTS ayrılmış ve gen transkripsiyon başlangıç ​​yukarı 100-200 nükleotidler oluşan modüller unutmayın.</p>

Discussion

KAPSAMI potansiyel düzenleyici motifleri setleri koordineli düzenlenir genlerin belirlenmesi için kullanmak için güçlü bir araç olan araştırmacı sağlar. Kullanıcı, motif ya da siteleri gerektiren bulma diğer birçok motif olarak, motif oluşunda sayısı boyutunu tahmin etmeye gerek yoktur. Bu parametreler, motif tanımlanır kadar temelde bilinemez. Arayüzü, dizileri ya da gen adları girmek için ve çıkışı görüntülemek için de çok basittir.

KAPSAMI çıkış motifi temsil üç farklı şekilde kullanarak, tespit motifleri hakkında ayrıntılı bilgi sağlar. Tüm genlerin motif her örneği pozisyonu ve "iplikçik" bilgileri yer almaktadır. Şeklinde motif haritalar Grafik sonuçlar anlamak daha kolay ve sezgisel bir yol sağlar mevcut motifleri desenleri görmek için görsel bir görüntü sağlar.

KAPSAMI veri gürültü varlığı çok sağlam. Tipik olarak, bu ekstra genlerin aslında genlerin geri kalanı ile birlikte düzenlenir olmayabilir başlangıç ​​seti mevcut şeklini alır. Mikroarray deneyler eş ifade genleri ile başlayan bu sık sık olur. Bazen deney gürültülü, ya da çeşitli transkripsiyon faktörleri mikroarray deney için kullanılan deneysel koşullarda aktif olabilir. Bu farklı transkripsiyon faktörleri muhtemelen DNA üzerinde farklı hedef siteleri olacaktır. 4 kat gereksiz genler (gürültü sinyal oranı 4:1) varlığında bile, KAPSAM hala siteleri 1 tahmin doğruluğu% 50 oranında korur.

KAPSAMI gen adları için 2 milyonun üzerinde eş anlamlı bulunsa da, bazen bazı genler isimleri belirlemek için başarısız olur. Eşanlamlı listeleri sürekli güncellenmesi, ama bazen aynı genin farklı eş anlamlı olduğunu fark vardır. Bu durumda, belirsizlik nedeniyle eş anlamlı dahil değildir. KAPSAMI tarafından bulunan bir gen adı varsa, KAPSAMI kullanmak için bir alternatif gen adını bulmak için genom belirli bir site bakın önerilir. Her tür için uygun gen isimleri örnek KAPSAMI tarafından sağlanmaktadır.

KAPSAMI henüz yeni türlerin her zaman eklenmektedir 72 tür içerir. Bu web sitesi, video gibi SSS gibi yardımcı içerir. Kaynak kodu RHG için yazarak akademik kullanıcılara ücretsiz olarak kullanılabilir.

Divulgaciones

The authors have nothing to disclose.

Acknowledgements

Bu araştırma, Ulusal Bilim Vakfı, DBI-0445967 RHG hibe tarafından desteklenmiştir.

Referencias

  1. Chakravarty, A., Carlson, J. M., Khetani, R. S., Gross, R. H. A novel ensemble learning method for de novo computational identification of DNA binding sites. BMC Bioinformatics. 8, 249-249 (2007).
  2. Carlson, J. M., Chakravarty, A., DeZiel, C. E., Gross, R. H. SCOPE: a web server for practical de novo motif discovery. Nucleic Acids Res. 35, 259-264 (2007).
  3. Blom, E. J., Roerdink, J. B., Kuipers, O. P., Hijum, S. A. v. a. n. MOTIFATOR: detection and characterization of regulatory motifs using prokaryote transcriptome data. Bioinformatics. 25, 550-551 (2009).
  4. Blom, E. J. DISCLOSE : DISsection of CLusters Obtained by SEries of transcriptome data using functional annotations and putative transcription factor binding sites. BMC Bioinformatics. 9, 535-535 (2008).
  5. Bushey, A. M., Ramos, E., Corces, V. G. Three subclasses of a Drosophila insulator show distinct and cell type-specific genomic distributions. Genes Dev. 23, 1338-1350 (2009).
  6. Znaidi, S. Identification of the Candida albicans Cap1p regulon. Eukaryot Cell. 8, 806-820 (2009).
  7. Sharma, D., Mohanty, D., Surolia, A. RegAnalyst: a web interface for the analysis of regulatory motifs, networks and pathways. Nucleic Acids Res. 37, W193-W201 (2009).
  8. Znaidi, S. Genomewide location analysis of Candida albicans Upc2p, a regulator of sterol metabolism and azole drug resistance. Eukaryot Cell. 7, 836-847 (2008).
  9. Carlson, J., Chakravarty, A., Gross, R. B. E. A. M. A beam search algorithm for the identification of cis-regulatory elements in groups of genes. J Comput Biol. 13, 686-701 (2006).
  10. Carlson, J., Chakravarty, A., Khetani, R., Gross, R. Bounded search for de novo identification of degenerate cis-regulatory elements. BMC Bioinformatics. 7, 254-254 (2006).
  11. Chakravarty, A., Carlson, J. M., Khetani, R. S., DeZiel, C. E., Gross, R. H. SPACER: identification of cis-regulatory elements with non-contiguous critical residues. Bioinformatics. 23, 1029-1031 (2007).

Play Video

Citar este artículo
Martyanov, V., Gross, R. H. Using SCOPE to Identify Potential Regulatory Motifs in Coregulated Genes. J. Vis. Exp. (51), e2703, doi:10.3791/2703 (2011).

View Video