DNA dizisi verileri farklı olarak, epigenomic verileri kolayca metin tabanlı aramaları için tabi değil. Burada sunan GeNemo, bir web tabanlı Biyoinformatik aracı, yükseltilmiş sürüm desen tabanlı aramalar için benzerlikler epigenomic veri ansiklopedi DNA ile öğeler dahil olmak üzere kullanılabilir çevrimiçi veritabanları karşılaştırma yapmak için kullanılabilecek yordamları vardır kullanıcının veri.
Güçlü metin tabanlı arama araçları için ile karşılaştırıldığında genomik veya veri sıralama RNA, desen tabanlı aramalar epigenomic ve diğer fonksiyonel genomik veri için geçerli yöntemleri çok sınırlıdır. GeNemo bu hedefe gerçekleştirir ilk online arama aracıdır. Kullanıcılar tarayıcı Genişletilebilir veri (yatak), tepeler ve önemli biçimleri onların fonksiyonel genomik veri giriş ve herhangi bir üç biçimden verileri için arama yapabilirsiniz. Kullanıcılar online veri kümeleri, çeşitli ansiklopedi ve DNA öğeleri (farklı epigenomic işaretleri, transkripsiyon faktörü bağlayıcı siteleri ve Kromatin temsil eden KODLA ile) seçerek karşı arama için veri türlerini belirtebilirsiniz hypersensitivities veya eriþebilirlik belirli hücre tipleri ve gelişim dönemleri ya da kısa ömürlü tür (fare veya insan). GeNemo desen tarayıcıda görüntülenebilir yanı sıra yatak dosya biçiminde indirilen giriş veri eşleme ile genomik bölgelerin listesini döndürür. Yükseltilmiş GeNemo grafik ekran geliştirdi, daha sağlam bir arayüze sahip ve artık hataları Kaliforniya Üniversitesi, Santa Cruz (UCSC) genom tarayıcı değişiklikler nedeniyle eğilimli değildir. Genel sorunlar için sorun giderme adımları ele alınmıştır. İşlevsel genomik veri miktarını katlanarak büyüyor gibi geliştirmek ve GeNemo gibi yeni bioinformatic araçları veri analizi ve yorumu için rafine bir kritik gerek yoktur.
Son teknolojik gelişmeler epigenomic veya biyolojik anlayışlar ayıklamak için ilgili analitik araçlar geliştirme outpaced fonksiyonel genomik veri yatırım hızlı bir genişleme için izin vermiş. Kullanıcı tarafından oluşturulan veri veri yatırım ve özellikle de yeni bilgi için yol açabilecek desen eşleştirme için DNA ansiklopedi öğelerini (kodlama)1 projelerden karşı aramak için epigenomic verileri çözümlemek için önemli yollarından biridir. Örneğin, genom arasında benzerlikler tanımlanmış loci, iki farklı epigenomic işaretlerinin şekillerindeki tanımlayan Kromatin uyum ve transkripsiyon yönetmelik2 farklı moleküler oyuncular tarafından eylem koordine gösterebilir ,3,4.
DNA dizisi, epigenomic veri ağırlıklı olarak yoğunluklarda veya fonksiyonel genomik bölgeleri biçiminde var için geleneksel metin tabanlı arama motorları bu konuda etkisiz. Gene Nemo (Finding Nemo), olduğu gibi ayakta GeNemo, desen tabanlı aramalar5kullanarak bu karşılanmamış ihtiyaç gidermek üzere geliştirilmiştir. Kendi algoritması Markov zinciri Monte Carlo maksimizasyonu işlemi5kullanır. Kullanıcıların kendi veri almak veya yatırım ve arama online epigenomic veri dizisi benzerlikler desen tanımlamak için bir veri kümesi indirilen.
GeNemo geçerli sürümünü güncelleştirilmiş bir görüntü, daha sağlam ile University of California, Santa Cruz (UCSC) genom tarayıcı6, arabirimleri ve ikinci değişimler nedeniyle oluşan sorunları için daha az duyarlı. Özellikle, GeNemo’nın sonuçları sayfası UCSC Genom tarayıcı arayüzü dayalı için kullanılan, GeNemo geçerli sürümünü kendi sonuçları sayfası destekler ve sonuç olarak artık olumsuz UCSC Genom tarayıcı yapısal değişikliklerden etkilenir. GeNemo olarak bilinen veri kümelerinden büyük konsorsiyumlar arasında colocalized/benzer parçaları bulmak amacıyla bir sorgu protein bağlayıcı, Histon modifiye, Kromatin erişilebilirlik, topolojik etki alanları ve benzeri dahil olmak üzere herhangi bir genomik sinyal kullanabilirsiniz. Bu nedenle, farklı epigenomic veri ilgi ve büyük ölçekli genomik projelerinde oluşturulan bilinen veri arasındaki ilişkiyi araştırmayı önemli bir araçtır.
Epigenome kapsamlı bir anlayış tam potansiyelini yeni biyolojik anlayışlar8sağlanmasında insan genomu sıralama elde etmek için gereklidir. Şu anda sadece yolu online epigenomic veri kümeleri veri açıklama ve başlık (örneğin, meta veriler)1aramak için vardır. Bu ciddi bir epigenomic veri ile yapabilirsiniz arama türlerini sınırlar. Epigenomic veriler için desen tabanlı arama araçları için yeni biyolojik yorumlara neden olabilir farklı epigenomic işaretleri arasındaki ilişkiyi keşfetmek için gereklidir. Tarafından değil meta veriler ve veri içeriğini arar, GeNemo okuduğunuzda, yayımlanmış yatırım gibi kullanıcı tarafından oluşturulan KODLA veritabanıyla epigenomic verileri karşılaştırmak için kendi türünde ilk hizmet veya veri kümesi5indirilen. Bu metin tabanlı dizi arama aracı 1990’larda yaygın olarak kullanılabilir hale geldi gibi yaygın olarak dünyanın sadece araştırmacılar için erişilebilir olan bir epigenomic arama aracı kullanılabilirliği başlangıcı işaretler. Şu anda GeNemo dışındaki epigenomic veriler için desen tabanlı online arama araçları için hiçbir alternatifi vardır.
GeNemo kullanarak bir potansiyel ortak görünen Histon modifikasyonları ve transkripsiyon faktörü E2F6 epigenetik diğer işaretleriyle insan embriyonik kök hücreleri (bir örnek E2F6 bağlama sinyal dosyası kodlama veri portal ya da kullanılabilir içinde aranacağı örnektir https://sysbio.UCSD.edu/public/xcao3/ENCODESample/ENCFF001UBC.Bed). Bu dosya sorgu olarak KODLA veri kümelerini H1-hESC karşı aramak için kullanarak, GeNemo E2F6 bağlama sinyal ağır H3K4me1, H3K4me2, H3K4me3 ve E2F6 bazı genler ile düzenleyen gösterilen mevcut araştırma kabul eder H3K27me3 ile zenginleştirilmiş gösterecektir metilasyon H3K279. Öte yandan, aynı aile, E2F710bir faktör etkileşimli olarak bilinen colocalization E2F6 ve CtBP2 bağlama siteleri, görünüyor. Bu sonuçlar için tüm genom epigenetik işaretleri, transkripsiyon faktörü bağlama sinyalleri ve diğer sinyalleri KODLA içinde dahil çok sayıda karşı oldukça kolay tüm potansiyel hedefler daha fazla çözümleme için sağlayabilir GeNemo ile elde edilebilir.
İlk yayın5 / epigenomic web tabanlı veri arama aracı olarak GeNemo beri GeNemo’nın ön sayfa ile eşleşen bir görünüm için GeNemo sonuçları bölümü güncelleştirildi. Eski sonuçları bölümü yakından UCSC Genom tarayıcı sonuçları bölümü yansıtılmış ve görüntü için uzak UCSC sunucuda büyük ölçüde bağımlı. (Veri hala uzaktan getirilen) ile yeni arayüz, GeNemo daha kullanıcı dostu ve artık UCSC Genom sunucunun bağımlı olmasına rağmen. Bu GeNemo daha sağlam ve daha az UCSC sunucuda duruma sorunları kod değişikliği nedeniyle getirir. Ayrıca, GeNemo yeni, daha hızlı polimer arabiriminin görselleştirmek ve veri desenleri analiz etmek için daha fazla araçlara kullanıcı verir.
Önemli adımlar uygun giriş dosyayı sağlayan ve karşı arama için veri parça seçme içerir. Kullanıcı are güçlü çeşitli ile deneme için teşvik seçim süreci ve nasıl farklı komutlar ile bilgi sahibi olmak için parça seçimi işlevleri hedeflenen sonuca ulaşmak için kombine edilebilir. Özellikle, “Ekle” fonksiyonu “Filtre” veya “Dışarıda” mantık kapısı komut olarak kullanılabilir süre sorgu için seçilen istenen parça eklemek için gereken Not “Ve” ve “Ya da”, anılan sıraya göre. “Update” işlevini arama uygulamadan önce tüm seçimleri etkiler için gereklidir. Hiçbir sonuç döndürülmediğinde bir kullanıcı giriş veri dosyasını kontrol, daha fazla parça arama veya arama aralığı artırın. Bir hata olduğunda, hatanın tam olarak ne olduğunu tanımlama haşhaş bir pencere olacaktır. Belirsiz bazı hatalar, though. Örneğin, pencere ‘ hiçbir dosya karşıya olduğunu’ dediğinde, ya hayır eğe tarih oldu, ya da yüklenen dosya kabul edilebilir bir biçimde değildi ve, sonuç olarak, program doğru okumak mümkün değildi. Kabul edilebilir dosya biçimleri dosya yükleme için yatak ve tepeler biçim dosyası için hem yükleme yöntemleri ve önemli için online bağlantı upload sadece içerir. Bu dosya biçimleri sıkıştırılmış sürümleri de kabul edilir.
Bu yaklaşımın geçerli sınırlamaları algoritmaları henüz-için–optimize edilebilir ve GeNemo içinde istihdam işlevleri içerir. GeNemo henüz herhangi bir veri kümeleri döndürülen yorumu üzerinde herhangi bir rehberlik sağlayamaz. Bu kullanıcılar kadar önemli bilgi ve Biyoloji genom ve epigenome uzmanlık gerektiren bir görevdir. Ayrıca, başka bir geçerli kullanıcıların arama duyarlılık ve gürültü düzeyini değiştiremezsiniz kısıtlamadır. Biz geliştirmek ve GeNemo arama yetenekleri ve veri koleksiyon gelecekte onun izi genişletmek devam etmek için bekliyoruz.
The authors have nothing to disclose.
Bu eser NIH tarafından desteklenen DP1HD087990 NICHD, NHGRI üzerinden R01HG008135 üzerinden de dahil olmak üzere verir. Üyeler Zhong laboratuarının değerli geribildirim için teşekkür ederiz.
Yazar katkıları:
X.C. ve A.T.Z. GeNemo yeni arayüzü ve özellikleri tarafından kodlama güncelleme; A.T.Z. içi örnek video üretilen; A.T.Z., X.C ve S.Z. kağıt yazdı.