Biz CorExplorer web portalı, tümör RNA sıralama faktörlerinin araştırılması için bir kaynak makine öğrenme algoritması CorEx (Korelasyon Açıklama) tarafından bulunan ve faktörlerin hayatta kalma, veritabanı ek açıklamaları göre analiz edilebilir göstermek tanıtmak protein-protein etkileşimleri, ve birbirleri tümör biyolojisi ve terapötik müdahaleler hakkında bilgi edinmek için.
Diferansiyel gen ekspresyonu analizi hastalık durumlarını anlamak için önemli bir tekniktir. Makine öğrenimi algoritması CorEx hassas onkoloji ilerleyen için yararlı olabilecek bir şekilde tümör RNA-seq gen gruplarının diferansiyel ekspresyon analiz yarar göstermiştir. Ancak CorEx, mevcut anlayışa analiz etmek ve bağlanmak için zor olabilecek birçok faktör üretir. Bu tür bağlantıları kolaylaştırmak için, kullanıcıların verileri etkileşimli olarak keşfetmesine ve analiziyle ilgili sık sorulan soruları yanıtlamasına olanak tanıyan Bir web sitesi olan CorExplorer’ı kurduk. CorEx’i dört tümör tipi için RNA-seq gen ekspresyonu verileri konusunda eğittik: yumurtalık, akciğer, melanom ve kolorektal. Daha sonra karşılık gelen sağkalım, protein-protein etkileşimleri, Gen Ontolojisi (GO) ve Kyoto Gen ler ve Genomlar Ansiklopedisi (KEGG) yol zenginleştirmeleri ve faktör grafik görselleştirme ile ilişkilendirmek için web sitesine ısı haritaları dahil ettik. Burada, bu dış veri bağlamında öğrenilen tümör faktörlerinin önemini anlamak için veritabanının kullanımını göstermek için örnek protokoller kullanıyoruz.
Sadece on yıl önce giriş bu yana, RNA-seq gen ekspresyonu ölçmek için her yerde bir araç haline gelmiştir1. Bunun nedeni, bir numunenin tüm transkripsiyonunun hızlı ve ucuz de novo profillemesini sağlamasıdır. Ancak, RNA-seq tümör verileri özünde karmaşık ve genellikle az örneklenmiş bir altta yatan biyoloji yansıtır, veri kendisi yüksek boyutlu ve gürültülü iken. Bu, güvenilir sinyalleri ayıklamak için önemli bir sorun teşkil etmektedir. CorEx algoritması bu gibi durumlarda ince desenler bulmak için çok değişkenli karşılıklı bilgi yararlanır2,3 . Bu teknik daha önce Kanser Genom Atlası (TCGA) yumurtalık tümörü RNA-seq örneklerini analiz etmek için uyarlanmış ve bu bağlamda daha yaygın olarak kullanılan analiz yöntemleri ne kadar önemli avantajlara sahip olduğu ortaya çıkmıştır4.
RNA-seq kullanımı onkoloji de dahil olmak üzere araştırma uygulamalarında son derece yaygın olmasına rağmen, bu çabalar klinik müdahaleler in amaçları için geniş kullanımına yol açmıştır5. Bunun nedenlerinden biri de, bu özel sorunlara yönelik kullanıcı dostu algoritmaların ve yazılımların eksikliğidir. Bu boşluğu kapatmaya yardımcı olmak için, CorEx makine öğrenme algoritması tarafından bulunan tümör RNA-seq örneklerinin gen ekspresyonu faktörlerini incelemek için çeşitli geçmişlerden araştırmacılara olanak sağlayacak CorExplorer web portalını tasarladık. CorExplorer portalı interaktif görselleştirme ve akciğer, kolon, melanomve yumurtalık 6,7,8,9 dahil olmak üzere birçok farklı tümör tiplerinden faktörlerin sorgulanması destekler 10, araştırmacılar veri bağıntıları ile elemek ve terapötik amaçlar için hasta tabakalamak için aday yolları belirlemek için yardımcı olmak amacıyla.
CorExplorer portalının çeşitli kullanıcı türleri için yararlı olabileceğini ugörüyoruz. Portal, genel veritabanlarında tümöral gen ekspresyonu farklılıklarını yönlendiren geniş faktörleri anlamak ve muhtemelen benzer tümörler bağlamında bireysel gen ekspresyonu profillerini yerleştirmek isteyen kullanıcı ile tasarlanmıştır. Özellik -lerini. Burada özetlenen temsili protokollere ek olarak, CorExplorer araştırmaları daha fazla test için hipotezler önermek, CorExplorer dışındaki veri kümelerinde CorEx bulgularını karşılaştırmak ve karşılaştırmak ve bağlanmak için bir başlangıç noktası olarak hizmet verebilir tek bir tümördeki bir veya birkaç genin patolojik ifade imzaları, eşgüdümlü olarak etkilenebilecek daha büyük gruplara. Son olarak, bu alanda başlayanlar için RNA-seq makine öğrenme uygulaması için kullanıcı dostu bir giriş olarak hizmet verebilir.
CorExplorer sitesi, corEx algoritması tarafından tümör RNA-seq öğrenilen maksimize korelasyon gen ekspresyonu faktörleriinteraktif keşif için kamuya açık bir web sunucusu sunduk. Web sitesinin hastaları tümör gen ekspresyonuna göre tabakalaşmak için nasıl kullanılabileceğini ve bu tabakalaşmanın biyolojik fonksiyon ve sağkalıma nasıl karşılık olduğunu gösterdik.
RNA-seq analizi için diğer web sunucuları oluşturulmuş. Tümörler için diferansiyel ve ko-ekspresyon analizi incelenebilir ve cbioPortal19,20diğer veri tipleri ile entegre edilebilir. GenePattern21, Mev22ve Morpheus23sunucuları, temel bileşen analizi (PCA), kmeans veya kendi kendini organize eden haritalar (SOM) gibi yerleşik kümeleme tekniklerini içerir. Daha yenilikçi çabalar CamurWeb24dahil, otomatik kural üreten sınıflandırıcı dayalı, ve TACCO25, rastgele orman sınıflandırıcılar ve kement uygular. Burada kullanılan CorEx algoritması, veri desenlerini açıklayan bir etkenler hiyerarşisi bulmak için çok değişkenli bilgileri optimize eder. Doğrusal olmayan ve hiyerarşik faktör öğrenme PCA4ile bulunan doğrusal küresel faktörlere göre geliştirilmiş yorumlanabilirlik verim gibi görünüyor. Buna ek olarak, tekniğin örnek sinyalleriniince taneli ayrıştaması, daha yaygın olarak kullanılan geniş alt tiplere göre hassas tümör karşılaştırmalarına olanak sağlar. Çakışan ve hiyerarşik faktör çözümlemesi bu birleşimi CorExplorer’ı diğer birçok yaklaşımdan ayırır ve görselleştirme ve özetleme için yeni araçlar gerektirir.
CorExplorer faktör analizinin önemli bir parçası sadece birkaç keşfetmek için yeteneği, ama 100’den fazla faktör bir örtüşen hiyerarşi içinde yerleştirilir bilgilendirici gen desenleri ile. CorExplorer biyolojik ve klinik dernekler için bu sayısız faktörlerin madenciliği kolaylaştırır ve bireysel tümörlerin son derece ayrıntılı karakterizasyonu için izin verir. Bu kadar çok sayıda faktörün denetimsiz olarak öğrenilmesi, hepsinin hastalık biyolojisi ile ilgili olmadığı anlamına gelir. Böyle bir durumda, ya ilgi faktörleri çekmek için ek açıklamalar veya bilinen genler kullanmak ya da hayatta kalma gibi klinik verilerle ilişkili faktörleri aramak esastır. Böylece, CorExplorer kullanıcıların bu çok önemli filtreleme adımı uygulamak için izin verir. Bir tümörfaktör gen desenleri varlığı bile kişiselleştirilmiş onkoloji tedavisi için bir yaklaşım önerebilir. Ayrıca, potansiyel olarak yararlı terapötik kombinasyonları keşfi için izin veren her tümör için faktör puanları nın çokluğu.
Bazen hayatta kalma ile son derece ilişkili faktörler için önemli BIR GO ek açıklamaları görünür durumda. Bu gürültülü veya örneklenmiş veri altında nedeniyle oluşabilir iken, önemli zenginleştirme puanları veya tutarlı biyolojik olmadan farklı yollardan tek genlerin bir ‘sepet’ olan grup çok küçük bir küme boyutu gibi diğer olası nedenleri vardır Derneği. Ayrıca, KEGG ve GO biyolojik sürecinden farklı bir ek açıklama kategorisi (örneğin hücresel bölme) uygun olabilir. Bunlara, protokolde gösterildiği gibi StringDB’ye bağlanarak erişilebilir. CorExplorer sitesinde Gen Ontoloji zenginleştirme analizi şu anda bir faktör gen ağırlıkiçin hesap yok, Bu büyük olasılıkla yakın gelecekte giderilmiş olacak olsa. Dış araçlarla daha fazla analiz için tüm faktör gen listesinin indirilemesine olanak tanıyan ‘Pencere Ekle’ seçeneğinin altında bir gen listesi seçeneği nin mevcut olduğunu unutmayın.
Web sitesinin amaçları doğrultusunda, CorEx her veri kümesinde beş kez çalıştırıldı ve en büyük toplam korelasyonla sonuçlanan çalışma korundu. Birden çok çalıştırmanın sonuçlarının istatistiksel bir temsiline sahip olmak daha bilgilendirici olabilir ve gelecekteki çalışmalar için bir hedeftir. Ayrıca, sunucuda mevcut tümör türleri kümesi oldukça küçük, ama bu kullanıcı ilgisine göre zaman içinde genişletmek için bekliyoruz.
Yukarıda belirtildiği gibi, CorExplorer klinik ve veritabanı bilgileri ile birlikte CorEx RNA-seq faktör ilişkileri görselleştirir, böylece sorgulama farklı modları çeşitli sağlayan. Bu aracın, onkolojide keşif ve klinik uygulama için RNA-seq analizinin gücünü kullanmak için daha fazla çalışmaya yol açacağından umutluyuz.
The authors have nothing to disclose.
GV, W911NF-16-0575 darpa ödülü ile desteklendi.
Public server for CorExplorer website | USC | http://corex.isi.edu | Intel Xeon E5-2690 4-core 2.6 GHz, 8GB RAM. Backend architecture is LAMP: Linux, Apache, MySQL, PHP. |
Web browser | Google/Apple | Chrome/Safari | Verified web browsers. |