Summary

CorExplorer Web Portalı ile Tümör Gen Ekspresyonu Faktörlerinin Analizi

Published: October 11, 2019
doi:

Summary

Biz CorExplorer web portalı, tümör RNA sıralama faktörlerinin araştırılması için bir kaynak makine öğrenme algoritması CorEx (Korelasyon Açıklama) tarafından bulunan ve faktörlerin hayatta kalma, veritabanı ek açıklamaları göre analiz edilebilir göstermek tanıtmak protein-protein etkileşimleri, ve birbirleri tümör biyolojisi ve terapötik müdahaleler hakkında bilgi edinmek için.

Abstract

Diferansiyel gen ekspresyonu analizi hastalık durumlarını anlamak için önemli bir tekniktir. Makine öğrenimi algoritması CorEx hassas onkoloji ilerleyen için yararlı olabilecek bir şekilde tümör RNA-seq gen gruplarının diferansiyel ekspresyon analiz yarar göstermiştir. Ancak CorEx, mevcut anlayışa analiz etmek ve bağlanmak için zor olabilecek birçok faktör üretir. Bu tür bağlantıları kolaylaştırmak için, kullanıcıların verileri etkileşimli olarak keşfetmesine ve analiziyle ilgili sık sorulan soruları yanıtlamasına olanak tanıyan Bir web sitesi olan CorExplorer’ı kurduk. CorEx’i dört tümör tipi için RNA-seq gen ekspresyonu verileri konusunda eğittik: yumurtalık, akciğer, melanom ve kolorektal. Daha sonra karşılık gelen sağkalım, protein-protein etkileşimleri, Gen Ontolojisi (GO) ve Kyoto Gen ler ve Genomlar Ansiklopedisi (KEGG) yol zenginleştirmeleri ve faktör grafik görselleştirme ile ilişkilendirmek için web sitesine ısı haritaları dahil ettik. Burada, bu dış veri bağlamında öğrenilen tümör faktörlerinin önemini anlamak için veritabanının kullanımını göstermek için örnek protokoller kullanıyoruz.

Introduction

Sadece on yıl önce giriş bu yana, RNA-seq gen ekspresyonu ölçmek için her yerde bir araç haline gelmiştir1. Bunun nedeni, bir numunenin tüm transkripsiyonunun hızlı ve ucuz de novo profillemesini sağlamasıdır. Ancak, RNA-seq tümör verileri özünde karmaşık ve genellikle az örneklenmiş bir altta yatan biyoloji yansıtır, veri kendisi yüksek boyutlu ve gürültülü iken. Bu, güvenilir sinyalleri ayıklamak için önemli bir sorun teşkil etmektedir. CorEx algoritması bu gibi durumlarda ince desenler bulmak için çok değişkenli karşılıklı bilgi yararlanır2,3 . Bu teknik daha önce Kanser Genom Atlası (TCGA) yumurtalık tümörü RNA-seq örneklerini analiz etmek için uyarlanmış ve bu bağlamda daha yaygın olarak kullanılan analiz yöntemleri ne kadar önemli avantajlara sahip olduğu ortaya çıkmıştır4.

RNA-seq kullanımı onkoloji de dahil olmak üzere araştırma uygulamalarında son derece yaygın olmasına rağmen, bu çabalar klinik müdahaleler in amaçları için geniş kullanımına yol açmıştır5. Bunun nedenlerinden biri de, bu özel sorunlara yönelik kullanıcı dostu algoritmaların ve yazılımların eksikliğidir. Bu boşluğu kapatmaya yardımcı olmak için, CorEx makine öğrenme algoritması tarafından bulunan tümör RNA-seq örneklerinin gen ekspresyonu faktörlerini incelemek için çeşitli geçmişlerden araştırmacılara olanak sağlayacak CorExplorer web portalını tasarladık. CorExplorer portalı interaktif görselleştirme ve akciğer, kolon, melanomve yumurtalık 6,7,8,9 dahil olmak üzere birçok farklı tümör tiplerinden faktörlerin sorgulanması destekler 10, araştırmacılar veri bağıntıları ile elemek ve terapötik amaçlar için hasta tabakalamak için aday yolları belirlemek için yardımcı olmak amacıyla.

CorExplorer portalının çeşitli kullanıcı türleri için yararlı olabileceğini ugörüyoruz. Portal, genel veritabanlarında tümöral gen ekspresyonu farklılıklarını yönlendiren geniş faktörleri anlamak ve muhtemelen benzer tümörler bağlamında bireysel gen ekspresyonu profillerini yerleştirmek isteyen kullanıcı ile tasarlanmıştır. Özellik -lerini. Burada özetlenen temsili protokollere ek olarak, CorExplorer araştırmaları daha fazla test için hipotezler önermek, CorExplorer dışındaki veri kümelerinde CorEx bulgularını karşılaştırmak ve karşılaştırmak ve bağlanmak için bir başlangıç noktası olarak hizmet verebilir tek bir tümördeki bir veya birkaç genin patolojik ifade imzaları, eşgüdümlü olarak etkilenebilecek daha büyük gruplara. Son olarak, bu alanda başlayanlar için RNA-seq makine öğrenme uygulaması için kullanıcı dostu bir giriş olarak hizmet verebilir.

Protocol

1. İlgi çekici bir gen içeren faktörleri keşfetme Bir web tarayıcısı açın ve CorExplorer ana sayfası olan http://corex.isi.edu gidin. Hızlı Bağlantılaraltında sağ tarafta , TCGA yumurtalık kanseri verileri (Şekil 1’degösterilmiştir) eğitildi CorEx faktör grafiğinin bir özetini görmek için Yumurtalık (TCGA-OV) yanındaki + genişlet düğmesine tıklayın. İsteğe bağlı olarak, karşılaştırmak için başkalarına tıklayın. Faktör grafiklerini incelemeyi bitirdikten sonra,Akciğer (TCGA-LUAD)akciğer kanseri RNA-seq için CorExplorer sayfasına erişmek için.CorExplorer ‘Factor Graph’ penceresini kullanarak ilgi çekici bir gen için CorEx faktör grafiğini keşfedin. Fare imlecini faktör grafiği ekran penceresinin üzerine taşıyın. Her faktördeki en önemli genler ve farklı katmanlarda düğümler arasındaki bağlantılar gibi grafiğin ayrıntılarını görmek için fare kaydırma tekerleği veya trackpad kullanarak faktör grafiğine yakınlaştırın. Alternatif olarak, görünüm alanını veya düğümleri taşımak için tıklatın ve sürükleyin. Hedef geni bulmak için (burada BRCA1 kullanacağız), faktör grafiği penceresinin üst kısmındaki Gen açılır menüsüne tıklayın. Açılan listede seçmek için ‘BRCA1’ yazın ve BRCA1’in en güçlü şekilde ilişkili olduğu faktör olan görünüm etek 26’ya yakınlaştırma yapmak için İade tuşuna basın. Fareyi grafik ekranının üzerine yeniden konumlandırın ve Düzey 2 düğümünü, L2_8’i ve faktör 26’ya komşu olan ilişkili etkenleri görmek için uzaklaştırmak için kaydırın. Yalnızca Min bağlantı ağırlık kaydırıcısında belirtilen eşikten daha büyük ağırlığı olan genlerin gösterildiğini unutmayın. Faktörle ilişkili tüm genleri görmek için L1_26 düğümüne tıklayın ve açılan pencerede ek genleri yükle’yi seçin. ‘Bitti’ sözcüğü göründüğünde açılan pencereyi kapatın. Şimdi faktör grafiği penceresinin üzerindeki üstbilgi bölümüne geri dön ve Min bağlantı ağırlık değiştiriciyi yakalayın ve sürükleyin. Şimdi, bağlantı ağırlığı kaydırıcısı 0,05’e indikçe, BRCA2 de dahil olmak üzere L1_26 faktöründeki diğer genler ağırlık sırasına göre görünür. İsteğe bağlı olarak, düzeni geliştirmek için kapma ve sürükleyerek düğümleri yeniden konumlandırın. Faktöre göre hastaların tabakalaşmanın sağkalım penceresinde sorgulayarak sağkalımı nasıl etkilediğini belirleyin. Hayatta kalma penceresinde, p-val’e göre Sırala’yıkaldır , ardından faktör 26 için hayatta kalma eğrilerini göstermek için Tek Faktör açılır menüsünde faktör 26’yı seçin. X ekseni boyunca risk altındaki hasta sayısını göstermek için sağkalım grafiğini aşağı kaydırın. Ek Açıklama penceresinde sorgulayarak biyolojik işlevli çağrışımları bulun. Ek açıklama penceresinde, Yanlış Bulma Hızı (FDR) yerine faktör sayısına göre Faktör açılır menüsüsıralamak için, FDR sıralamasınıkaldırın. Faktöre yönelik zenginleştirme ek açıklamalarını göstermek için ek açıklama penceresinde açılan penceredeki faktör 26’yı seçmek için kaydırın ve tıklatın. DNA onarımı görünür olana kadar ek açıklama listesini aşağı kaydırın ve grafik ekranında sarı renkle vurgulanan ilişkili genleri hemen görmek için üzerine tıklayın. Şekil 2’ninorta paneline bakın. ‘DNA hasarına yanıt olarak içsel apoptotik sinyal yolu’ gibi seçili ek açıklamalı genler için zenginleştirilmiş olup olmadıklarına göre, faktörlerin kaybolup da farklı GO terimleri seçilip seçilmediğine dikkat edin. Farklı işlevsellik teki pencereler ekleyerek faktörleri daha da keşfedin. Üst menü çubuğundan, Pencere Ekle açılır menüsünden ÜFE seçerek bir protein-protein etkileşim ağı (ÜFE) penceresi ekleyin ve ardından ekran alanına ÜFE grafiği penceresi eklemek için Ekle düğmesini tıklatın. ÜFE grafiği penceresinde, protein-protein etkileşimlerini göstermek için ‘Katman1: 26’ faktörünü seçin. Bağlantıların yoğunluğuna dikkat edin. Üst menü çubuğundan, ÜFEyerine, Pencere Ekle açılır menüsünden Heatmap’i seçin ve ardından ekran alanına Bir ısı haritası penceresi eklemek için Ekle düğmesini tıklatın. Isı haritası penceresinde, gen ifade desenlerini göstermek için ‘Katman1: 26’ faktörünü seçin. Isı haritası penceresini alın ve yeniden konumlandırın, böylece hayatta kalma penceresi de görünür. Isı haritasının üst kısmında, turuncu/mavi/gri renkli çubuğun sağkalım grafiğindeki hasta risk tabakalarına nasıl karşılık olduğunu gözlemleyin. Sonuçlar Şekil 2’ninalt kısmında gösterilmiştir. 2. Gen ağırlığı, sağkalım ve ek açıklama verilerini kullanarak CorEx faktörlerinin filtrelendirilmesi ve yorumlanması Hayatta kalma ve küme kalitesini kullanarak ilgi çekici faktörler için filtre uygulayın. Üstteki Dataset açılır menüsünden TCGA_OVCA’yı seçerek TCGA yumurtalık kanseri RNA-seq için CorExplorer sayfasına gidin. Sayfa yüklendikten sonra, hayatta kalma penceresinden farklı tabakalar için en büyük sağkalım diferansiyeline sahip faktörün 114 olduğunu unutmayın. Faktör grafiği penceresinin üst kısmında Faktör açılır penceresinden ‘Katman1: 114’ seçeneğini belirleyin. Fare ile bağlantı ağırlığı kaydırıcısını alın ve 0,5’e kadar taşıyın. Faktör 114 ‘deki (1609) gen sayısının çok sayıda olmasının, hiçbirinin ağırlığı >0.35’e sahip olmadığının göreceli olarak zayıf bir kümeleme işaret ettiğini unutmayın. Daha sonra, hayatta kalma penceresindeki faktörlerin listesini genişletin ve ilişkili hayatta kalma eğrilerini göstermek için hayatta kalma penceresi açılır penceresinde ki bir sonraki en iyi faktörü seçin, faktör 39. Ek açıklama penceresinde ki faktör 39’u üzerine tıklayarak seçin. Önemli GO ve KEGG ek açıklamaları gösterilir. Faktör 39’daki genlerin biyolojik rolünü daha iyi anlamak için, mahalle ek açıklama bilgilerini kullanarak faktörleri aşağıdaki gibi yorumlayın. Faktör grafiği penceresinin üst kısmında, faktör açılır penceresinde ‘Katman1: 39’ faktörünü seçin. Daha sonra fareyi faktör grafiği penceresinin üzerine taşıyın ve tüm L2_14 kümesini 6 faktörle ortaya çıkarmak için uzaklaştırın: 14, 32, 39, 42, 52 ve 82 (Şekil 3’tegösterilmiştir). L2_14 düğümüne bağlı faktörlerin göreceli önemini anlamak için, L2_14 faktörlerinin her biri için sağkalım farklarını görüntüleyerek başlayın. Hayatta kalma penceresinde p-val’e göre sırala’yı kaldırın ve ardından art arda faktör numaralarının her birine tıklayın. Bunu yaparken, sadece 14, 32 ve 39 faktörleri bir hayatta kalma ilişkisi görüntülemek unutmayın. Şimdi üst menü çubuğundan, Pencere Ekle açılır menüsünden ÜFE’yi bir kez daha seçin. Görüntüleme alanına ÜFE grafiği penceresi eklemek için Ekle’ye basın. ÜFE grafiği penceresinde, önemli olan protein-protein etkileşimlerini göstermek için ‘Layer1: 52’ faktörünü seçin. Bu noktadaki pencerelerin örnek düzeni Şekil 3’tegösterilmiştir. StringDB çevrimiçi veritabanına bağlanmak için ÜFE penceresinin altındaki StringDB bağlantısını tıklatın. İlk ekrandan Devam et’i tıklatın ve üfe ağ genleri için çevrimiçi GO analizini almak için daha önce olduğu gibi ağ grafiğinin altındaki Analiz sekmesini seçin. Üst hücresel bileşen ‘MHC sınıf II protein kompleksidir.’ CorExplorer sekmesine ve ÜFE penceresine dönün ve bu kez faktör açılır penceresinden faktör 32’yi seçin. StringDB çözümlemesi için StringDB’deki bağlantı görünümüne tıklayın. Üst hücresel bileşeni ‘MHC sınıf I protein kompleksi,’ önceki adımda faktör 52 için sınıf II aksine! Son olarak, ÜFE penceresine geri dön ve üstteki faktör açılır menüsünden ‘Katman1: 39’ seçeneğini belirleyin. StringDB çözümlemesi için bağlantı bağlamak için StringDB’deki Görünüm bağlantısını tıklatın. İlk ekrandan Devam et’i tıklatın ve ardından ÜFE ağ genleri için çevrimiçi GO analizi almak için ağ grafiğinin altındaki Analiz sekmesini seçin. Üst moleküler fonksiyonun ‘CXCR3 kemokin reseptör bağlanması’ olduğunu gözlemleyin. 3. Umut verici terapötik kombinasyonları aramak için hayatta kalma ve veritabanı ek açıklamaları kullanma Dataset açılır menüsünden TCGA_SKCM’yi seçerek TCGA melanom CorExplorer’a geçin. En büyük sağkalım diferansiyel faktörüfaktör 171 olduğunu unutmayın. Kaydırma yaparak faktör 171 ek açıklamaları inceleyin ve ‘immün yanıt’ ve ‘sitokin aracılı sinyal yolu’ üst yakın olduğunu unutmayın (üst yumurtalık faktörü için olduğu gibi). Tamamlayıcı bir faktör bulmak için, üst ek açıklama terimleri ile birlikte üst sağkalım ile ilişkili faktörleri inceleyin. Bunu yapmak için, veri kümesi işleme ayrıntılarınıiçeren ayrı bir sekme ve sağkalım farkının p değerine göre en önemli faktörlerin bir özetini içeren ayrı bir sekme açmak için üst menü çubuğundaki Dataset genel bakış bağlantısını tıklayın. İlk bağışıklık dışı faktörün 88 olduğunu unutmayın. TCGA_SKCM tarayıcı sekmesine dönün. Hayatta kalma, ek açıklama ve grafik pencerelerinde faktör 88’i seçin. Üst birkaç GO terimleri ‘rRNA işleme’ ve ‘mitokondrion organizasyonu ile ilgilidir,’ bağışıklık ile ilgili faktörlerden farklı olarak teyit. Sağkalım penceresinde, eşleştirilmiş faktörler açılır, ’88_171′ kombine 171 ve 88 ekspresyon faktörleri için orta tabakadaki hastalar için sağkalım nasıl iyileştiğini görmek için seçin. Ek açıklama ve sağkalım karşılaştırmaları Şekil 4’tegösterilmiştir. 4. Arama sayfasını kullanarak tümör tipleri arasında gen ekspresyonu varyasyonu ortak noktaları nın ve farklılıklarının bulunması Ön sayfaya dönmek için CorExplorer başlığına tıklayın. CorExplorer sitesindeki tüm veri kümelerinde arama yapmaya izin veren bir sayfaya gitmek için üst menü çubuğundaki Arama’yı tıklatın. Gen arama kutusuna ‘FLT1’ (VEGFR1) girin ve Return tuşuna basın veya Aratuşuna basın. FLT1 aşağıdaki faktörlernispeten yüksek ağırlık ile bulunur: OVCA – 76, LUAD – 162, SKCM – 195 ve SKCM – 184 yanı sıra COAD – 112 ve COAD – 74. Alternatif olarak, tüm veri kümeleri arasında ilgili bir GO terimi arayın. ‘Angiogenesis’ yazarak ve Return tuşuna basarak veya Aratuşuna basarak bunu ‘GO Search’ kutusunda deneyin. Tüm FLT1 faktörleri, SKCM-195 hariç, istatistiksel olarak ‘anjiyogenez’ genler için zenginleştirilmiş olarak listelenmiştir-faktör 195 yok, aslında, ek açıklama var, ama varsayılan 10-8 eşiğinin altında. Bunun ve önceki adımın arama sonuçları Şekil 5’tegösterilmiştir. Diğer örnekler olarak, GO arama kutusunda, ilk tip ‘epidermal büyüme faktörü reseptörü.’ Sadece LUAD bu dönem için zenginleştirilmiştir, akciğer kanseri için iyi bilinen bir tabakalaşma faktörü. Ardından, arama kutusuna ‘mezenkimal’ yazın. Bu terim iyi çalışılmış bir tabakalaşma faktörü olduğu OVCA için gen ekspresyonu gruplarında zenginleştirilmiştir.

Representative Results

Akciğer kanseri dataset’inde ‘BRCA1’ geninin aranması, en güçlü şekilde CorEx faktörü 26 ile ilişkili olduğunu ortaya koymaktadır (Şekil 2). Bu faktör için GO dönem zenginleştirme son derece yüksek olduğu görülmektedir, DNA onarımı sadece bir FDR sergileyen 1 x 10-19. Seçim aynı zamanda çocuklar gibi altı yakından ilişkili faktörlere sahip ikinci düzey küme L2_8 dikkat çekiyor. GO terimi ek açıklamaları veya faktör grafiğin GO zenginleştirilmiş açılır bırakma özelliklerinde ‘DNA onarımı’ seçilmesi, her bir faktörde ilişkili genleri vurgular, faktör 26 beklendiği gibi en fazla olan11. Protein-protein etkileşim ağı güçlü bir şekilde birbirine bağlıdır ve faktör 26’daki genlerin sıkı bir şekilde birbirine bağlı işlevselliğini daha da destekler. İlişkili sağkalım grafiği hastanın sağkalım ile olası bir ilişki öneriyor, ancak bu daha büyük bir veri kümesi teyit edilmesi gerekir. Sağkalım ile başlayan belirli gen ekspresyonu grupları ile ilişkili geliştirilmiş sağkalım nedenleri diseksiyon izin verebilir. Örnek olarak, yumurtalık kanseriiçin sağkalımı etkileyen en önemli faktör, bağışıklık sistemi ile ilişkili genler için güçlü bir şekilde zenginleştirilmiş olan 39 rakamı olarak görülmektedir(Şekil 3). Aynı düzey 2 düğüm ile ilişkili diğer beş faktör de bağışıklık ilişkili olduğu belirtilmiştir, ancak sağkalım etkisi güçlü aralarında değişken gibi görünüyor, 39 en yüksek ve 52 en düşük olmak. Bir faktör için protein-protein etkileşim penceresi eklemek hemen etkileşim ağını gösterir ve PPI ağ genleri için çeşitli zenginleştirmeleri sorgulamak için StringDB12 web sitesine bağlantı sağlar. L2_14 faktörlerinin her biri için bunu yaparak, PPI ağ genleri için StringDB zenginleştirmelerinin hayatta kalma ile olan ilişkiler için aşağıdaki olası açıklamayı önerdiği ortaya çıkmaktadır. Faktör 32, sitotoksik T lenfositleri tarafından tanınan majör histokompatibilite kompleksini (MHC) sınıf I protein kompleksini oluşturan genler içerir. Faktör 39, CD8+ T lenfositleri ile ilişkili sitokin sinyalizasyonu ve CXCR3 reseptör bağlanmasına karşılık gelir. Bu faktörlerin her ikisi de ilgili genlerin nispeten yüksek ekspresyonu sergileyen hastalar için önemli bir sağkalım avantajı vermek gibi görünüyor. Sitotoksik CD8+ T lenfositler öncelikle anti-tümör bağışıklığı sorumludur. Faktör 52 ise, MHC sınıf II kompleksindeki proteinler için kodlayan ve doğrudan sitotoksik T lenfositler yerine CD4+ T yardımcı hücreleri tarafından tanınan genlerden oluşur. Kalan L2_14 faktörleri lenfosit popülasyonlarının iki tip ayırt etmez jeneralize bağışıklık sistemi aktivasyon yansıtır. MCH sınıf I hücresel antijenlerin sitotoksik T lenfosit tanımasına özgü bir sağkalım ilişkisi genel olarak antitümör bağışıklığı anlayışımız ve melanom 13 gibi diğer kanserlerden tutarlıdır13,14. Web portalı, etkili tümöre özgü kombinasyon tedavileri önerebilecek tamamlayıcı fonksiyonlara sahip faktörlerin çiftlerinin keşfini destekler. Dataset genel bakış sağkalım ile bir korelasyon gösteren faktörler için taranabilir ama farklı GO zenginleştirmeleri var. Melanom için (TCGA_SKCM; Şekil 4), üst sağkalım faktörü 171’in immün ilişkili olduğu görülürken, listedeki faktör 88 mitokondri organizasyonu ile ilgili genlerin zenginleşmesini göstermektedir. Nitekim, bu melanom bir hedef olarak ileri sürülmüşlerdir15. CorExplorer sayfasına sağkalım pencereleri eklemek, her iki grubun olumlu gen ekspresyonu desenlerinin her iki faktörden de daha iyi bir sağkalım eğilimi sergilediğini göstererek, faktör çiftini kullanarak tabakalaşmanın her faktörün karşılaştırmasını sağlar faktör tek başına. Üst tabaka ancak geliştirilmiş görünmüyor, immünoterapi sadece bazı hastalar için en iyi seçenek olabilir düşündüren. Tümörler arasındaki ortak özellikler ve farklılıklar, genler veya GO terimleri için veri kümeleri arasında araştırılarak görülebilir(Şekil 5). Örnek olarak, FLT1 (aka VEGFR1) iyi çalışılmış bir pro-anjiyojenik belirteç16,17. Arama çubuğuna konulduğunda, tüm tümörlerflt1 önemli bir rol oynadığı faktörlere sahiptir. Tersine, GO terimi ‘anjiyogenez’ arama sayfasına girildiğinde, FLT1 gruplarının 6’dan 5’i bu zenginleştirme ile görünür. SKCM-195 hariç tüm FLT1 faktörleri istatistiksel olarak ‘anjiyogenez’ genleri için zenginleştirilmiş olarak listelenmiştir. Altıncı faktör, aslında, ek var, ama varsayılan 10-8 eşiğinin altında. Faktör listesindeki ağırlıklandırma alternatif bir zenginleştirme hesap makinesinde kullanıldığında, örneğin Gen Seti Zenginleştirme Analizi (GSEA)18,altıncı faktörün ‘anjiyogenez’ genleri için de önemli ölçüde zenginleştirilmiş olduğu saptır. Gen ekspresyonu deseninin biyolojik yorumları destekleyecek yeterli kalitede olduğundan emin olmak için ısı haritalarını kontrol etmek önemlidir. Güçlü net varyasyon gösteren ısı haritaları, düşükten yükseğe veya daha karmaşık desenlere kadar, bazı genlerin düşük ekspresyonlu diğer genlerle ilişkili olduğu faktör genlerinin eşgüdümlü ekspresyonu gösterebilir(Şekil 6). Yüksek kaliteli gruplandırmanın önemli bir belirteci, faktör skorunun bir fonksiyonu olarak ifadede yumuşak bir varyasyona sahip çeşitli genlerin varlığıdır. Faktör ısı haritaları faktör puanına göre sıralanmış örnekleri gösterir, bu nedenle soldan sağa doğru düzgün bir degrade olmalıdır. Ancak, bu en az iki farklı şekilde gerçekleşmesi başarısız olabilir. En yaygın olarak, korelasyonlar son derece gürültülü olabilir(Şekil 5C),hayatta kalma ve / veya biyolojik fonksiyon ile ilgili herhangi bir çıkarımların sağlamlığı ve yarar soru içine çağıran. Ayrıca, örneklerin yalnızca küçük bir azınlığında meydana gelen desenler, CorEx algoritması tarafından kabul edilen üç ifade durumunun modeline uymayabilir ve bu da örneklerin yanıltıcı bir şekilde sınıflandırılmasıyla sonuçlanır (Şekil 5D’ninsağ tarafı). Şekil 1: CorExplorer ön sayfası. Hızlı Linkleraltında Yumurtalık Kanseri nin yanında + tıkladıktan sonra faktör grafiği ayrıntıları gösterilir. CorEx hiyerarşik modeli, alt katmandaki giriş değişkenlerinden (bu durumda gen ekspresyonu) ve üst katmanlarda çıkarılan gizli faktörlerden oluşur. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın. Şekil 2: Keşiflere rehberlik etmek için bir gen adı kullanmak. Rakam güçlü BRCA1 ile ilgili CorEx akciğer kanseri faktörlerinin keşif gösteren ekran görüntüleri bir dizi gösterir. İlk olarak, faktör grafiği için Gen açılır kutusunda ‘BRCA1’ seçilmesi, grafik görünümünün BRCA1’in en büyük ağırlığına sahip olduğu faktörü yakınlaştırmasına neden olur. Biraz uzaklaştırma, katmanı iki düğüm L2_8’i diğer ilgili lere bağlayan çerçevelere bağlar. Hayatta kalma ve ek açıklamalar karşılaştırılabilir: GO terimi DNA onarımtıklama açıklamalı genleri vurgulamaktadır. Faktördeki genler için ağ etkileşimlerini göstermek için bir ÜFE penceresi eklenir. Bir ısı haritası eklemek için Pencere Ekle düğmesini kullanarak, DNA onarım genlerinin artan ifade nin azalmış sağkalım ile ilişkili olabileceğini düşündüren, ifade desenleri yaşam ile ilişkilendirme gösterir. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın. Şekil 3: Keşiflere rehberlik etmek için klinik verilerin (sağkalım) kullanılması. Yumurtalık kanseri için üst sağkalım ilişkili faktör keşfetmek (39) komşu faktörler arasında ilginç ilişkiler ortaya koymaktadır. Faktör grafiğinde faktör 39’u seçtikten ve biraz uzaklaştırdıktan sonra, faktör 39’a bağlı iki faktörkatmanı ilişkili beş faktöre sahip olduğu görülmektedir. Ek bir hayatta kalma penceresi ilişkili sağkalım diferansiyel doğrudan karşılaştırma sağlar. 39 ve 32’deki faktörlerin her ikisi de pozitif sağkalım korelasyonuna sahip, faktör 52’nin aksine, ki göstermez. Protein-protein etkileşim ağlarının hepsi iyi tanımlanmıştır. StringDB’ye bağlanmak GO ek açıklamalarının karşılaştırılmasına izin verir (gösterilmez): Faktör 39 sitotoksik CD8+ T lenfosit aktivasyonu ile ilgili bir sitokin sinyal ağı ile ilişkilidir ve faktör 32, MHC sınıf I antijeni sunan proteinlerin hakimiyetindedir. bu tür lenfositler tarafından tetikleme tanıma; komşu faktörler, ancak, CD4 + yardımcı T hücreleri gibi diğer bağışıklık sistemi bileşenleri hakim ve hiçbir sağkalım korelasyon göstermektedir. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın. Şekil 4: Üst sağkalım faktörlerinin araştırılması potansiyel terapötik kombinasyonları göstermektedir. Ana sayfa menü çubuğundaki ‘Veri Kümeleri’ bağlantısı, üst GO ek açıklamasıyla birlikte p değerine göre sıralanmış hayatta kalma faktörlerinin kısa bir tablosuna yol açar (gösterilmez). Melanom için bu bilgileri kullanarak, faktör 171 kombinasyonu faktör 88 ile immün fonksiyon için mitokondri organizasyonu için tamamlayıcı görünür. Şekil, bunların karşıtlığını yapmak için her bir etken için ek açıklama pencerelerini yan yana gösterir. İki faktöre tek tek veya birlikte tabakalaştırılan hastalar için sağkalım eğrileri, kombinasyonun tek başına her iki faktöre göre sağkalım diferansiyelini artırdığını göstermektedir. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın. Şekil 5: Arama sayfası pan-kanser analizini kolaylaştırır. Genler veya GO biyolojik işlem terimleri ana sayfadaki Arama bağlantısını kullanarak tüm veri kümeleri için aranabilir. Şekil, FLT1 geni ve GO terimi ‘anjiyogenez’ için arama sonuçlarını göstermektedir. Sonuçlar, kanserler arasında ‘anjiyogenez’ terimi ile açıklamalı faktörlerde FLT1 varlığını göstermektedir. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın. Şekil 6: Isı haritaları, genler ve numuneler arasındaki korelasyonları faktör skoruna göre nitel olarak değerlendirmek için kullanılabilir. Yüksek kaliteli gen ekspresyonu ilişkileri, hastalar ısı haritalarında faktör skoru ile sıralandığında düzgün bir geçiş le gösterilir. Faktör 18 için en soldaki ısı haritası bir örnektir. Desenler, faktör 11’in orta büyük ısı haritasında olduğu gibi yukarı ve aşağı ifadenin karmaşık imzalarını da kapsayabilir. Daha düşük kalite desenleri bazen sağ daki faktör 161 ısı haritasında olduğu gibi sağdaki faktör 9 ısı haritasında olduğu gibi bir alt grup için ifadede ani değişiklikler gösterir. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.

Discussion

CorExplorer sitesi, corEx algoritması tarafından tümör RNA-seq öğrenilen maksimize korelasyon gen ekspresyonu faktörleriinteraktif keşif için kamuya açık bir web sunucusu sunduk. Web sitesinin hastaları tümör gen ekspresyonuna göre tabakalaşmak için nasıl kullanılabileceğini ve bu tabakalaşmanın biyolojik fonksiyon ve sağkalıma nasıl karşılık olduğunu gösterdik.

RNA-seq analizi için diğer web sunucuları oluşturulmuş. Tümörler için diferansiyel ve ko-ekspresyon analizi incelenebilir ve cbioPortal19,20diğer veri tipleri ile entegre edilebilir. GenePattern21, Mev22ve Morpheus23sunucuları, temel bileşen analizi (PCA), kmeans veya kendi kendini organize eden haritalar (SOM) gibi yerleşik kümeleme tekniklerini içerir. Daha yenilikçi çabalar CamurWeb24dahil, otomatik kural üreten sınıflandırıcı dayalı, ve TACCO25, rastgele orman sınıflandırıcılar ve kement uygular. Burada kullanılan CorEx algoritması, veri desenlerini açıklayan bir etkenler hiyerarşisi bulmak için çok değişkenli bilgileri optimize eder. Doğrusal olmayan ve hiyerarşik faktör öğrenme PCA4ile bulunan doğrusal küresel faktörlere göre geliştirilmiş yorumlanabilirlik verim gibi görünüyor. Buna ek olarak, tekniğin örnek sinyalleriniince taneli ayrıştaması, daha yaygın olarak kullanılan geniş alt tiplere göre hassas tümör karşılaştırmalarına olanak sağlar. Çakışan ve hiyerarşik faktör çözümlemesi bu birleşimi CorExplorer’ı diğer birçok yaklaşımdan ayırır ve görselleştirme ve özetleme için yeni araçlar gerektirir.

CorExplorer faktör analizinin önemli bir parçası sadece birkaç keşfetmek için yeteneği, ama 100’den fazla faktör bir örtüşen hiyerarşi içinde yerleştirilir bilgilendirici gen desenleri ile. CorExplorer biyolojik ve klinik dernekler için bu sayısız faktörlerin madenciliği kolaylaştırır ve bireysel tümörlerin son derece ayrıntılı karakterizasyonu için izin verir. Bu kadar çok sayıda faktörün denetimsiz olarak öğrenilmesi, hepsinin hastalık biyolojisi ile ilgili olmadığı anlamına gelir. Böyle bir durumda, ya ilgi faktörleri çekmek için ek açıklamalar veya bilinen genler kullanmak ya da hayatta kalma gibi klinik verilerle ilişkili faktörleri aramak esastır. Böylece, CorExplorer kullanıcıların bu çok önemli filtreleme adımı uygulamak için izin verir. Bir tümörfaktör gen desenleri varlığı bile kişiselleştirilmiş onkoloji tedavisi için bir yaklaşım önerebilir. Ayrıca, potansiyel olarak yararlı terapötik kombinasyonları keşfi için izin veren her tümör için faktör puanları nın çokluğu.

Bazen hayatta kalma ile son derece ilişkili faktörler için önemli BIR GO ek açıklamaları görünür durumda. Bu gürültülü veya örneklenmiş veri altında nedeniyle oluşabilir iken, önemli zenginleştirme puanları veya tutarlı biyolojik olmadan farklı yollardan tek genlerin bir ‘sepet’ olan grup çok küçük bir küme boyutu gibi diğer olası nedenleri vardır Derneği. Ayrıca, KEGG ve GO biyolojik sürecinden farklı bir ek açıklama kategorisi (örneğin hücresel bölme) uygun olabilir. Bunlara, protokolde gösterildiği gibi StringDB’ye bağlanarak erişilebilir. CorExplorer sitesinde Gen Ontoloji zenginleştirme analizi şu anda bir faktör gen ağırlıkiçin hesap yok, Bu büyük olasılıkla yakın gelecekte giderilmiş olacak olsa. Dış araçlarla daha fazla analiz için tüm faktör gen listesinin indirilemesine olanak tanıyan ‘Pencere Ekle’ seçeneğinin altında bir gen listesi seçeneği nin mevcut olduğunu unutmayın.

Web sitesinin amaçları doğrultusunda, CorEx her veri kümesinde beş kez çalıştırıldı ve en büyük toplam korelasyonla sonuçlanan çalışma korundu. Birden çok çalıştırmanın sonuçlarının istatistiksel bir temsiline sahip olmak daha bilgilendirici olabilir ve gelecekteki çalışmalar için bir hedeftir. Ayrıca, sunucuda mevcut tümör türleri kümesi oldukça küçük, ama bu kullanıcı ilgisine göre zaman içinde genişletmek için bekliyoruz.

Yukarıda belirtildiği gibi, CorExplorer klinik ve veritabanı bilgileri ile birlikte CorEx RNA-seq faktör ilişkileri görselleştirir, böylece sorgulama farklı modları çeşitli sağlayan. Bu aracın, onkolojide keşif ve klinik uygulama için RNA-seq analizinin gücünü kullanmak için daha fazla çalışmaya yol açacağından umutluyuz.

Disclosures

The authors have nothing to disclose.

Acknowledgements

GV, W911NF-16-0575 darpa ödülü ile desteklendi.

Materials

Public server for CorExplorer website USC http://corex.isi.edu Intel Xeon E5-2690 4-core 2.6 GHz, 8GB RAM. Backend architecture is LAMP: Linux, Apache, MySQL, PHP.
Web browser Google/Apple Chrome/Safari Verified web browsers.

References

  1. Petryszak, R., et al. The RNASeq-er API-a gateway to systematically updated analysis of public RNA-seq data. Bioinformatics. 33, 2218-2220 (2017).
  2. Steeg, G. V., Galstyan, A. Maximally Informative Hierarchical Representations of High-Dimensional Data. Proceedings of the Eighteenth International Conference on Artificial Intelligence and Statistics (AISTATS). , (2015).
  3. Ver Steeg, G., Galstyan, A. Discovering structure in high-dimensional data through correlation explanation. Advances in Neural Information Processing Systems. , (2014).
  4. Pepke, S., Ver Steeg, G. Comprehensive discovery of subsample gene expression components by information explanation: therapeutic implications in cancer. BMC medical Genomics. 10, 12 (2017).
  5. Byron, S. A., Van Keuren-Jensen, K. R., Engelthaler, D. M., Carpten, J. D., Craig, D. W. Translating RNA sequencing into clinical diagnostics: opportunities and challenges. Nature Reviews Genetics. 17, 257 (2016).
  6. Cancer Genome Atlas Research Network. Comprehensive molecular profiling of lung adenocarcinoma. Nature. 511, 543 (2014).
  7. Cancer Genome Atlas Network. Comprehensive molecular characterization of human colon and rectal cancer. Nature. 487, 330 (2012).
  8. Akbani, R., et al. Genomic classification of cutaneous melanoma. Cell. 161, 1681-1696 (2015).
  9. Cancer Genome Atlas Research Network. Integrated genomic analyses of ovarian carcinoma. Nature. 474, 609 (2011).
  10. Grossman, R. L., et al. Toward a shared vision for cancer genomic data. New England Journal of Medicine. 375, 1109-1112 (2016).
  11. Moynahan, M. E., Chiu, J. W., Koller, B. H., Jasin, M. Brca1 controls homology-directed DNA repair. Molecular Cell. 4, 511-518 (1999).
  12. Szklarczyk, D., et al. STRING v11: protein–protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets. Nucleic Acids Research. 47, 607-613 (2018).
  13. Durgeau, A., Virk, Y., Corgnac, S., Mami-Chouaib, F. Recent advances in targeting CD8 T-cell immunity for more effective cancer immunotherapy. Frontiers in Immunology. 9, 14 (2018).
  14. Sato, E., et al. Intraepithelial CD8+ tumor-infiltrating lymphocytes and a high CD8+/regulatory T cell ratio are associated with favorable prognosis in ovarian cancer. Proceedings of the National Academy of Sciences of the United States of America. 102, 18538-18543 (2005).
  15. De Moura, M. B., et al. Mitochondrial respiration-an important therapeutic target in melanoma. PLoS One. 7, 40690 (2012).
  16. Folkman, J., Merler, E., Abernathy, C., Williams, G. Isolation of a tumor factor responsible for angiogenesis. Journal of Experimental Medicine. 133, 275-288 (1971).
  17. Takahashi, S. Vascular endothelial growth factor (VEGF), VEGF receptors and their inhibitors for antiangiogenic tumor therapy. Biological and Pharmaceutical Bulletin. 34, 1785-1788 (2011).
  18. Subramanian, A., et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proceedings of the National Academy of Sciences of the United States of America. 102, 15545-15550 (2005).
  19. Cerami, E., et al. The cBio Cancer Genomics Portal: An Open Platform for Exploring Multidimensional Cancer Genomics Data. Cancer Discovery. 2, 401-404 (2012).
  20. Gao, J., et al. Integrative Analysis of Complex Cancer Genomics and Clinical Profiles Using the cBioPortal. Science Signalling. 6, 1 (2013).
  21. Reich, M., et al. GenePattern 2.0. Nature Genetics. 38, 500 (2006).
  22. Wang, Y. E., Kutnetsov, L., Partensky, A., Farid, J., Quackenbush, J. WebMeV: A Cloud Platform for Analyzing and Visualizing Cancer Genomic Data. Cancer Research. 77, 11-14 (2017).
  23. . Morpheus Available from: https://software.broadinstitute.org/morpheus (2019)
  24. Weitschek, E., Lauro, S. D., Cappelli, E., Bertolazzi, P., Felici, G. CamurWeb: a classification software and a large knowledge base for gene expression data of cancer. BMC Bioinformatics. 19, 354 (2018).
  25. Chou, P. -. H., et al. tACCo, a Database Connecting transcriptome Alterations, pathway Alterations and Clinical outcomes in Cancers. Scientific Reports. 9, 3877 (2019).

Play Video

Cite This Article
Pepke, S., Nelson, W. M., Ver Steeg, G. Analyzing Tumor Gene Expression Factors with the CorExplorer Web Portal. J. Vis. Exp. (152), e60431, doi:10.3791/60431 (2019).

View Video