Burada proteogenomic aracı mevcut PoGo ve hızlı, nicel, translasyon modifikasyon ve varyant için protokolleri etkin başvuru genleri üzerine kütle spektrometresi ile tanımlanan peptidler eşleme. Bu araç entegre ve proteogenomic ve ortogonal genomik veri ile arayüz oluşturma kişisel proteomik çalışmalar görselleştirmek için kullanım içindir.
Çapraz-hadis genler, tutanaklar ve proteinler arasında hücresel yanıt anahtarıdır; Bu nedenle, moleküler düzeyde ayrı varlıklar olarak analiz yavaş yavaş hücrelerdeki moleküler dinamiği anlayışı geliştirmek için bütünleştirici çalışmalar genişletilmiş. Görselleştirme ve proteomik diğer omics veri ile entegrasyonu için geçerli araçları için büyük ölçekli çalışmalar yetersizdir. Ayrıca, yalnızca temel sıra yakalamak tanımlamak, translasyonel modifikasyonlar ve Nefelometri atarak. Bu sorunlara yönelik olarak geliştirdiğimiz PoGo peptidler ilişkili translasyonel modifikasyonlar ve genom ek açıklama başvurmak için miktar ile eşleştirmek için. Ayrıca, aracın tek amino asit türevleri birleşmeyle özelleştirilmiş sıra veritabanlarından tespit peptidler eşlemeyi etkinleştirmek için geliştirilmiştir. PoGo bir komut satırı aracı olmakla birlikte, grafik arayüzü kolayca peptidler 25 tür Ensembl genom ek açıklama tarafından desteklenen eşlemek sigara biyoenformatik araştırmacılar PoGoGUI sağlar. Genomik alan dosya biçimlerinden oluşturulan çıktının ödünç alır ve bu nedenle, görselleştirme genom çoðu desteklenir. Büyük ölçekli çalışmalar için PoGo erişilebilir depoları da kolay bir proteogenomics veri paylaşımını etkinleştirmek genleri eşlenen veri oluşturmak için TrackHubGenerator tarafından desteklenmektedir. Küçük bir çaba ile bu araç peptidler genleri sadece bir kaç dakika içinde diğer kullanılabilir sıra kimlik tabanlı araçları daha iyi performans başvurmak için milyonlarca eşleyebilirsiniz. Bu iletişim kuralı proteogenomics haritalandırma yöntemiyle PoGo nicel, genel kullanıma sunulan veri kümeleri ve phosphoproteomics yanı sıra büyük ölçekli çalışmalar için en iyi yaklaşım gösterir.
Hücrelerde, genom, transcriptome ve Proteom iç ve dış uyaranlara yanıt modüle ve önde gelen sağlık ve hastalık için belirli işlevleri gerçekleştirmek için birbirleri ile etkileşim birbirini etkiler. Bu nedenle, karakterize ve genler, tutanaklar ve protein miktarının tam hücresel süreçleri anlamak için çok önemlidir. Yeni nesil sıralama (NGS) tanımlamak ve gen ve transkript ifade ölçmek için en sık uygulanan stratejileri biridir. Ancak, protein ifadesi yaygın olarak kütle spektrometresi (MS) tarafından değerlendirilir. MS teknolojisinde son on yılda önemli gelişmeler daha tam bir kimlik belgesi ve proteomes veri transcriptomics1ile karşılaştırılabilir yapmak, miktar sağladı. Proteogenomics ve multi-omics NGS ve MS veri tümleştirmek için yollar olarak hücresel süreçler çok sayıda moleküler seviyesine arasında değerlendirmek için güçlü yaklaşımlar alt kanser türlerinden belirlenmesi ve roman potansiyel uyuşturucu hedefleri kanser2 lider haline gelmiştir , 3. bu proteogenomics başlangıçta gen ve transkript ek açıklamalar4proteomik kanıt sağlamak için kullanılan unutmamak gerekir. Çeşitli genler daha önce kodlamayan olduğu düşünülen son zamanlarda büyük ölçekli insan dokusu veri kümeleri5,6,7dikkate alınarak reevaluation uğramıştır. Buna ek olarak, proteomik veri başarıyla olmayan model organizmalar8,9‘ ek açıklama çabaları desteklemek için kullanılır. Ancak, proteogenomic veri entegrasyonu daha fazla vurgu protein ifade genomik özellikleri ile ilgili olarak istismar ve çapraz-konuşmak transkript ve proteinler arasında kombine referans sistemi ve yöntemleri için sağlayarak aydınlatmak Co görselleştirme.
Ortak referans proteomik, transcriptomics ve genomik veri sağlamak için çok sayıda araç MS ile genom koordinatları10,11,12 tanımlanan eşleme peptidler için uygulanmıştır ,13,14,15,16,17. Yaklaşımlar eşleme başvuru, destek genom tarayıcılar ve entegrasyon Şekil 1‘ de gösterildiği gibi diğer proteomik araçlarla derecesi gibi yönleri farklı. Bazı araçlar ters çevrilmiş peptidler genom16üzerine harita, diğerleri peptid15nükleotid dizisi yeniden oluşturmak için bir arama motoru açıklamalı pozisyon bir protein ve gen ek açıklama içinde kullanın. Hala diğerleri peptidler11,13karşı eşlemek için genom 3 veya 6 çerçeve çevirisi kullanın. Son olarak, pek çok araç nükleotit dizileri atlamak ve amino asit dizisi Çeviriler RNA-sıralama eşlenen transkript peptidler ilişkili genom koordinatları10,12‘ yeeşlemek için bir orta kullanın, 14,17. Ancak, nükleotit dizileri çeviri yavaş bir süreçtir ve uygulamaya özel veri peptid eşleştirmeye yaymak hatalar yatkındır. Hızlı ve yüksek işlem hacmi eşleme için bir küçük ve kapsamlı referans önemlidir. Bu nedenle, bir standart protein ilişkili genom koordinatları ile genom eşleme için doğru peptid temel başvurudur. Roman proteogenomics, türevleri ve translasyonel modifikasyonlar (PTMs)2,3, birleşme gibi yönlerden son çalışmalar aracılığıyla ivme kazanmaktadır. Ancak, bunlar genellikle geçerli proteogenomic Şekil 1‘ de gösterildiği gibi araçlar haritalama tarafından desteklenmez. Hız ve eşleme kalitesini artırmak için PoGo geliştirilmiştir, peptidler genleri18‘ e hızlı ve nicel eşleme sağlayan bir araçtır. Buna ek olarak, PoGo en çok iki sıra değişik ve ek açıklama eklenen translasyonel modifikasyonlar ile peptidler eşleme sağlar.
PoGo nicel yüksek çözünürlüklü veri proteomes ve küresel değişiklikler yakalama hızlı artış ile başa çıkmak için geliştirilmiştir ve kişisel değişim ve hassas tıp gibi büyük ölçekli analizleri için merkezi bir yardımcı program sağlar. Bu makalede bu araç uygulanması translasyonel modifikasyon genomik özellikleri ile ilgili olarak varlığı görselleştirmek için. Ayrıca, bu makalede eşlenen peptidler alternatif yapıştırma olayları tanımlaması ve peptidler başvuru genom için uygulamaya özel değişken veri ile tanımlanan eşleme vurgulamaktadır. Bu iletişim kuralı PoGo bu işlevler göstermek için gurur arşiv19 indirilen kamuya veri kümeleri kullanır. Ayrıca, bu iletişim kuralını TrackHubGenerator uygulama genleri büyük ölçekli proteogenomics çalışmalar için eşlenmiş peptidler online erişilebilir merkezlerine oluşturulması için açıklar.
Bu protokolü nasıl yazılım aracı PoGo ve onun graphical kullanıcı arayüzey PoGoGUI peptidler genom koordinatları üzerine hızlı bir eşleme etkinleştirmek açıklar. Aracın nicel, translasyon modifikasyon ve değişken etkin eşleme için başvuru ek açıklama kullanarak genleri gibi benzersiz özellikler sunuyor. Bu yazı bir büyük ölçekli proteogenomic çalışma yöntemini gösterir ve diğer araçlar-18karşılaştırıldığında hız ve bellek verimlilik vurgular. TrackHubGenerator aracı ile birlikte, genomik online erişilebilir merkezlerine oluşturur ve genom bağlantılı veri, PoGo, onun graphical kullanıcı arayüzey ile hızlı bir şekilde genomik bağlamda verilerini görselleştirmek için sağlar büyük ölçekli proteogenomics çalışmalar. Ayrıca, biz varyant veritabanları ve nicel phosphoproteomics22,29karşı arama veri ile PoGo benzersiz özelliklerini göstermek.
Tek resimler, GCT dosyası gibi değerli görselleştirme ve peptid özellikleri ve genomik loci arasındaki bağlantılar sağlar. Ancak, bunlar üzerinde yalnız dayalı bir yorumu zor veya proteogenomics teklik, translasyonel modifikasyonlar ve nicel değerler gibi tek yönleri onların sınırlaması nedeniyle yanıltıcı olabilir unutmamak gerekir. Bu nedenle, dikkatli bir şekilde hangi çıktı dosyaları, seçenekleri ve kombinasyonları el altında proteogenomic soru için uygundur ve birleşimler değiştirmek seçmek önemlidir. Farklı örnekleri arasında miktar ile ilgili çalışmalar için daha uygun olabilir Örneğin, belirli bir genomik odağı için eşlemenin benzersiz hakkında bilgi, genomik özelliği7eklenti için çok değerli olabilir protein bereket29değişikliklere genomik özellikleri. Çıktının her ayarı için PoGo tarafından oluşturulan. Hiçbir çıktı oluşturulur ya da boş dosyaları çıkış klasörü’nde gösterilen halinde, istenilen içeriği ve gerekli dosya biçimi için giriş dosyaları kontrol etmek için tavsiye edilir. Nerede dosya biçimi veya içeriği takip PoGo beklentilerini durumlarda (Örneğin, sözde transkript çeviri dizileri içeren FASTA dosya transkriptleri nükleotit dizileri içerir), hata iletileri için Kullanıcı soracaktır giriş dosyaları kontrol edin.
Protokol ve aracın kısıtlamaları çoğunlukla genomik içinde yaygın olarak kullanılan dosya biçimlerini yeniden temel alır. Genomik içinde proteogenomic uygulamalar için kullanılan dosya biçimlerini repurposing belirli sınırlamalar tarafından eşlik ediyor. Gereksinimleri genomik merkezli genom görselleştirme için farklı ayarlar nedeniyle bunlar ve proteogenomic verileri, proteomik verilerden translasyonel modifikasyonlar görselleştirmek için ihtiyaç gibi. Bu genomik dosya biçimlerinde tek özellik kullanımı tarafından kısıtlanır. Birçok yaklaşımlar ve araçları proteomik güvenle peptid dizileri31,32,33,34içinde translasyonel modifikasyonlar yerelleştirmek geliştirilmiştir. Ancak, birden fazla değişiklik genom üzerinde benzersiz ve discernable şekilde görselleştirme genomik dosya biçimleri yapısı tarafından engelliyordu. Bu nedenle, aynı türden birden çok PTMs tek blok görselleştirme değişiklik sitelerin herhangi bir belirsizlik teşkil etmez ancak tek tek özellikleri teker teker görselleştirmek için farklı gereksinim genomik toplumdan sonucudur. Yine de, PoGo eşleme translasyonel modifikasyonlar genomik şekil öyle aynı derecede tek nükleotid türevleri etkisi translasyonel modifikasyonlar odaklı çalışmalar etkinleştirmek için genomik koordinatları üzerine bir avantaja sahiptir. PoGo kullanarak, değişken eşleme toplam eşlemeleri sayısını artırır. Ancak, eşlenen peptidler benzersiz renk kodlaması güvenilmez olanlardan güvenilir eşlemeleri vurgulamaktadır. Varyant peptidler bilinen tek nükleotid türevleri tanımlanan eşleme VCF biçimi versiyonlarında yanında eşlenen peptidler görselleştirme tarafından eşlik edilebilir. Bu şekilde bir varyant peptid güvenilmez bir eşleme gösteren renk kodu bilinen nükleotit değişken varlığı tarafından reddedildi.
PoGo kullanmak için önemli bir adım doğru dosyaları ve biçimleri kullanmaktır. Çevrilmiş transkript dizileri GTF biçiminde ek açıklama eşlik edecek protein sıraları olarak ana kriterler kullanılır. Başka bir önemli unsuru PoGo peptidler amino asit uyuşmazlıkları ile eşleştirmek için kullanmayı düşündüğü bellektir. Standart bir uygulama için yüksek bellek verimli iken mümkün eşlemeleri bir ya da iki uyuşmazlıkları ile önemli ölçüde ve katlanarak artan sayıda bellek kullanım18benzer şekilde üstel bir artış yol açar. Biz ilk peptidler uyuşmazlığı olmadan harita ve bunları kümesinden kaldırmak için bu iletişim kurallarını açıklandığı gibi aşamalı bir eşleme öneriyoruz. Sonraki daha önce eşlenmemiş peptidler sonra bir uyuşmazlığı kullanarak eşlenebilir ve yordamı için eşlenmemiş kalan peptidler iki eşleşmeme durumu ile tekrar edilebilir.
Beri kütle spektrometresi throughput önemli ölçüde artmıştır ve genomik arayüz oluşturma çalışmaları ve proteomik veri son yıllarda daha sık olmak, kolayca aynı koordinat sistemi verileri bu tür arayüz oluşturma aracı, vardır giderek vazgeçilmez. Burada sunulan araç genomik birleştirmek gerek ve proteomik verileri daha iyi bir bütünleştirici çalışmaların küçük ve büyük veri kümeleri arasında bir başvuru ek açıklama üzerine peptidler eşleyerek anlayış geliştirmek için yardımcı olacaktır. Cesaret, PoGo peptidler gen adaylar başvuru ek açıklama aynı biçiminde sağlanan ek açıklama desteklemeleri roman genlerin insan testis35ifade için eşlemek için uygulanmıştır. Burada sunulan yaklaşım peptid kimliği için kullanılan veritabanlarının bağımsızdır. Protokol kimlik yardımcı ve görselleştirme roman çevirisi ürünleri kullanarak çeviri dizilerinden giriş dosyaları uyarlanmış ve RNA-seq deneyler dosyalarından GTF ilişkili.
Çeşitli yaklaşımlar ve araçları özel uygulama senaryoları peptidler genomik koordinatları, RNA-sıralama destekli eşleştirme, genom sıra için doğrudan peptidler eşleme arasında değişen eşleştirmek için geniş bir yelpazesi ile tanıtılan10, olmuştur 11 , 12 , 13 , 14 , 15 , 16 , 17. ancak, bunlar doğru zaman translasyonel modifikasyon mevcut ve temel eşleme, RNA-sıralama okuma hataları peptid seviyeye yayılır peptidler eşlemek için bir hata neden olabilir. PoGo, özellikle bu engelleri aşmak için ve ortogonal genomik platformları ile tümleştirmek için nicel yüksek çözünürlüklü proteomik veri hızlı artış ile başa çıkmak için geliştirilmiştir. Burada açıklanan aracın yüksek üretilen iş iş akışları entegre edilebilir. Grafik arayüz PoGoGUI sayesinde araç kullanımı kolaydır ve hiçbir uzmanı Biyoinformatik Eğitimi gerektirir.
The authors have nothing to disclose.
Bu eser Wellcome Trust (WT098051) ve GENCODE projesine NIH grant (U41HG007234) tarafından finanse edildi.
PoGo (software) | NA | NA | https://github.com/cschlaffner/PoGo |
PoGoGUI (software) | NA | NA | https://github.com/cschlaffner/PoGoGUI |
TrackHubGenerator (software) | NA | NA | https://github.com/cschlaffner/TrackHubGenerator |
Integrative Genomics Viewer (software) | NA | NA | http://software.broadinstitute.org/software/igv/ |
UCSC genome browser (website) | NA | NA | https://genome.ucsc.edu/ |
GENCODE (website) | NA | NA | http://gencodegenes.org |
Ensembl (website) | NA | NA | http://ensembl.org |
bedToBigBed (software) | NA | NA | http://hgdownload.soe.ucsc.edu/admin/exe/ |
fetchChromSizes.sh (software) | NA | NA | http://hgdownload.soe.ucsc.edu/admin/exe/ |