概要

Translasyon modifikasyon ve varyant için hızlı ve nicel Yöntem peptidler genleri için eşleme etkin

Published: May 22, 2018
doi:

概要

Burada proteogenomic aracı mevcut PoGo ve hızlı, nicel, translasyon modifikasyon ve varyant için protokolleri etkin başvuru genleri üzerine kütle spektrometresi ile tanımlanan peptidler eşleme. Bu araç entegre ve proteogenomic ve ortogonal genomik veri ile arayüz oluşturma kişisel proteomik çalışmalar görselleştirmek için kullanım içindir.

Abstract

Çapraz-hadis genler, tutanaklar ve proteinler arasında hücresel yanıt anahtarıdır; Bu nedenle, moleküler düzeyde ayrı varlıklar olarak analiz yavaş yavaş hücrelerdeki moleküler dinamiği anlayışı geliştirmek için bütünleştirici çalışmalar genişletilmiş. Görselleştirme ve proteomik diğer omics veri ile entegrasyonu için geçerli araçları için büyük ölçekli çalışmalar yetersizdir. Ayrıca, yalnızca temel sıra yakalamak tanımlamak, translasyonel modifikasyonlar ve Nefelometri atarak. Bu sorunlara yönelik olarak geliştirdiğimiz PoGo peptidler ilişkili translasyonel modifikasyonlar ve genom ek açıklama başvurmak için miktar ile eşleştirmek için. Ayrıca, aracın tek amino asit türevleri birleşmeyle özelleştirilmiş sıra veritabanlarından tespit peptidler eşlemeyi etkinleştirmek için geliştirilmiştir. PoGo bir komut satırı aracı olmakla birlikte, grafik arayüzü kolayca peptidler 25 tür Ensembl genom ek açıklama tarafından desteklenen eşlemek sigara biyoenformatik araştırmacılar PoGoGUI sağlar. Genomik alan dosya biçimlerinden oluşturulan çıktının ödünç alır ve bu nedenle, görselleştirme genom çoðu desteklenir. Büyük ölçekli çalışmalar için PoGo erişilebilir depoları da kolay bir proteogenomics veri paylaşımını etkinleştirmek genleri eşlenen veri oluşturmak için TrackHubGenerator tarafından desteklenmektedir. Küçük bir çaba ile bu araç peptidler genleri sadece bir kaç dakika içinde diğer kullanılabilir sıra kimlik tabanlı araçları daha iyi performans başvurmak için milyonlarca eşleyebilirsiniz. Bu iletişim kuralı proteogenomics haritalandırma yöntemiyle PoGo nicel, genel kullanıma sunulan veri kümeleri ve phosphoproteomics yanı sıra büyük ölçekli çalışmalar için en iyi yaklaşım gösterir.

Introduction

Hücrelerde, genom, transcriptome ve Proteom iç ve dış uyaranlara yanıt modüle ve önde gelen sağlık ve hastalık için belirli işlevleri gerçekleştirmek için birbirleri ile etkileşim birbirini etkiler. Bu nedenle, karakterize ve genler, tutanaklar ve protein miktarının tam hücresel süreçleri anlamak için çok önemlidir. Yeni nesil sıralama (NGS) tanımlamak ve gen ve transkript ifade ölçmek için en sık uygulanan stratejileri biridir. Ancak, protein ifadesi yaygın olarak kütle spektrometresi (MS) tarafından değerlendirilir. MS teknolojisinde son on yılda önemli gelişmeler daha tam bir kimlik belgesi ve proteomes veri transcriptomics1ile karşılaştırılabilir yapmak, miktar sağladı. Proteogenomics ve multi-omics NGS ve MS veri tümleştirmek için yollar olarak hücresel süreçler çok sayıda moleküler seviyesine arasında değerlendirmek için güçlü yaklaşımlar alt kanser türlerinden belirlenmesi ve roman potansiyel uyuşturucu hedefleri kanser2 lider haline gelmiştir , 3. bu proteogenomics başlangıçta gen ve transkript ek açıklamalar4proteomik kanıt sağlamak için kullanılan unutmamak gerekir. Çeşitli genler daha önce kodlamayan olduğu düşünülen son zamanlarda büyük ölçekli insan dokusu veri kümeleri5,6,7dikkate alınarak reevaluation uğramıştır. Buna ek olarak, proteomik veri başarıyla olmayan model organizmalar8,9‘ ek açıklama çabaları desteklemek için kullanılır. Ancak, proteogenomic veri entegrasyonu daha fazla vurgu protein ifade genomik özellikleri ile ilgili olarak istismar ve çapraz-konuşmak transkript ve proteinler arasında kombine referans sistemi ve yöntemleri için sağlayarak aydınlatmak Co görselleştirme.

Ortak referans proteomik, transcriptomics ve genomik veri sağlamak için çok sayıda araç MS ile genom koordinatları10,11,12 tanımlanan eşleme peptidler için uygulanmıştır ,13,14,15,16,17. Yaklaşımlar eşleme başvuru, destek genom tarayıcılar ve entegrasyon Şekil 1‘ de gösterildiği gibi diğer proteomik araçlarla derecesi gibi yönleri farklı. Bazı araçlar ters çevrilmiş peptidler genom16üzerine harita, diğerleri peptid15nükleotid dizisi yeniden oluşturmak için bir arama motoru açıklamalı pozisyon bir protein ve gen ek açıklama içinde kullanın. Hala diğerleri peptidler11,13karşı eşlemek için genom 3 veya 6 çerçeve çevirisi kullanın. Son olarak, pek çok araç nükleotit dizileri atlamak ve amino asit dizisi Çeviriler RNA-sıralama eşlenen transkript peptidler ilişkili genom koordinatları10,12‘ yeeşlemek için bir orta kullanın, 14,17. Ancak, nükleotit dizileri çeviri yavaş bir süreçtir ve uygulamaya özel veri peptid eşleştirmeye yaymak hatalar yatkındır. Hızlı ve yüksek işlem hacmi eşleme için bir küçük ve kapsamlı referans önemlidir. Bu nedenle, bir standart protein ilişkili genom koordinatları ile genom eşleme için doğru peptid temel başvurudur. Roman proteogenomics, türevleri ve translasyonel modifikasyonlar (PTMs)2,3, birleşme gibi yönlerden son çalışmalar aracılığıyla ivme kazanmaktadır. Ancak, bunlar genellikle geçerli proteogenomic Şekil 1‘ de gösterildiği gibi araçlar haritalama tarafından desteklenmez. Hız ve eşleme kalitesini artırmak için PoGo geliştirilmiştir, peptidler genleri18‘ e hızlı ve nicel eşleme sağlayan bir araçtır. Buna ek olarak, PoGo en çok iki sıra değişik ve ek açıklama eklenen translasyonel modifikasyonlar ile peptidler eşleme sağlar.

PoGo nicel yüksek çözünürlüklü veri proteomes ve küresel değişiklikler yakalama hızlı artış ile başa çıkmak için geliştirilmiştir ve kişisel değişim ve hassas tıp gibi büyük ölçekli analizleri için merkezi bir yardımcı program sağlar. Bu makalede bu araç uygulanması translasyonel modifikasyon genomik özellikleri ile ilgili olarak varlığı görselleştirmek için. Ayrıca, bu makalede eşlenen peptidler alternatif yapıştırma olayları tanımlaması ve peptidler başvuru genom için uygulamaya özel değişken veri ile tanımlanan eşleme vurgulamaktadır. Bu iletişim kuralı PoGo bu işlevler göstermek için gurur arşiv19 indirilen kamuya veri kümeleri kullanır. Ayrıca, bu iletişim kuralını TrackHubGenerator uygulama genleri büyük ölçekli proteogenomics çalışmalar için eşlenmiş peptidler online erişilebilir merkezlerine oluşturulması için açıklar.

Protocol

1. hazırlık, karşıdan yükleme ve kurulum Not: Dosya ve klasör yolu örnekler standart kullanıcılar için erişim kolaylığı için bir Windows biçiminde gösterilir. PoGo ve PoGoGUI aynı zamanda macOS ve Linux işletim sistemleri için kullanılabilir. PoGo ve PoGoGUI GitHub download Bir web tarayıcısı açın ve PoGo GitHub (http://github.com/cschlaffner/PoGo/) gidin. Bültenleri seçin ve en son yayın ZIP sıkıştırılmış dosyasını karşıdan yükleyin. Sıkıştırılmış dosya (Örneğin, C:\PoGo\executables\) yürütülebilir dosyaları klasöre ayıklayın. PoGoGUI (http://github.com/cschlaffner/PoGoGUI/) GitHub için web tarayıcısında gidin. Bültenleri seçin ve en son sürüm jar dosyasını (Örneğin, “PoGoGUI-v1.0.2.jar”) karşıdan yükleyin. Belgili tanımlık kavanoz eğe yürütülebilir dosyaları klasöründe saklayın. Genom ek açıklama ve çevrilmiş protein kodlayıcı dizileri indirNot: GENCODE7 (www.gencodegenes.org) veya Ensembl20 (www.ensembl.org) genel aktarım biçimi (GTF) ve protein serilerinde genom ek açıklama ve desteklenen türler için çevrilmiş protein kodlayıcı dizileri indir FASTA formatı. Web tarayıcısında, www.gencodegenes.org için gidin ve veri seçin | İnsan | Son sürüm. Kapsamlı gen ek açıklama GTF link download ve hulâsa belgili tanımlık gz-basmak eğe içine belgili tanımlık veri ağıl (Örneğin, C:\PoGo\Data\) ayıklama tamamlandığında şunu bir programı (Örneğin, 7-Zip) kullanarak. FASTA bağlantı yoluyla Protein kodlayıcı transkript çeviri dizileri download ve önceki adımda oluşturulan veri klasörü içine gz sıkıştırılmış dosyayı ayıklamak. Alternatif olarak, www.ensembl.org için web tarayıcısında gidin ve Download veri FTP üzerindentarafından takip siteleri seçin. (Örneğin, insan) desteklenen bir tür bulmak. GTF bağlantı Gene ayarla sütunda kullanarak transkript ek açıklama için en yeni sürüm dosyasını indirin. Adı yapısı “species.release.gtf.gz” dosyasıyla seçin ve hulâsa belgili tanımlık gz-basmak eğe içine belgili tanımlık veri ağıl. Protein sıra (FASTA) sütununda protein kodlayıcı transkript çeviri dizileri FASTA kullanarak bağlantı en son sürümü indirin. Seçmek belgili tanımlık eğe “species.release.pep.all.fa.gz” adı yapısı ile ve hulâsa belgili tanımlık gz-basmak eğe içine belgili tanımlık veri ağıl. Peptid tanımlama dosyaları hazırlayınNot: PoGo yalnızca örnek tanımlayıcısı, peptit dizisi, peptid-spektrum-maçlar (PSMs) ve sayısal değer içeren bir 4-sütun biçimini destekler. Ancak, PoGoGUI destekler Standart kimlik dosya formatları mzIdentML, mzid ve mzTab ve onları kamuya framework ms-veri-core-API21kullanarak PoGo’nın 4 sütunlu biçimine dönüştürür. MzIdentML, mzid veya mzTab biçiminde dosyaları-ebilmek var olmak downloaded–dan gurur arşiv19. Alternatif olarak, veri uzantısı .tsv veya .pogo ile bir sekmeyle ayrılmış dosya biçiminde sağlanabilir. Biçimi aşağıdaki sütun başlıkları ile 4 sütun içerir: örnek tanımlayıcısı (örnek), peptid dizileri (peptid), peptid-spektrum-maçlar (PSMs) ve peptid Nefelometri (Quant) sayısı. Bir örnek Şekil 2′ de gösterilmiştir. GURUR arşiv19 (https://www.ebi.ac.uk/pride/archive/projects/PXD006465/files22) insan testis bir proteomik çalışma mzTab formatında bir örnek dosya indirmek. Kaydedin ve 1.2.1. adımda oluşturduğunuz veri klasörü içine gz sıkıştırılmış dosyayı ayıklamak.Not: Alternatif olarak, örnek veriler insan phosphoproteomics MaxQuant ile gurur Arşivi (dosya “Traktman_2013_MaxQuantOutput-full.zip” https://www.ebi.ac.uk/pride/archive/projects/PXD005246/files23) üzerinden arama için download. Kaydedin ve 1.2.1 adımda oluşturulan veri klasörü ZIP sıkıştırılmış dosyayı ayıklayabilirsiniz. Boş bir e-tabloyu açın ve peptides.txt dosyasının klasöründen C:/PoGo/veri/Traktman_2013_MaxQuantOutput-tam/kombine/txt almak/ veri seçeneğini kullanarak | Metin/CSV üzerinden. Açılış penceresinde Düzenle’ yi tıklatın. “Sıra”, “Deneme BR1”, “Deneme BR2”, “Deney BR3”, “Oranı H/L BR1 normalleştirilmiş”, “Oranı H/L BR2 normalleştirilmiş” ve “Oranı H/L BR3 normalleştirilmiş” dışında tüm sütunları kaldırmak. Sütunları seçin “Oranı H/L BR1 normalleştirilmiş”, “Oranı H/L BR2 normalleştirilmiş” ve “Oranı H/L BR3 normalleştirilmiş” ve dönüşümü tıklatın | Sütunları unpivot. “Deney BR1”, “Deneme BR2” ve “Deney BR3” sütun seçin ve UNPIVOT işlemini yineleyin. “Özniteliği” sonuç sütunu seçin ve dönüşümü kullanarak içeriklerini ayırmak | Sütunu bölmek | Sınırlayıcı tarafından. Damla-aşağı yemek listesi içinde sınırlayıcı olarak alan seçin. Sütun “Attribute.1” için işlemi yineleyin. “Attribute.1.1”, “Attribute.2”, “Attribute.3” ve “Attribute.1.1.1” elde edilen sütunları kaldırın. Ekle sütun kullanarak bir sütun ekler | Özel sütun seçeneği. Aşağıdakileri temsil etmek için özel sütun formülü uyum: “[Attribute.4]=[Attribute.1.2] =”. “FALSE”; içeren tüm satırların filtre uygulamak için oluşturulan özel sütun için filtre uygulama “TRUE” içeren tek satırların kalacaktır. “Attribute.1.2” ve “Özel” sütunları kaldırmak ve kalan sütunları sırasını değiştirmek için aşağıdaki: “Attribute.4”, “Sıra”, “Value.1” ve “Değer”. Sütun adları “Deney”, “Peptid”, “PSMs” ve “Quant”, sırasıyla değiştirin. Ana sayfa kullanarak dosya yüklemek | Kapatın ve yük. Dosyası kullanan sekmeyle ayrılmış bir dosya kaydedin | Kaydet ve “Metin (sekme sınırlı) (*.txt)” türü seçin. “Peptides_pogo.txt” adı değiştirin ve C:/PoGo/Data klasörüne kaydedin. 2. peptidler açıklamalı translasyonel modifikasyonlar ve Nefelometri dahil olmak üzere görselleştirme ile eşleme Not: Elde edilen çıktı dosyası-ebilmek var olmak yüklü tarayıcı genişletilebilir veri (yatak) biçimini destekleyen herhangi bir genom tarayıcı. Bir seçimdir tarayıcılar (Bu aşağıda kullanılır) bütünleştirici genom tarayıcı (IGV)24 , UCSC genom tarayıcı25ve Ensembl genom tarayıcı20. PoGo eşleme için kullanılan ek açıklama GTF ve protein FASTA sürümleri genom genom tarayıcı sürümüyle eşleşen unutmamak gerekir. İnsan Ensembl bültenleri 57-75 ve GENCODE sürümleri 3d-19 için GRCh37/hg19 Ensembl sürümleri 76 veya daha yüksek ve GENCODE 20 veya daha yüksek için GRCh38/hg38 kullanın. Fare Ensembl sürümler 74 veya daha yüksek ve GENCODE M2 veya daha yüksek, GRCm38 kullanın. PoGoGUI kullanarak peptidler göster (bkz. Şekil 3). Yürütülebilir dosyaları klasöre gidin. PoGoGUI-vX.X.X.jarsimgesini çift tıklatarak programı başlatın.Not: Grafik kullanıcı arayüzü başlamak ve kolay ve görsel çeşitli seçenekleri sağlar. “PoGo yürütülebilir” yanındaki Seç düğmesini kullanın. Sonra ilgili işletim sistemi alt klasörü (Örneğin, C:\PoGo\Executables\Windows\) yürütülebilir dosyaları klasöre gidin. PoGo (Örneğin, PoGo.exe) yürütülebilir dosyayı seçin ve Aç düğmesini tıklatarak kendi seçimi onaylayın. Protein serileri için başvuru giriş dosyası seçintıklatarak seçin. Veri klasörüne gidin ve çeviri FASTA dosyasını seçin. Onun seçimi Aç düğmesini tıklayarak onaylayın. Seçin düğmesini kullanarak transkript ek açıklama dosyasını seçin. Veri klasörüne gidin ve ek açıklama GTF dosyasını seçin. Seçileni Aç düğmesini tıklayarak onaylayın. Peptid kimlik dosya Ekle — birden çok dosya seçimi etkin — “Peptid dosyalar yanındaki” Ekle düğmesini kullanarak. Desteklenen biçim mzTab, mzIdentML veya mzid veya indirilen ve 1.3 adımda hazırlanan sekmeyle ayrılmış 4 sütun biçiminde bir dosyayı seçin. YATAK ve GTF yanındaki onay kutularını çıkış biçimleri seçim işaretini kaldırın. Sadece PTM yatak ve kontrol GCT bırakın. Veriler için uygun türü aþaðý açýlan seçimden seçin. FASTA dosya, GTF dosya ve açılan seçim için aynı tür olduğunu esastır. Başlat düğmesini tıklatarak eşleme başlatın.Not: gerekirse, PoGoGUI giriş pogo formatına, pogo dosyaları aynı klasörde gelecekteki kolaylık sağlamak ve eşleme işlemi başlatın. 1.3.1. adımda karşıdan bir tek mzTab dosya dönüştürme eşleme başlar önce 10-20 dk arasında sürecek. Bütünleştirici genomik görüntüleyicide görüntülenmesiNot: Bkz. Şekil 4. “_Ptm.bed” IGV dosya ile biten PoGo çıktı dosyasını yüklemek | Yükleme dosyasından ve dosyayı seçin.Not: büyüklüğü nedeniyle, bazı dosyaların genomik bölgelerinde hızlı bir yeniden izin vermek için dizin oluşturulmasını gerektirebilir. IGV otomatik olarak üretimi için izin ister. Belirtilen yönergeleri izleyin. “_Noptm.bed” biten dosya yükleme adımı yineleyin. Bu dosyada, tüm peptidler herhangi bir değişiklik olmadan bulundu. Yüklenen her dosya ayrı parça parça tanımlayan dosya adıyla gösterilecek dikkat edin. Parça listede istediğiniz konuma sürükleyip bırakarak tarafından yeniden sıralayın. Not her parça başlangıçta daraltılmış bir şekilde gösterilir. Bunları genişletmek için doğru tıkırtı üstünde belgili tanımlık parça ad ve peptidler dizileri de dahil olmak üzere tam bir görünümü için genişletilmiş veya ezilmiş yığılmış görmek için seçin. “.Gct” biten dosya yükleme adımı yineleyin. Bu dosyada, ek açıklama eklenen örnek başına peptid Nefelometri. Farklı olarak yukarıda, yüklü dosyalar için ek açıklama eklenen her örnek ayrı bir parça olarak yüklenir. Örnekleri ile sürükle ve bırak işlemlerini yeniden Düzenle. Bir kromozom aþaðý açýlan menüsünden seçerek genom içinde gezinmek, genomik koordinatları yazın, bir gen simge arama tıklatın veya bir bölümünü yakınlaştırmak için bir kromozom seçmek için basılı tutun. 3. başvuru genom özel bir varyant veritabanına aracılığıyla tespit peptidler eşleme Not: PoGo eşleme grafik kullanıcı arabirimi (GUI) kullanarak veya komut satırı arabirimi aracılığıyla yapılabilir. Onlar değiştirilebilir. Protokol bu bölümde, komut satırı arabirimi dönüşebilirliği vurgulamak için kullanılır. Bu iletişim kuralı bölümün ikinci kısmında yazılım aracı R26gerektirir. Lütfen paket yüklü olduğundan emin olun. Başvuru peptidler başvuru genom eşleyin. Bir buyurmak-e sevketmek (cmd) açın ve PoGo (Örneğin, C:\PoGo\Executables\) yürütülebilir dosyaları klasöre gidin. Aşağıdaki komutu yazın:PoGo.exe – gtf \PATH\TO\GTF – fasta \PATH\TO\FASTA-\PATH\TO\IN içinde-yatak format-tür MYSPECIES \PATH\TO\GTF, \PATH\TO\FASTA ve \PATH\TO\IN ek açıklama GTF, protein sıra FASTA ve peptid tanımlama dosyasında (4 sütun biçiminde “.tsv” veya “.pogo” biten dosya ile) yolları ile sırasıyla yerine. Ayrıca MYSPECIES (Örneğin, insan) verilerle tutarlı türle değiştirin. Yürütme “Enter” tuşuna basarak onaylayın. Herhangi bir daha fazla ilerlemeden önce yürütme tamamlandı kadar bekle.Not: Bu bir kaç dakika sürebilir. Sonuç dosyası peptid giriş dosyasıyla aynı klasörde depolanan ve aşağıdaki \PATH\TO\OUT.pogo.bed olarak kabul. Sadece varyant peptidler giriş dosyasından ayıklayın. \PATH\TO\IN aşağıdaki komutu kullanarak dosya açık R ve yük giriş:inputdata <-read.table("PATH/TO/IN",header=TRUE,sep="\t") Zaten eşlenmiş peptidler komutunu kullanarak yükleme:mappedpeptides <-read.table("PATH/TO/OUT.pogo.bed",sep="\t",header=FALSE) Zaten eşleştirilmiş peptidler inputdata kaldırın:peptidesnotmapped <-inputdata [! () inputdata$ peptid % % mappedpeptides$ V4)] Eşlenmemiş peptidler yeni bir giriş dosyasına Yazdır:Write.Table (peptidesnotmapped, “PATH\TO\IN.notmapped.pogo”, başlık = FALSE, Eylül = “\t”, col.names=TRUE,row.names=FALSE,quote=FALSE) Kalan peptidler uyuşmazlıkları izin başvuru genom eşleyin. Adım 3.1, olduğu gibi komut istemini açın ve PoGo yürütülebilir dosyaları klasöre gidin. 1 amino asit uyuşmazlığı sağlayan aşağıdaki komutu yazın ve \PATH\TO\GTF, \PATH\TO\FASTA ve \PATH\TO\IN.notmapped.pogo ile yolları ek açıklama GTF, protein sıra FASTA ve peptid kimlik dosya 3.2. adımda oluşturduğunuz yedek. Ayrıca MYSPECIES (Örneğin, insan) verilerle tutarlı türle değiştirin. PoGo.exe – gtf \PATH\TO\GTF – fasta \PATH\TO\FASTA-\PATH\TO\IN içinde-yatak format-türler MYSPECIES -mm 1 Komut yürütme “Enter” tuşuna basarak onaylayın. Herhangi bir daha fazla ilerlemeden önce yürütme tamamlandı kadar bekle.Not: Bu bir kaç dakika sürebilir. Sonuç dosyası peptid giriş dosyasıyla aynı klasörde depolanan ve aşağıdaki \PATH\TO\OUT.pogo_1MM.bed olarak kabul. Olmadan ve 2.2 adımda anlatıldığı gibi IGV uyuşmazlıkla eşlenen peptidler görselleştirin. 4. birden fazla dosya kullanarak ve parça hub’ları için büyük veri kümeleri oluşturma eşleme PoGoGUI kullanarak birden çok dosyadan peptidler eşleme Yürütülebilir dosyaları klasöre gidin ve program GUI PoGoGUI vX.X.X.jarçalıştırarak başlatın. PoGo yürütülebilir dosyanın kullanımda (burada Linux), işletim sistemi için iletişim kuralı adımlarda 2.1.2 – 2.1.4 açıklandığı gibi yanı sıra başvuru giriş protein sequences FASTA dosya ve ek açıklama GTF dosya seçin. “Peptid dosyalar yanındaki”; Ekle düğmesini kullanarak peptid tanımlama dosyaları ekleme sürükle ve bırak “Peptid dosyalar” altında boş alana yanı sıra birden çok dosya seçim etkindir. PTM yatak, GTF ve GCT yanındaki onay kutularını çıkış biçimleri bölümünde düzensiz ve sadece kontrol yatak bırakın. Tek çıktı birden fazla giriş dosyasına birleştirmeseçeneğini belirleyin.Not: Bu giriş dosyaları tüm peptidler birleştiren bir tek çıktı dosyasında neden olur. Bu seçenek seçili bırakarak sıralı bir yürütme programın giriş her dosya için ayrı ayrı neden olur. Açılan seçim FASTA ve GTF dosyaları ile tutarlı veriler için uygun türü seçin. Başlat düğmesini tıklatarak eşleme başlatın. Gerekirse, programın giriş dosyaları pogo biçimine dönüştürme. Bu çalıştırmak için biraz zaman alabilir. Bu arada, parça hub üretimi için gerekli araçları ve komut dosyaları karşıdan yükleyin. Parça hub üretimi için hazırlanıyor Bir web tarayıcısını açın, https://github.com/cschlaffner/TrackHubGenerator için gidin ve download belgili tanımlık eğe “TrackHubGenerator.pl”. Yürütülebilir dosyaları klasöre kaydedin. Web tarayıcısında, www.hgdownload.soe.ucsc.edu/admin/exe/ için gidin ve klasörü işletim sistemi için kullanılan (burada Linux) seçeneğini belirleyin. Araç bedToBigBed ve fetchChromSizes komut dosyası yürütülebilir dosyaları klasörü27indir. Bir parça hub eşlenen peptidler oluşturmaNot: PoGoGUI peptidler eşleştirme tamamlandıktan sonra bir parça hub otomatik olarak aynı klasörde depolanan yatak biçiminde ortaya çıkan dosyalar için oluşturulabilir. Bir terminal penceresi açın ve aşağıdaki komutu yazın:Perl TrackHubGenerator.pl yol/için/adı derleme FBED UCSC e-posta Yerine yol/kime/adı ile bir dosya yolu ve adı parça hub (Örneğin, ~/PoGo/Data/Mytrackhub), ek açıklama olan göre (Örneğin, hg38 insan için), genom derleme sahip derleme içeren klasör için yolu ile FBED Yatak dosyaları parça hub dayalı olacaktır üzerinde (Örneğin, ~/PoGo/Data/), UCSC UCSC indirilen araçlar depolandığı klasörü (Örneğin, ~/PoGo/Executables/) ve parça için sorumlu kişi için bir e-posta adresi ile e-posta hub. Yürütme “Enter” tuşuna basarak onaylayın; yürütme tamamlamak için kısa bir süre sürecek. Tüm içeriğiyle ilgili oluşturulan parça hub (yani, oluşturulan klasör ~/PoGo/Data/Mytrackhub/) erişilebilir bir FTP sunucusuna aktarmak.Not: Parça hub protokolleri ftp ve http üzerinden erişim sağlayan bir ilişkili web sunucusu ile bir FTP sunucusu tercih edilir. Depoları github (github.com) ve figshare (figshare.com) bu tür erişimi desteklemek ve bir FTP sunucusu yerine kullanılabilir. Bir parça hub UCSC genom tarayıcıda görüntülenmesi Bir web tarayıcısında https://genome.ucsc.edu/ için gidin ve seçin MyData | İzlemek hub’ları. Üstünde belgili tanımlık etiket My hub’ ı tıklatın. URL metin alanına parça merkeze kopyalayın.Not: URL sunucu adresi, parça hub konumu ve adı ve hub.txt dosyası (Örneğin, http://ngs.sanger.ac.uk/production/proteogenomics/WTSI_proteomics_PandeyKusterCutler_tissues_hi/hub.txt) oluşur. Parça hub Hub Ekletıklatarak yükleyin.Not: Merkez-ecek var olmak yüklü ve örneğin adını parça hub için sorumlu kişi iletişim bilgileri parça hub ayrıntılarını belirten kısa bir ileti görüntülenir ve genom derleme kullanılır. Web sitesi ana sayfasına döndürür. Tarayıcı Görünümü girmek için GenomeBrowser seçin.Not: Özel parça hub listesinin en üstünde görünür. Eğer çok yatak eğe parça hub için temel inşa dosyaları hub içinde ayrı bir parça olarak temsil edilir.

Representative Results

Bir grafik tasvir vurgulayarak bir iş akışının düzenli proteomik PoGo18 sahne, görselleştirme, akış aşağı seçenekleri yanı sıra uygulandığı Şekil 5′ te gösterilmiştir. Av tüfeği proteomik (yani, sıvı kromatografi tandem kütle spektrometresi ile birleştiğinde ardından proteinlerin proteolitik sindirim) proteogenomic eşleme bir müjdeli adımdır. Elde edilen tandem kitle spectra sık teorik spectra protein sıra veritabanlarından türetilmiş karşılaştırılır. Proteogenomics çalışmalar veritabanına kolayca başvuru genom8′ e bu geri ilişkilendirmek zor yapma potansiyeli ve eşanlamlı olmayan tek nükleotid türevleri (SNVs) kodlama ile roman transkript çeviri dizisi tanıtmak. PoGo (PoGoGUI) grafik kullanıcı arabiriminin peptid tanımlamaları kütle spektrometresi deneyler üzerinden standart raporlamada dosya biçimlerini destekler ve onları Basitleştirilmiş 4 sütunlu pogo biçimine dönüştürür. PoGoGUI komut satırı aracını PoGo tamamladı ve böylece peptidler protein kodlayıcı genlerin sık GTF ve FASTA formatı çevrilmiş transkript serilerinde sağlanan başvuru ek açıklama kullanan genom koordinatları üzerine eşleme sağlar. Farklı çıkış biçimleri farklı yönlerini translasyonel modifikasyonlar ve peptid düzeyi miktar dahil olmak üzere kütle spektrometresi ile tanımlanan peptidler görselleştirme etkinleştirmek için PoGo tarafından oluşturulur. Çıktı dosyaları yatakta daha fazla dönüştürülür ve parça hub olarak adlandırılan online erişilebilir dizinlere kombine. Tek çıkış dosyalarının yanı sıra parça hub, sonra UCSC genom tarayıcı25, Ensembl genom tarayıcı20, IGV24ve Biodalliance28 (bakınız Şekil 5 alt) gibi tarayıcılarda görüntülenir. Biz PoGo yüksek önemi Wright ve ark. içinde açıklandığı gibi filtre insan Proteom haritalar taslak reanalysis uygulanan 7 ve iki diğer araçlar için proteogenomic eşleme, yani iPiG14 ve PGx10karşılaştırıldığında. Veri kümesi 233,055 benzersiz peptidler 59 yetişkin ve fetal dokularda kaynaklanan toplam 3 milyon dizileri arasında oluşur. PoGo geride bu araçlar her iki çalışma zamanında (6,9 x ve 96.4 x daha hızlı, sırasıyla) ve bellek kullanımı (% 20 ve % 60 daha az bellek, sırasıyla) Şekil 618içinde gösterildiği gibi. Başarılı bir şekilde eşlenen bir peptid örneği Şekil 7′ de gösterilmiştir. PoGo, önemli ölçüde hız ve bellek diğer araçlarda geride iken, aynı zamanda eşleme translasyonel modifikasyonlar ve niceliksel bilgileri peptidler genomu üzerine ile ilişkili yeteneğine sahiptir. Bir exon ve genelinde eşleme peptidler kavşak splice için Şekil 8A şematik bir genom tarayıcı yatak biçiminde görselleştirme gösteriyor. PoGo peptid eşleme genom içinde benzersizliğini açısından kolay görsel yardım sağlamak için boyama seçeneği kullanır. Eşlemeleri kırmızı siyah parlak nokta tek bir gen için eşleme sırasında tek bir transkript teklik gösteriyor. Ancak, peptid farklı transkript arasında paylaşılır. Gri eşlemeleri arasında birden çok gen paylaşılan bir peptid göster. Bunlar, örneğin, daha az güvenilir bir gen miktar için veya güvenilmez bir gen ifade aramak için. PoGo PTM yatak seçeneği 8B rakamgösterildiği gibi farklı türde translasyonel modifikasyonlar karşılamak için renk kodu yeniden tanımlıyor. Ayrıca, PTMs (bkz. Şekil 8B) kalın bloklarla belirtilir. Aynı türden birden çok PTMs ilk değiştirilmiş amino asit kalın bir blok tarafından son yayılmış iken bir türde tek bir PTM değiştirilmiş amino asit kalıntısı konumda kalın bir blok vurgulanır. Biz PoGo ve daha sonra TrackHubGenerator bütün Proteom ve phosphoproteome29dahil olmak üzere 50 kolorektal kanser hücre satırları bir dataset nesnesine uygulanır. Süre UCSC genom tarayıcısına yüklendiğinde parça hub için genom eşlenen peptidler gösterir ve eşlemeler ve (bkz. Şekil 9) fosforilasyon siteleri benzersizliğini vurguluyor, ek veri ek klasöründe sağlanan. GCT dosyaları daha sonra genomik bir bağlamda peptid ve phosphopeptide Nefelometri görselleştirme etkinleştirin. Ancak, GCT dosyaları kolay bir görsel splice kavşak (bkz: top 10 rakam ) arasında yayılan peptidler olarak sağlamaz. Splice kavşak genelinde peptidler ilgili yerlerine ekzonlar için eşleme olarak bölünür. Splice peptidler aynı sayısal değerleri exon eşlemeleri arasında tanımlamak mümkün iken, eşleme serisi tabanlı yükleme yatak veya GTF ekzonlar satırı desteği kapsayan bir ince intron tarafından bağlanan gibi yorumu dosyaları (bkz Şekil 10 . alt). Etkin değişken eşleme yardımcı programını vurgulamak için bir çoklu enzim strateji22kullanarak eksik proteinler için avlamak için neXtProt karşı aranan insan testis Proteom iki yapılandırmaları bir veri kümesi için PoGo uygulanan. NeXtProt referans protein dizileri yanı sıra 5 milyonun üzerinde tek amino asit türevleri30oluşmaktadır. Bir tek amino asit türevi tespit peptidler eşleme diğer haritalama araçları tarafından desteklenmiyor. 177,012 benzersiz peptidler toplam tespit edildi. Bunlardan % 99.8 (176,694) peptidler ilk başarıyla uyuşmazlıkları izin vermeden eşleştirilmiş. Tanımlanan peptid listeden kaldırma daha sonra eşlenen izin bir amino asit ikame edildi % 0,2 (318) peptidler içinde sonuçlandı. Bu başvuru genom herhangi bir kullanılabilir araç ile eşleştirilmiş olan değil 162 peptidler 3,446 eşleştirmelerini sonuçlandı. Eşlemeler bir uyumsuzluk dahil olmak üzere ortalama sayısı yüksek olmakla birlikte, 62 peptidler doğru değişken dizileri gösteren yalnızca bir tek odağı için eşleştirilmiş. Bir tek amino asit ikame ile eşlenen bir peptid örneği, sıra ve Şekil 11çevrilmiş genomik sırayla ile vurgulanır. Şekil 1. Farklı peptid genom haritalama araçları Visual karşılaştırılması. Karşılaştırma çeşitli yönleri ile gösterilir. Bu yönleriyle bir eşleme başvuru, çerçeveler içine entegrasyon düzeyi ve çevrimiçi ve çevrimdışı tarayıcılar desteği içerir. Ayrıca, proteogenomics ve onların özellik desteği roman yönlerini ayrı olarak işaretlenir. PoGo sadece doğrudan diğer araçlar için karşılaştırıldığında genom dizisi eşleştirmek için yeteneği yoksun. Ancak, diğer araçların çoğunu desteklemez tüm yeni özelliklerini destekler. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. Şekil 2. Örnek giriş dosyası için eşleme peptidler. PoGo 4 sütun içeren Sekmeyle ayrılmış biçimde giriş verileri kabul eder. ‘Deneme’, ‘Peptid’, ‘PSMs’ ve ‘Quant’ deneme veya örnek tanımlayıcısı, peptit dizisi, peptid spektrumlu eşleşme sayısını ve peptid için sayısal bir değer aşağıdaki satırları gösteren, ilk satırda sütun üstbilgileri vardır anılan sıraya göre. Desteklenen dosya adı uzantılarını *.txt, *.tsv ve *.pogo vardır. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. Şekil 3. PoGoGUI arabirimi dosya seçimlerini ve parametre seçenekleri için vurgulanan adımlarla. Rakam seçmek ve gerekli tüm seçenekleri için eşleme peptidler insan başvuru genom üzerine translasyonel modifikasyonlar ile seçim yüklemek için adımları gösterir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. Şekil 4. Ekran görüntüsü bütünleştirici genomik Viewer (IGV) veri yükleme yordamı. Rakam PoGo çıktı dosyaları IGV tarayıcı yüklemek için adımlar vurgular. Ayrıca, eşleme ve sıra vurgulamak için eşlenen peptidler kavramını genişleyen seçeneği gösterir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. Şekil 5. Basitleştirilmiş iş akışı görselleştirme genom tarayıcılar için LC-MS/MS adımlardan. PoGo eşleme peptidler tanımlaması tandem kitle spectra izler. Genom eşleştirmeye elde etmek için genom ek açıklama (GTF) ve transkript çeviri dizileri (FASTA) sağlanan başvuru ek açıklama PoGo kullanır. Genom tarayıcılarda ayrı olarak yüklenebilir farklı çıkış biçimleri oluşturulur. Ayrıca, yatak biçimdeki dosyaları görselleştirme büyük ölçekli veri kümeleri destekleyen parça hub’lara birleştirilebilir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. Şekil 6. PoGo PGx ve iPiG karşı kıyaslama. PoGo iyi performans karşılaştırma üzerinde diğer araçları. 233,055 benzersiz peptidler 3 milyon serilerinde kaynaklanan 59 yetişkin ve fetal dokularda arasında eşleme, PoGo 6,9 x ve PGx ve iPiG, hızlı 96.4 x sırasıyla yapıldı. Ayrıca, PoGo % 20 ve % 60 daha az PGx ve iPiG, sırasıyla kıyasla bellek gerekli. PoGo ve PGx başarıyla tamamlandı iken, iPiG 16 GB bellek hatası sonuçlandı. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. Şekil 7. UCSC genom tarayıcı örnek görünümünü eşlenen peptidler. Şekil peptidler gen mTOR eşlenen gösterir. Birleştirilmiş parça splice kavşak kapsayan ve yalnızca ilişkili serileri ile bir exon eşleme peptidler gösterirken, doku özel parça sadece yoğun bir biçimde eşleme vurgulayın. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. Şekil 8. Görselleştirme ve renk kodlaması eşleme şematik. (A)Standart Oda çıkış dosyasında bir exon eşleme peptidler tek taşları (sol, taşları (doğru) olarak parçaları kapsayan exon birden çok ekzonlar vurgulama arasında eşleme peptidler ise) olarak gösterilir. İntron gibi ince çizgiler içinde gösterilir. PoGo eşleme veya peptidler genler ve 3 katmanlı sistem kullanarak transkript benzersizliğini RenkKod. (B) yanı sıra blok yapı yatak biçiminin PTM yatak çıkış translasyonel modifikasyonlar konumunu kalın taşları olarak vurgular. Aynı PTM birden çok site ilk gelen, Son değişiklik sitesi kapsayan uzun bloklar halinde birleştirilir iken bir türde tek bir PTM varlığı, kalın bir blok ile değiştirilmiş amino asit kalıntı vurgulamaktadır. Peptid eşlemeleri daha fazla PTM türü ve rengi codec üzerinde değişiklik dayalı tarafından ayrılır. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. Şekil 9. Takip UCSC genom tarayıcı kolorektal kanser Proteom ve phosphoproteome veri görünümünde hub. Parça hub bütün Proteom bilgilerinin yanı sıra phosphoproteome oluşmaktadır. Proteom ve phosphoproteome parça kırmızı renkte belirtmek SFN tek transkript eşleştirmeye benzersizliğini, _ptm içinde biten parçaları peptidler fosforilasyon sitelerle gösterir. Burada, kırmızı renk olarak fosforilasyon türünü gösterir. Sadece iki peptidler her tek fosforilasyon (kalın blok) gösterilen ile tespit edilmiştir. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. Şekil 10. Kolorektal kanser phosphopeptides ve IGV içinde ilişkili Nefelometri görünümünü. Şekil 50 kanser hücre satır alt küme küme küme kümesini gösterir. Bu ayrıca blokların dört sütun ışık farklı tonlarında kırmızı gösterir. Rengi göreli bereket (beyaz) düşük yüksek (kırmızı) olarak gösterir. Dört sütun başlangıçta 4 peptidler olduğuna inanıyoruz yol açabilir, her bir splice junction kapsayan iki peptidler, aslında bunlar ilişkili serisi tabanlı GTF çıktı dosyası ile açık olur. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız. Şekil 11. IGV amino asit türevi ile peptid görünümünü. Şekilde bir peptid başvuru Genom Gen GPSM1çeviri başında eşlenmiş bir tek amino asit türevi ile gösterilmiştir. Varyant amino asit kalıntı 8 ve alanin valin (A→V) için ikame sonuçlarında yer alıyor. Ek açıklama eklenen dökümleri (mavi) çeviri dizisi peptit dizisi ile karşılaştırıldığında değişken vurgulayın. Bu rakam daha büyük bir versiyonunu görüntülemek için buraya tıklayınız.

Discussion

Bu protokolü nasıl yazılım aracı PoGo ve onun graphical kullanıcı arayüzey PoGoGUI peptidler genom koordinatları üzerine hızlı bir eşleme etkinleştirmek açıklar. Aracın nicel, translasyon modifikasyon ve değişken etkin eşleme için başvuru ek açıklama kullanarak genleri gibi benzersiz özellikler sunuyor. Bu yazı bir büyük ölçekli proteogenomic çalışma yöntemini gösterir ve diğer araçlar-18karşılaştırıldığında hız ve bellek verimlilik vurgular. TrackHubGenerator aracı ile birlikte, genomik online erişilebilir merkezlerine oluşturur ve genom bağlantılı veri, PoGo, onun graphical kullanıcı arayüzey ile hızlı bir şekilde genomik bağlamda verilerini görselleştirmek için sağlar büyük ölçekli proteogenomics çalışmalar. Ayrıca, biz varyant veritabanları ve nicel phosphoproteomics22,29karşı arama veri ile PoGo benzersiz özelliklerini göstermek.

Tek resimler, GCT dosyası gibi değerli görselleştirme ve peptid özellikleri ve genomik loci arasındaki bağlantılar sağlar. Ancak, bunlar üzerinde yalnız dayalı bir yorumu zor veya proteogenomics teklik, translasyonel modifikasyonlar ve nicel değerler gibi tek yönleri onların sınırlaması nedeniyle yanıltıcı olabilir unutmamak gerekir. Bu nedenle, dikkatli bir şekilde hangi çıktı dosyaları, seçenekleri ve kombinasyonları el altında proteogenomic soru için uygundur ve birleşimler değiştirmek seçmek önemlidir. Farklı örnekleri arasında miktar ile ilgili çalışmalar için daha uygun olabilir Örneğin, belirli bir genomik odağı için eşlemenin benzersiz hakkında bilgi, genomik özelliği7eklenti için çok değerli olabilir protein bereket29değişikliklere genomik özellikleri. Çıktının her ayarı için PoGo tarafından oluşturulan. Hiçbir çıktı oluşturulur ya da boş dosyaları çıkış klasörü’nde gösterilen halinde, istenilen içeriği ve gerekli dosya biçimi için giriş dosyaları kontrol etmek için tavsiye edilir. Nerede dosya biçimi veya içeriği takip PoGo beklentilerini durumlarda (Örneğin, sözde transkript çeviri dizileri içeren FASTA dosya transkriptleri nükleotit dizileri içerir), hata iletileri için Kullanıcı soracaktır giriş dosyaları kontrol edin.

Protokol ve aracın kısıtlamaları çoğunlukla genomik içinde yaygın olarak kullanılan dosya biçimlerini yeniden temel alır. Genomik içinde proteogenomic uygulamalar için kullanılan dosya biçimlerini repurposing belirli sınırlamalar tarafından eşlik ediyor. Gereksinimleri genomik merkezli genom görselleştirme için farklı ayarlar nedeniyle bunlar ve proteogenomic verileri, proteomik verilerden translasyonel modifikasyonlar görselleştirmek için ihtiyaç gibi. Bu genomik dosya biçimlerinde tek özellik kullanımı tarafından kısıtlanır. Birçok yaklaşımlar ve araçları proteomik güvenle peptid dizileri31,32,33,34içinde translasyonel modifikasyonlar yerelleştirmek geliştirilmiştir. Ancak, birden fazla değişiklik genom üzerinde benzersiz ve discernable şekilde görselleştirme genomik dosya biçimleri yapısı tarafından engelliyordu. Bu nedenle, aynı türden birden çok PTMs tek blok görselleştirme değişiklik sitelerin herhangi bir belirsizlik teşkil etmez ancak tek tek özellikleri teker teker görselleştirmek için farklı gereksinim genomik toplumdan sonucudur. Yine de, PoGo eşleme translasyonel modifikasyonlar genomik şekil öyle aynı derecede tek nükleotid türevleri etkisi translasyonel modifikasyonlar odaklı çalışmalar etkinleştirmek için genomik koordinatları üzerine bir avantaja sahiptir. PoGo kullanarak, değişken eşleme toplam eşlemeleri sayısını artırır. Ancak, eşlenen peptidler benzersiz renk kodlaması güvenilmez olanlardan güvenilir eşlemeleri vurgulamaktadır. Varyant peptidler bilinen tek nükleotid türevleri tanımlanan eşleme VCF biçimi versiyonlarında yanında eşlenen peptidler görselleştirme tarafından eşlik edilebilir. Bu şekilde bir varyant peptid güvenilmez bir eşleme gösteren renk kodu bilinen nükleotit değişken varlığı tarafından reddedildi.

PoGo kullanmak için önemli bir adım doğru dosyaları ve biçimleri kullanmaktır. Çevrilmiş transkript dizileri GTF biçiminde ek açıklama eşlik edecek protein sıraları olarak ana kriterler kullanılır. Başka bir önemli unsuru PoGo peptidler amino asit uyuşmazlıkları ile eşleştirmek için kullanmayı düşündüğü bellektir. Standart bir uygulama için yüksek bellek verimli iken mümkün eşlemeleri bir ya da iki uyuşmazlıkları ile önemli ölçüde ve katlanarak artan sayıda bellek kullanım18benzer şekilde üstel bir artış yol açar. Biz ilk peptidler uyuşmazlığı olmadan harita ve bunları kümesinden kaldırmak için bu iletişim kurallarını açıklandığı gibi aşamalı bir eşleme öneriyoruz. Sonraki daha önce eşlenmemiş peptidler sonra bir uyuşmazlığı kullanarak eşlenebilir ve yordamı için eşlenmemiş kalan peptidler iki eşleşmeme durumu ile tekrar edilebilir.

Beri kütle spektrometresi throughput önemli ölçüde artmıştır ve genomik arayüz oluşturma çalışmaları ve proteomik veri son yıllarda daha sık olmak, kolayca aynı koordinat sistemi verileri bu tür arayüz oluşturma aracı, vardır giderek vazgeçilmez. Burada sunulan araç genomik birleştirmek gerek ve proteomik verileri daha iyi bir bütünleştirici çalışmaların küçük ve büyük veri kümeleri arasında bir başvuru ek açıklama üzerine peptidler eşleyerek anlayış geliştirmek için yardımcı olacaktır. Cesaret, PoGo peptidler gen adaylar başvuru ek açıklama aynı biçiminde sağlanan ek açıklama desteklemeleri roman genlerin insan testis35ifade için eşlemek için uygulanmıştır. Burada sunulan yaklaşım peptid kimliği için kullanılan veritabanlarının bağımsızdır. Protokol kimlik yardımcı ve görselleştirme roman çevirisi ürünleri kullanarak çeviri dizilerinden giriş dosyaları uyarlanmış ve RNA-seq deneyler dosyalarından GTF ilişkili.

Çeşitli yaklaşımlar ve araçları özel uygulama senaryoları peptidler genomik koordinatları, RNA-sıralama destekli eşleştirme, genom sıra için doğrudan peptidler eşleme arasında değişen eşleştirmek için geniş bir yelpazesi ile tanıtılan10, olmuştur 11 , 12 , 13 , 14 , 15 , 16 , 17. ancak, bunlar doğru zaman translasyonel modifikasyon mevcut ve temel eşleme, RNA-sıralama okuma hataları peptid seviyeye yayılır peptidler eşlemek için bir hata neden olabilir. PoGo, özellikle bu engelleri aşmak için ve ortogonal genomik platformları ile tümleştirmek için nicel yüksek çözünürlüklü proteomik veri hızlı artış ile başa çıkmak için geliştirilmiştir. Burada açıklanan aracın yüksek üretilen iş iş akışları entegre edilebilir. Grafik arayüz PoGoGUI sayesinde araç kullanımı kolaydır ve hiçbir uzmanı Biyoinformatik Eğitimi gerektirir.

開示

The authors have nothing to disclose.

Acknowledgements

Bu eser Wellcome Trust (WT098051) ve GENCODE projesine NIH grant (U41HG007234) tarafından finanse edildi.

Materials

PoGo (software) NA NA https://github.com/cschlaffner/PoGo
PoGoGUI (software) NA NA https://github.com/cschlaffner/PoGoGUI
TrackHubGenerator (software) NA NA https://github.com/cschlaffner/TrackHubGenerator
Integrative Genomics Viewer (software) NA NA http://software.broadinstitute.org/software/igv/
UCSC genome browser (website) NA NA https://genome.ucsc.edu/
GENCODE (website) NA NA http://gencodegenes.org
Ensembl (website) NA NA http://ensembl.org
bedToBigBed (software) NA NA http://hgdownload.soe.ucsc.edu/admin/exe/
fetchChromSizes.sh (software) NA NA http://hgdownload.soe.ucsc.edu/admin/exe/

参考文献

  1. Aebersold, R., Mann, M. Mass-spectrometric exploration of proteome structure and function. Nature. 537 (7620), 347-355 (2016).
  2. Mertins, P., et al. Proteogenomics connects somatic mutations to signalling in breast cancer. Nature. 534 (7605), 55-62 (2016).
  3. Zhang, H., et al. Integrated proteogenomic characterization of human high-grade serous ovarian cancer. Cell. 166 (3), 755-765 (2016).
  4. Jaffe, J. D., Berg, H. C., Church, G. M. Proteogenomic mapping as a complementary method to perform genome annotation. Proteomics. 4 (1), 59-77 (2004).
  5. Wilhelm, M., et al. Mass-spectrometry-based draft of the human proteome. Nature. 509 (7502), 582-587 (2014).
  6. Kim, M. S., et al. A draft map of the human proteome. Nature. 509 (7502), 575-581 (2014).
  7. Wright, J. C., et al. Improving GENCODE reference gene annotation using a high-stringency proteogenomics workflow. Nature Communications. 7, 11778 (2016).
  8. Nesvizhskii, A. I. Proteogenomics: concepts, applications and computational strategies. Nature Methods. 11 (11), 1114-1125 (2014).
  9. Armengaud, J., et al. Non-model organisms, a species endangered by proteogenomics. Journal of Proteomics. 105, 5-18 (2014).
  10. Askenazi, M., Ruggles, K. V., Fenyo, D. PGx: putting peptides to BED. Journal of Proteome Research. 15 (3), 795-799 (2016).
  11. Choi, S., Kim, H., Paek, E. ACTG: novel peptide mapping onto gene models. バイオインフォマティクス. 33 (8), 1218-1220 (2017).
  12. Ghali, F., et al. ProteoAnnotator-open source proteogenomics annotation software supporting PSI standards. Proteomics. 14 (23-24), 2731-2741 (2014).
  13. Has, C., Lashin, S. A., Kochetov, A. V., Allmer, J. PGMiner reloaded, fully automated proteogenomic annotation tool linking genomes to proteomes. Journal of Integrative Bioinformatics. 13 (4), 293 (2016).
  14. Kuhring, M., Renard, B. Y. iPiG: integrating peptide spectrum matches into genome browser visualizations. PLoS One. 7 (12), e50246 (2012).
  15. Pang, C. N., et al. Tools to covisualize and coanalyze proteomic data with genomes and transcriptomes: validation of genes and alternative mRNA splicing. Journal of Proteome Research. 13 (1), 84-98 (2014).
  16. Sanders, W. S., et al. The proteogenomic mapping tool. BMC Bioinformatics. 12 (115), (2011).
  17. Wang, X., et al. ProBAMsuite, a bioinformatics framework for genome-based representation and analysis of proteomics data. Molecular & Cellular Proteomics. 15 (3), 1164-1175 (2016).
  18. Schlaffner, C. N., Pirklbauer, G. J., Bender, A., Choudhary, J. S. Fast, quantitative and variant enabled mapping of peptides to genomes. Cell Systems. 5 (2), 152-156 (2017).
  19. Vizcaino, J. A., et al. The PRoteomics IDEntifications (PRIDE) database and associated tools: status in 2013. Nucleic Acids Research. 41, D1063-D1069 (2013).
  20. Aken, B. L., et al. Ensembl 2017. Nucleic Acids Research. 45 (D1), D635-D642 (2017).
  21. Perez-Riverol, Y., et al. Ms-data-core-api: an open-source, metadata-oriented library for computational proteomics. バイオインフォマティクス. 31 (17), 2903-2905 (2015).
  22. Wang, Y., et al. Multi-protease strategy identifies three PE2 missing proteins in human testis tissue. Journal of Proteome Research. , (2017).
  23. Greseth, M. D., Carter, D. C., Terhune, S. S., Traktman, P. Proteomic screen for cellular targets of the vaccinia virus F10 protein kinase reveals that phosphorylation of mDia regulates stress fiber formation. Molecular & Cellular Proteomics. 16 (4 Suppl 1), S124-S143 (2017).
  24. Thorvaldsdottir, H., Robinson, J. T., Mesirov, J. P. Integrative genomics viewer (IGV): high-performance genomics data visualization and exploration. Briefings in Bioinformatics. 14 (2), 178-192 (2013).
  25. Kent, W. J., et al. The human genome browser at UCSC. Genome Research. 12 (6), 996-1006 (2002).
  26. The R Development Core Team. . R: A Language and Environment for Statistical Computing. , (2008).
  27. Kent, W. J., Zweig, A. S., Barber, G., Hinrichs, A. S., Karolchik, D. BigWig and BigBed: enabling browsing of large distributed datasets. バイオインフォマティクス. 26 (17), 2204-2207 (2010).
  28. Down, T. A., Piipari, M., Hubbard, T. J. Dalliance: interactive genome viewing on the web. バイオインフォマティクス. 27 (6), 889-890 (2011).
  29. Roumeliotis, T. I., et al. Genomic determinants of protein abundance variation in colorectal cancer cells. Cell Reports. 20 (9), 2201-2214 (2017).
  30. Gaudet, P., et al. The neXtProt knowledgebase on human proteins: 2017 update. Nucleic Acids Research. 45, D177-D182 (2017).
  31. Fermin, D., Walmsley, S. J., Gingras, A. C., Choi, H., Nesvizhskii, A. I. LuciPHOr: algorithm for phosphorylation site localization with false localization rate estimation using modified target-decoy approach. Molecular & Cellular Proteomics. 12 (11), 3409-3419 (2013).
  32. Fermin, D., Avtonomov, D., Choi, H., Nesvizhskii, A. I. LuciPHOr2: site localization of generic post-translational modifications from tandem mass spectrometry data. バイオインフォマティクス. 31 (7), 1141-1143 (2015).
  33. Hansen, T. A., Sylvester, M., Jensen, O. N., Kjeldsen, F. Automated and high confidence protein phosphorylation site localization using complementary collision-activated dissociation and electron transfer dissociation tandem mass spectrometry. Analytical Chemistry. 84 (22), 9694-9699 (2012).
  34. Taus, T., et al. Universal and confident phosphorylation site localization using phosphoRS. Journal of Proteome Research. 10 (12), 5354-5362 (2011).
  35. Weisser, H., Wright, J. C., Mudge, J. M., Gutenbrunner, P., Choudhary, J. S. Flexible data analysis pipeline for high-confidence proteogenomics. Journal of Proteome Research. 15 (12), 4686-4695 (2016).

Play Video

記事を引用
Schlaffner, C. N., Pirklbauer, G. J., Bender, A., Steen, J. A., Choudhary, J. S. A Fast and Quantitative Method for Post-translational Modification and Variant Enabled Mapping of Peptides to Genomes. J. Vis. Exp. (135), e57633, doi:10.3791/57633 (2018).

View Video