概要

Sıralı veri--dan toplu Maya 2-hibrid perde Bilişim Analizi

Published: June 28, 2018
doi:

概要

Pozitif Maya 2-hibrid etkileşimleri için potansiyel olarak seçilen Maya nüfusun derin sıralama etkileşen ortak proteinler hakkında bilgi hazinesi verir. Burada, biz böyle ekranlar sıra verileri çözümlemek için özelleştirilmiş güncelleştirmek bilgisayar yazılımı ve belirli Biyoinformatik araçlarını işlemini açıklar.

Abstract

Aynı anda onlarca geçici ve statik protein etkileşimleri yüksek üretilen iş kısa okuma DNA sıralama kullanan tek bir ekran içinde ortaya çıkarmak için Maya 2-hibrid tahlil adapte olması. Elde edilen sıra veri kümeleri sadece olumlu Maya 2-hibrid etkileşimleri için seçimi sırasında zenginleştirilmiş hangi genlerin bir popülasyondaki izlemek ama ayrıca protein etkileşimi için yeterli ilgili alt etki alanları hakkında ayrıntılı bilgi verir. Burada, uzman olmayan tüm Biyoinformatik ve işlemek ve DNA dizisi fastq dosyaları toplu Maya 2-hibrid tahlil analiz istatistiksel adımları gerçekleştirmek izin tek başına yazılım programları tam bir süit açıklayın. Bu yazılım tarafından örtülü işlem adımları içerir: bir Maya 2-hibrid av kitaplıkta; kodlanmış her aday protein karşılık gelen 1) haritalama ve sayım sıra okuma 2) zenginleştirme profilleri değerlendirir bir istatistiksel analiz programı; ve 3) translasyonel çerçeve ve kodlayıcı bölge içinde konumunu ilgi etkileşen protein kodlayan her zenginleştirilmiş plazmid incelemek için araçlar.

Introduction

Protein etkileşimleri keşfetmek için bir yaklaşım hangi olağanüstü başarı bir protein ilgi etkileşen bir ortak1bir parçası için bağlandığında büyümek Maya hücreleri mühendislik Maya 2-hibrid (Y2H) tahlil olduğunu. Birden çok Y2H etkileşimleri tespiti şimdi büyük paralel yüksek üretilen iş sıralama yardımı ile yapılabilir. Birkaç biçimi olmuştur nerede nüfus toplu üretmek plazmid içeren Maya için seçin koşullar altında yetiştirilen geliştirdiğimiz bir dahil olmak üzere2,3,4,5 açıklanan bir pozitif Y2H etkileşim6. İş akışı geliştirilen, DEEPN (Protein ağları değerlendirme için dinamik zenginleştirme) olarak adlandırdığı, fark interactomes bir protein (veya etki alanı) vsile etkileşim proteinler tanımlamak için aynı av kitaplıklarındaki tanımlar. başka bir protein veya doğurmak farklı mutant etki alanı. Bu iş akışındaki temel adımlardan uygun işleme ve DNA sıralama veri analizi biridir. Bazı bilgiler sadece her gen için okuma önce ve sonra seçimi bir moda Y2H etkileşimlerin sayısını benzer bir RNA-seq deney sayarak panoda. Ancak, çok daha ayrıntılı bilgi Y2H etkileşim üretebilen bir verilen protein alt etki alanı hakkında bilgi de dahil olmak üzere bu veri kümeleri elde edilebilir. DEEPN yaklaşım değerli ise, buna ek olarak, birçok örnek çoğaltır analiz hantal ve pahalı olabilir. Bu sorun özellikle DEEPN veri kümeleri için geliştirilmiş istatistiksel bir modelini kullanarak çoğaltır sayısı sınırlı6nerede ortadan kalkar. İşleme ve analiz DNA sıralama veri kümeleri Biyoinformatik uzmanlık olmadan bu araştırmacılar için güvenilir, tam, sağlam ve erişilebilir yapmak için a maiyet-in tüm adımları analiz kapak yazılım programları geliştirdi.

Masaüstü bilgisayarlarda tek başına yazılım programları bu paketi MAPster, DEEPN ve Stat_Maker içerir. MAPster aşağı akım uygulamalarda kullanmak için bir standart .sam dosyası üreten her fastq dosya sıraya eşlemek için istimal HISAT2 programı7, genom sağlar bir grafik kullanıcı arayüzü var. DEEPN birkaç modülden oluşmaktadır. Bu atar ve belirli gen ‘Gene say’ modülü kullanılarak bir RNA-seq türü miktar için benzer karşılık gelen okur sayar. Ayrıca Gal4 transkripsiyon etki alanı ve av dizini arasında kavşak karşılık gelen dizileri ayıklar ve onların muayene karşılaştırmalı tablolar ve grafikler (‘Junction_Make’ modülü kullanılarak) izin vermek için bu kavşak konumunu harmanlar ‘Blast_Query’ modülü kolay muayene, Nefelometri ve kavşak Gal4 junction sıralarının karşılaştırma sağlar. Stat_Maker okuma başına gen zenginleştirme veri büyük olasılıkla Y2H sayısı öncelik istatistiksel bir yolu olarak değerlendirir. Burada, biz nasıl kullanma bunlar bilgisayar yazılımı bilgisayar programı ve DEEPN Y2H verilerden deneme DNA dizisi tam olarak çözümlemek için açıklar. DEEPN sürümleri PC, Mac ve Linux sistemleri çalıştırmak kullanılabilir. Eşleştirme programı MAPster gibi diğer programlar ve DEEPN istatistikler modülü Stat_Maker Unix altında çalışan ve yalnızca Mac ve linux sistemlerinde kullanılabilir alt yordamlar kullanır.

Protocol

1. eşleme Fastq dosyaları Not: Başvuru DNA konumunda için DNA dizisi veri okumak her sıra onda eşlenmiş DEEPN bilgisayar yazılımı hem hem birçok Biyoinformatik programı kullanın. Haritalama programları çeşitli bu HISTAT2 programın sonraki adımda kullanılan .sam dosyaları üretmek için kullandığı MAPster arabirimi eklemek için kullanılabilir. Sıralı veri genom doğru sürüme eşleyin. Y2H kitaplıkları için fare kökenli, UCSC mm10 genom kullanın; o ins…

Representative Results

Fastq veri eşleme: ilk adımDEEPN ilk çıkış, hizalama için genomik tarafından eşlenmelidir kısa sıra okuma bir dosyadır dahil olmak üzere hemen hemen tüm NGS uygulamalarda transcriptomic veya diğer referans DNA8. Son zamanlarda, HISAT2 hizalama program eşleme hız7,9önemli ölçüde artırmak için state-of–art dizin oluşturma algoritmaları kullanan geliştirilmiştir…

Discussion

Burada açıklanan yazılım paketi bir tamamen işlemek ve DEEPN deney yüksek işlem hacmi DNA sıralama verileri çözümlemek izin verir. Kullanılan ilk DNA dizisi okuma standart fastq dosyalarında alır ve konumlarını DEEPN yazılım da dahil olmak üzere bilişim programları bir bütün ana tarafından aşağı akım işleme için bir referans DNA üzerine haritalar MAPster bir programdır. Belgili tanımlık yarar MAPster arabirimi ve birden çok iş birleştirmek giriş dosyaları, sıraya yeteneğini coveni…

開示

The authors have nothing to disclose.

Acknowledgements

Bu eser Ulusal Sağlık Enstitüleri tarafından desteklenmiştir: NIH R21 EB021870-01A1 ve NSF araştırma projesi hibe: 1517110.

Materials

Mapster https://github.com/emptyewer/MAPster/releases
DEEPN software https://github.com/emptyewer/DEEPN/releases
Statmaker https://github.com/emptyewer/DEEPN/releases
Minimum computer system Apple Mac Intel Core i5 or better
4 Gb RAM or better
500 Gb Disk spce or better
OS 10.10 or higher
Dell Intel i5-7400 or better
4 Gb RAM or better
500 Gb Disk spce or better
Windows 7 or higher

参考文献

  1. Fields, S., Song, O. A novel genetic system to detect protein-protein interactions. Nature. 340 (6230), 245-246 (1989).
  2. Rajagopala, S. V. Mapping the Protein-Protein Interactome Networks Using Yeast Two-Hybrid Screens. Advances in Experimental Medicine and Biology. 883, 187-214 (2015).
  3. Weimann, M., et al. A Y2H-seq approach defines the human protein methyltransferase interactome. Nature Methods. 10 (4), 339-342 (2013).
  4. Yachie, N., et al. Pooled-matrix protein interaction screens using Barcode Fusion Genetics. Molecular Systems Biology. 12 (4), 863 (2016).
  5. Trigg, S. A., et al. CrY2H-seq: a massively multiplexed assay for deep-coverage interactome mapping. Nature Methods. , (2017).
  6. Pashkova, N., et al. DEEPN as an Approach for Batch Processing of Yeast 2-Hybrid Interactions. Cell Reports. 17 (1), 303-315 (2016).
  7. Kim, D., Langmead, B., Salzberg, S. L. HISAT: a fast spliced aligner with low memory requirements. Nature Methods. 12 (4), 357-360 (2015).
  8. Reinert, K., Langmead, B., Weese, D., Evers, D. J. Alignment of Next-Generation Sequencing Reads. Annual Review of Genomics and Human Genetics. 16, 133-151 (2015).
  9. Pertea, M., Kim, D., Pertea, G. M., Leek, J. T., Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nature Protocols. 11 (9), 1650-1667 (2016).
  10. Conesa, A., et al. A survey of best practices for RNA-seq data analysis. Genome Biology. 17, 13 (2016).

Play Video

記事を引用
Krishnamani, V., Peterson, T. A., Piper, R. C., Stamnes, M. A. Informatic Analysis of Sequence Data from Batch Yeast 2-Hybrid Screens. J. Vis. Exp. (136), e57802, doi:10.3791/57802 (2018).

View Video