概要

Информатики анализ последовательности данных из пакетного дрожжи 2-гибрид экраны

Published: June 28, 2018
doi:

概要

Глубокая последовательности дрожжей населения, отобранных для положительных дрожжи 2-гибрид взаимодействия потенциально дает огромное количество информации о взаимодействующих партнер белков. Здесь мы описываем функционирования конкретных Биоинформатика инструменты и заказной обновленное программное обеспечение для анализа данных последовательности от таких экранов.

Abstract

Мы адаптировали дрожжи 2-гибрид assay одновременно раскрыть десятки переходных и статические белковых взаимодействий в одном экране, использование высокопроизводительного секвенирования ДНК короткий читать. Результирующие наборы данных последовательности можно не только отслеживать какие гены в популяции, которые обогащаются во время выбора для положительных дрожжи 2-гибрид взаимодействия, но также дать подробную информацию о соответствующих поддоменах белков, достаточных для взаимодействия. Здесь мы описываем полный набор автономных программ, которые позволяют не специалисты для выполнения всех биоинформатики и статистической шаги, чтобы обрабатывать и анализировать файлы fastq последовательности ДНК из пакетного дрожжи 2-гибрид пробирного. Шаги обработки, охватываемых этими программного обеспечения включают в себя: 1) карт и подсчета последовательности читает соответствующий каждый кандидат белков закодированы в библиотеке 2-гибрид добычу дрожжей; 2) статистический анализ-программа, которая вычисляет профили обогащения; и 3) Инструменты для изучения переводческих кадров и положение в регионе кодирования каждого обогащенного плазмида, который кодирует взаимодействующих протеинов интереса.

Introduction

Один из подходов к обнаружить взаимодействий протеина является пробирного (Y2H) 2-гибрид дрожжей, какие подвиги инженерии дрожжевых клеток, которые растут только тогда, когда протеин интереса привязывается к фрагменту взаимодействующих партнера1. Обнаружение нескольких Y2H взаимодействия теперь может быть сделано с помощью массивной параллельной последовательности высок объём. Несколько форматов были описаны4,3,2,5 , включая один, что мы разработали, где население выращиваются в пакете в условиях, которые выбрать для дрожжей, содержащих плазмиды, которые производят позитивное взаимодействие Y2H6. Рабочий процесс, мы разработали, называется DEEPN (динамический обогащения для оценки белка сетей), идентифицирует дифференциальной interactomes же добычей библиотек для идентификации белков, которые взаимодействуют с одним белка (или домен) против. конформационно собственный мутант домен или другой белок. Одним из основных шагов в этом процессе является правильной обработки и анализа данных последовательности ДНК. Некоторую информацию можно почерпнуть просто подсчитывая количество операций чтения для каждого гена как до, так и после выбора Y2H взаимодействий в моде аналогичны РНК seq эксперимент. Однако гораздо более подробную информацию можно извлечь из этих наборов данных, включая информацию о поддомен данного белка, который способен производить Y2H взаимодействия. Кроме того в то время как DEEPN подход является ценным, анализируя многие пример реплицирует может быть обременительным и дорогостоящим. Эта проблема смягчается с помощью статистической модели, которая была разработана специально для DEEPN наборов данных, где количество реплицирует это ограничено6. Чтобы сделать обработку и анализ ДНК последовательности наборов данных надежной, полной, надежной и доступной для следователей без опыта биоинформатики, мы разработали набор программ, которые охватывают все этапы анализа.

Этот набор самостоятельных программ, которые работают на настольных компьютерах включает в себя MAPster, DEEPN и Stat_Maker. MAPster-это графический пользовательский интерфейс, который позволяет каждому fastq файл в очереди для картирования генома, с помощью программы HISAT27, производство стандартных .sam файл для использования в нисходящие приложения. DEEPN имеет несколько модулей. Он назначает и подсчитывает читает соответствующий особый ген похож на тип РНК seq количественной оценки, с помощью модуля «Ген количество». Он также извлекает последовательности, соответствующий стыке транскрипционный анализ домена Gal4 и добычей последовательности и упорядочивает позиции этих узлов, чтобы позволить их инспекции сравнительные таблицы и графики (с использованием модуля «Junction_Make») Модуль «Blast_Query» позволяет легко инспекции, количественный и сравнения последовательностей перехода Gal4 перекрестка. Stat_Maker оценивает читает на ген обогащения данных статистически как способ приоритезации вероятно Y2H хитов. Здесь мы опишем, как использовать эти программы и полностью проанализировать последовательность ДНК, которую данные из DEEPN Y2H эксперимент. Доступны версии DEEPN для запуска на PC, Mac и Linux систем. Другие программы, такие как отображение программы MAPster и DEEPN модуль статистики Stat_Maker полагаются на подпрограммы, которые выполняются под управлением Unix и доступны только на Mac и linux систем.

Protocol

1. Сопоставление файлов Fastq Примечание: DEEPN программного обеспечения, а также многие программы биоинформатики использовать данные последовательности ДНК, которой сопоставлен каждой последовательности чтения для его позиции в ссылке ДНК. Разнообразные программы сопостав…

Representative Results

Сопоставление данных fastq: первый шагВ практически всех NGS приложений, включая первоначальный вывод представляет собой файл короткие последовательности чтений, которые должны быть сопоставлены выравнивание геномной DEEPN транскриптомики, или другие ссылки Д…

Discussion

Набор программного обеспечения, описанные здесь позволяет полностью обрабатывать и анализировать данные секвенирования ДНК высокой пропускной способности из DEEPN эксперимент. Первая программа, используемая является MAPster, который принимает считывает последовательность ДНК в файлах с?…

開示

The authors have nothing to disclose.

Acknowledgements

Эта работа была поддержана национальными институтами здравоохранения: низ R21 EB021870-01A1 и NSF исследовательский проект Грант: 1517110.

Materials

Mapster https://github.com/emptyewer/MAPster/releases
DEEPN software https://github.com/emptyewer/DEEPN/releases
Statmaker https://github.com/emptyewer/DEEPN/releases
Minimum computer system Apple Mac Intel Core i5 or better
4 Gb RAM or better
500 Gb Disk spce or better
OS 10.10 or higher
Dell Intel i5-7400 or better
4 Gb RAM or better
500 Gb Disk spce or better
Windows 7 or higher

参考文献

  1. Fields, S., Song, O. A novel genetic system to detect protein-protein interactions. Nature. 340 (6230), 245-246 (1989).
  2. Rajagopala, S. V. Mapping the Protein-Protein Interactome Networks Using Yeast Two-Hybrid Screens. Advances in Experimental Medicine and Biology. 883, 187-214 (2015).
  3. Weimann, M., et al. A Y2H-seq approach defines the human protein methyltransferase interactome. Nature Methods. 10 (4), 339-342 (2013).
  4. Yachie, N., et al. Pooled-matrix protein interaction screens using Barcode Fusion Genetics. Molecular Systems Biology. 12 (4), 863 (2016).
  5. Trigg, S. A., et al. CrY2H-seq: a massively multiplexed assay for deep-coverage interactome mapping. Nature Methods. , (2017).
  6. Pashkova, N., et al. DEEPN as an Approach for Batch Processing of Yeast 2-Hybrid Interactions. Cell Reports. 17 (1), 303-315 (2016).
  7. Kim, D., Langmead, B., Salzberg, S. L. HISAT: a fast spliced aligner with low memory requirements. Nature Methods. 12 (4), 357-360 (2015).
  8. Reinert, K., Langmead, B., Weese, D., Evers, D. J. Alignment of Next-Generation Sequencing Reads. Annual Review of Genomics and Human Genetics. 16, 133-151 (2015).
  9. Pertea, M., Kim, D., Pertea, G. M., Leek, J. T., Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nature Protocols. 11 (9), 1650-1667 (2016).
  10. Conesa, A., et al. A survey of best practices for RNA-seq data analysis. Genome Biology. 17, 13 (2016).

Play Video

記事を引用
Krishnamani, V., Peterson, T. A., Piper, R. C., Stamnes, M. A. Informatic Analysis of Sequence Data from Batch Yeast 2-Hybrid Screens. J. Vis. Exp. (136), e57802, doi:10.3791/57802 (2018).

View Video