Глубокая последовательности дрожжей населения, отобранных для положительных дрожжи 2-гибрид взаимодействия потенциально дает огромное количество информации о взаимодействующих партнер белков. Здесь мы описываем функционирования конкретных Биоинформатика инструменты и заказной обновленное программное обеспечение для анализа данных последовательности от таких экранов.
Мы адаптировали дрожжи 2-гибрид assay одновременно раскрыть десятки переходных и статические белковых взаимодействий в одном экране, использование высокопроизводительного секвенирования ДНК короткий читать. Результирующие наборы данных последовательности можно не только отслеживать какие гены в популяции, которые обогащаются во время выбора для положительных дрожжи 2-гибрид взаимодействия, но также дать подробную информацию о соответствующих поддоменах белков, достаточных для взаимодействия. Здесь мы описываем полный набор автономных программ, которые позволяют не специалисты для выполнения всех биоинформатики и статистической шаги, чтобы обрабатывать и анализировать файлы fastq последовательности ДНК из пакетного дрожжи 2-гибрид пробирного. Шаги обработки, охватываемых этими программного обеспечения включают в себя: 1) карт и подсчета последовательности читает соответствующий каждый кандидат белков закодированы в библиотеке 2-гибрид добычу дрожжей; 2) статистический анализ-программа, которая вычисляет профили обогащения; и 3) Инструменты для изучения переводческих кадров и положение в регионе кодирования каждого обогащенного плазмида, который кодирует взаимодействующих протеинов интереса.
Один из подходов к обнаружить взаимодействий протеина является пробирного (Y2H) 2-гибрид дрожжей, какие подвиги инженерии дрожжевых клеток, которые растут только тогда, когда протеин интереса привязывается к фрагменту взаимодействующих партнера1. Обнаружение нескольких Y2H взаимодействия теперь может быть сделано с помощью массивной параллельной последовательности высок объём. Несколько форматов были описаны4,3,2,5 , включая один, что мы разработали, где население выращиваются в пакете в условиях, которые выбрать для дрожжей, содержащих плазмиды, которые производят позитивное взаимодействие Y2H6. Рабочий процесс, мы разработали, называется DEEPN (динамический обогащения для оценки белка сетей), идентифицирует дифференциальной interactomes же добычей библиотек для идентификации белков, которые взаимодействуют с одним белка (или домен) против. конформационно собственный мутант домен или другой белок. Одним из основных шагов в этом процессе является правильной обработки и анализа данных последовательности ДНК. Некоторую информацию можно почерпнуть просто подсчитывая количество операций чтения для каждого гена как до, так и после выбора Y2H взаимодействий в моде аналогичны РНК seq эксперимент. Однако гораздо более подробную информацию можно извлечь из этих наборов данных, включая информацию о поддомен данного белка, который способен производить Y2H взаимодействия. Кроме того в то время как DEEPN подход является ценным, анализируя многие пример реплицирует может быть обременительным и дорогостоящим. Эта проблема смягчается с помощью статистической модели, которая была разработана специально для DEEPN наборов данных, где количество реплицирует это ограничено6. Чтобы сделать обработку и анализ ДНК последовательности наборов данных надежной, полной, надежной и доступной для следователей без опыта биоинформатики, мы разработали набор программ, которые охватывают все этапы анализа.
Этот набор самостоятельных программ, которые работают на настольных компьютерах включает в себя MAPster, DEEPN и Stat_Maker. MAPster-это графический пользовательский интерфейс, который позволяет каждому fastq файл в очереди для картирования генома, с помощью программы HISAT27, производство стандартных .sam файл для использования в нисходящие приложения. DEEPN имеет несколько модулей. Он назначает и подсчитывает читает соответствующий особый ген похож на тип РНК seq количественной оценки, с помощью модуля «Ген количество». Он также извлекает последовательности, соответствующий стыке транскрипционный анализ домена Gal4 и добычей последовательности и упорядочивает позиции этих узлов, чтобы позволить их инспекции сравнительные таблицы и графики (с использованием модуля «Junction_Make») Модуль «Blast_Query» позволяет легко инспекции, количественный и сравнения последовательностей перехода Gal4 перекрестка. Stat_Maker оценивает читает на ген обогащения данных статистически как способ приоритезации вероятно Y2H хитов. Здесь мы опишем, как использовать эти программы и полностью проанализировать последовательность ДНК, которую данные из DEEPN Y2H эксперимент. Доступны версии DEEPN для запуска на PC, Mac и Linux систем. Другие программы, такие как отображение программы MAPster и DEEPN модуль статистики Stat_Maker полагаются на подпрограммы, которые выполняются под управлением Unix и доступны только на Mac и linux систем.
Набор программного обеспечения, описанные здесь позволяет полностью обрабатывать и анализировать данные секвенирования ДНК высокой пропускной способности из DEEPN эксперимент. Первая программа, используемая является MAPster, который принимает считывает последовательность ДНК в файлах с?…
The authors have nothing to disclose.
Эта работа была поддержана национальными институтами здравоохранения: низ R21 EB021870-01A1 и NSF исследовательский проект Грант: 1517110.
Mapster | https://github.com/emptyewer/MAPster/releases | ||
DEEPN software | https://github.com/emptyewer/DEEPN/releases | ||
Statmaker | https://github.com/emptyewer/DEEPN/releases | ||
Minimum computer system | Apple | Mac Intel Core i5 or better | |
– | 4 Gb RAM or better | ||
– | 500 Gb Disk spce or better | ||
– | OS 10.10 or higher | ||
Dell | Intel i5-7400 or better | ||
– | 4 Gb RAM or better | ||
– | 500 Gb Disk spce or better | ||
– | Windows 7 or higher |