概要

일괄 처리 효 모 2 잡종 스크린에서 시퀀스 데이터의 informatic 분석

Published: June 28, 2018
doi:

概要

효 모 인구 잠재적으로 긍정적인 효 모 2 잡종 상호 작용에 대 한 선택의 깊은 시퀀싱 풍부한 파트너 단백질 상호 작용에 대 한 정보를 생성 합니다. 여기, 우리가 특정 생물 정보학 도구와 같은 화면에서 시퀀스 데이터 분석 사용자 지정 된 업데이트 소프트웨어의 동작을 설명 합니다.

Abstract

우리는 동시에 높은 처리량 짧은 읽기 DNA 시퀀싱을 활용 한 화면 내에서 임시 및 정적 단백질 상호 작용의 수십을 밝히기 위해 효 모 2 잡종 분석 결과 적응 했습니다. 결과 시퀀스 데이터 집합 수 뿐만 아니라 인구에 긍정적인 효 모 2 잡종 상호 작용을 위해 선택 하는 동안 풍성 하 게 하는 어떤 유전자를 추적 하지만 또한 상호 작용에 대 한 충분 한 단백질의 관련 하위 도메인에 대 한 자세한 정보를 제공. 여기, 우리는 비-전문가 모든 생물 정보학 및 통계 단계를 처리 하 고 일괄 처리 효 모 2 잡종 분석 결과에서 DNA 시퀀스 fastq 파일을 분석을 수행할 수 있는 독립 실행형 소프트웨어 프로그램의 전체 제품군을 설명 합니다. 이러한 소프트웨어에 의해 보호 처리 단계를 포함: 해당 각 후보 단백질 효 모 2 잡종 먹이 라이브러리;에서 인코딩 하 1) 매핑 및 계산 순서 읽기 2) 통계 분석 프로그램을 평가 하는 농축 프로 파일; 그리고 3) 변환 프레임 및 관심사의 상호 작용 단백질 인코딩합니다 각 농축된 플라스 미드의 코딩 영역 내에서 위치를 검사 하는 도구.

Introduction

단백질 상호 작용을 발견 하는 한 가지 방법은 효 모 2 잡종 (Y2H) 분석 결과, 어떤 악용 설계 관심사의 단백질의 상호 작용 파트너1조각에 묶을 때에 자라는 효 모 세포 이다. 여러 Y2H 상호 작용의 탐지는 지금 대규모 병렬 높은 처리량 시퀀싱의 도움으로 할 수 있습니다. 여러 가지 형식 되었습니다 설명2,3,,45 포함 한 우리가 개발 인구 일괄 생성 하 플라스 미드를 포함 하는 효 모에 대 한 선택 하는 조건 하에서 재배 되는 긍정적인 Y2H 상호 작용6. 워크플로 우리 개발, 되 나 DEEPN (동적 농축 단백질 네트워크의 평가 위한), 하나의 단백질 (또는 도메인) 와 상호 작용 하는 단백질을 식별 하기 위해 같은 먹이 라이브러리에서 차동 interactomes 식별. 다른 단백질 또는 conformationally 별개의 돌연변이 도메인입니다. 이 워크플로의 주요 단계 중 하나는 적절 한 처리 및 DNA 시퀀싱 데이터의 분석 이다. 유사한 RNA-seq 실험의 Y2H 상호 작용 방식에서 선택 전후에 둘 다 각 유전자에 대 한 읽기 수 계산 하 여 몇 가지 정보를 얻을 수 있습니다. 그러나, Y2H 상호 작용을 만들 수 있는 특정된 단백질의 하위 도메인에 대 한 정보를 포함 하 여이 데이터 집합에서 훨씬 더 자세한 정보를 추출할 수 있습니다. 또한, 반면 DEEPN 방식은 귀중 한 많은 샘플 복제 분석 수 복잡 하 고 비싼입니다. 이 문제는 복제의 수는 제한6DEEPN 데이터 집합을 위해 특별히 개발 된 통계 모델 사용 하 여 완화 됩니다. 있도록 처리 및 DNA 시퀀싱 데이터 집합의 분석, 완전 한, 강력한, 안정적이 고 접근 없이 생물 정보학 전문 수 사관에 대 한, 우리는 분석의 모든 단계를 커버 하는 소프트웨어 프로그램의 한 벌을 개발 했다.

데스크톱 컴퓨터에서 실행 되는 독립 실행형 소프트웨어 프로그램의이 제품군 MAPster, DEEPN, 및 Stat_Maker 포함 되어 있습니다. MAPster 다운스트림 응용 프로그램에 사용 하기 위해 표준.sam 파일을 만드는 각 fastq 파일 대기7HISAT2 프로그램 사용 하 여 게놈에 매핑할 수 있는 그래픽 사용자 인터페이스입니다. DEEPN 여러 모듈 있다. 그것은 할당 하 고 해당 특정 유전자 유사한 ‘ 유전자 개수 ‘ 모듈을 사용 하는 RNA-seq 형식 정량화 하는 읽기를 계산. 그것은 또한 Gal4 transcriptional 도메인 및 먹이 시퀀스 사이의 교차점에 해당 하는 시퀀스를 추출 하 고 대조 비교 테이블 및 그래프 (를 사용 하 여 모듈 ‘Junction_Make’)에 의해 그들의 검사를 허용 하도록 이러한 연결의 위치 모듈 ‘Blast_Query’ 쉬운 검사와 정량, 접합 Gal4 접점 시퀀스의 비교를 허용 한다. Stat_Maker는 통계적으로 확률이 Y2H 안타에 우선 순위를 지정 하는 방법으로 유전자 농축 데이터 당 읽기 평가 합니다. 여기, 우리는 이러한 소프트웨어 프로그램을 사용 하 고 완전히 DEEPN Y2H에서 데이터 실험 DNA 시퀀스를 분석 하는 방법을 설명 합니다. 버전 DEEPN의 PC, 맥, 그리고 리눅스 시스템에서 실행할 수 있습니다. MAPster 매핑 프로그램 같은 다른 프로그램 및 DEEPN 통계 모듈 Stat_Maker 서브루틴 유닉스에서 실행 하 고 Mac 및 linux 시스템에만 사용할 수 있습니다에 의존.

Protocol

1. 매핑 Fastq 파일 참고: DEEPN 소프트웨어 뿐만 아니라 많은 생물 정보학 프로그램 참조 DNA에에서 그것의 위치에 대 한 각각의 시퀀스를 읽고 매핑된 점에서 DNA 시퀀스 데이터를 사용 합니다. 다양 한 매핑 프로그램이.sam 파일 이후 단계에서 사용을 생산 하기 위해 HISTAT2 프로그램을 사용 하 여 여기 MAPster 인터페이스를 포함 한 사용할 수 있습니다. 게놈의 올바른 버전을 …

Representative Results

Fastq 데이터 매핑: 첫 번째 단계실질적으로 모든 NGS 응용 프로그램 DEEPN 초기 출력은 짧은 시퀀스 읽기 게놈에 정렬 하 여 매핑할 수 합니다 파일을 포함 하 여, transcriptomic, 또는 다른 DNA8참조. 최근, HISAT2 맞춤 프로그램 최신의 색인 생성 알고리즘을 사용 하 여 매핑 속도7,9를 극적으로 증가 하는 …

Discussion

여기에 설명 된 소프트웨어 제품군 완전히 처리 하 고 높은 처리량 DEEPN 실험에서 DNA 시퀀싱 데이터를 분석 한 수 있습니다. 사용 하는 첫 번째 프로그램은 MAPster 표준 fastq 파일에서 DNA 순서 읽기 하 고 다운스트림 처리 DEEPN 소프트웨어를 포함 한 정보 프로그램의 전체 호스트에 대 한 참조 DNA에 그들의 위치를 지도. MAPster 인터페이스와 결합 입력된 파일, 여러 작업을 대기열에 능력의 유틸리티 cove…

開示

The authors have nothing to disclose.

Acknowledgements

이 작품은 건강의 국가 학회에 의해 지원 되었다: NIH R21 EB021870-01A1 NSF 연구 프로젝트 그랜트에 의해: 1517110.

Materials

Mapster https://github.com/emptyewer/MAPster/releases
DEEPN software https://github.com/emptyewer/DEEPN/releases
Statmaker https://github.com/emptyewer/DEEPN/releases
Minimum computer system Apple Mac Intel Core i5 or better
4 Gb RAM or better
500 Gb Disk spce or better
OS 10.10 or higher
Dell Intel i5-7400 or better
4 Gb RAM or better
500 Gb Disk spce or better
Windows 7 or higher

参考文献

  1. Fields, S., Song, O. A novel genetic system to detect protein-protein interactions. Nature. 340 (6230), 245-246 (1989).
  2. Rajagopala, S. V. Mapping the Protein-Protein Interactome Networks Using Yeast Two-Hybrid Screens. Advances in Experimental Medicine and Biology. 883, 187-214 (2015).
  3. Weimann, M., et al. A Y2H-seq approach defines the human protein methyltransferase interactome. Nature Methods. 10 (4), 339-342 (2013).
  4. Yachie, N., et al. Pooled-matrix protein interaction screens using Barcode Fusion Genetics. Molecular Systems Biology. 12 (4), 863 (2016).
  5. Trigg, S. A., et al. CrY2H-seq: a massively multiplexed assay for deep-coverage interactome mapping. Nature Methods. , (2017).
  6. Pashkova, N., et al. DEEPN as an Approach for Batch Processing of Yeast 2-Hybrid Interactions. Cell Reports. 17 (1), 303-315 (2016).
  7. Kim, D., Langmead, B., Salzberg, S. L. HISAT: a fast spliced aligner with low memory requirements. Nature Methods. 12 (4), 357-360 (2015).
  8. Reinert, K., Langmead, B., Weese, D., Evers, D. J. Alignment of Next-Generation Sequencing Reads. Annual Review of Genomics and Human Genetics. 16, 133-151 (2015).
  9. Pertea, M., Kim, D., Pertea, G. M., Leek, J. T., Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nature Protocols. 11 (9), 1650-1667 (2016).
  10. Conesa, A., et al. A survey of best practices for RNA-seq data analysis. Genome Biology. 17, 13 (2016).

Play Video

記事を引用
Krishnamani, V., Peterson, T. A., Piper, R. C., Stamnes, M. A. Informatic Analysis of Sequence Data from Batch Yeast 2-Hybrid Screens. J. Vis. Exp. (136), e57802, doi:10.3791/57802 (2018).

View Video