Summary

일괄 처리 효 모 2 잡종 스크린에서 시퀀스 데이터의 informatic 분석

Published: June 28, 2018
doi:

Summary

효 모 인구 잠재적으로 긍정적인 효 모 2 잡종 상호 작용에 대 한 선택의 깊은 시퀀싱 풍부한 파트너 단백질 상호 작용에 대 한 정보를 생성 합니다. 여기, 우리가 특정 생물 정보학 도구와 같은 화면에서 시퀀스 데이터 분석 사용자 지정 된 업데이트 소프트웨어의 동작을 설명 합니다.

Abstract

우리는 동시에 높은 처리량 짧은 읽기 DNA 시퀀싱을 활용 한 화면 내에서 임시 및 정적 단백질 상호 작용의 수십을 밝히기 위해 효 모 2 잡종 분석 결과 적응 했습니다. 결과 시퀀스 데이터 집합 수 뿐만 아니라 인구에 긍정적인 효 모 2 잡종 상호 작용을 위해 선택 하는 동안 풍성 하 게 하는 어떤 유전자를 추적 하지만 또한 상호 작용에 대 한 충분 한 단백질의 관련 하위 도메인에 대 한 자세한 정보를 제공. 여기, 우리는 비-전문가 모든 생물 정보학 및 통계 단계를 처리 하 고 일괄 처리 효 모 2 잡종 분석 결과에서 DNA 시퀀스 fastq 파일을 분석을 수행할 수 있는 독립 실행형 소프트웨어 프로그램의 전체 제품군을 설명 합니다. 이러한 소프트웨어에 의해 보호 처리 단계를 포함: 해당 각 후보 단백질 효 모 2 잡종 먹이 라이브러리;에서 인코딩 하 1) 매핑 및 계산 순서 읽기 2) 통계 분석 프로그램을 평가 하는 농축 프로 파일; 그리고 3) 변환 프레임 및 관심사의 상호 작용 단백질 인코딩합니다 각 농축된 플라스 미드의 코딩 영역 내에서 위치를 검사 하는 도구.

Introduction

단백질 상호 작용을 발견 하는 한 가지 방법은 효 모 2 잡종 (Y2H) 분석 결과, 어떤 악용 설계 관심사의 단백질의 상호 작용 파트너1조각에 묶을 때에 자라는 효 모 세포 이다. 여러 Y2H 상호 작용의 탐지는 지금 대규모 병렬 높은 처리량 시퀀싱의 도움으로 할 수 있습니다. 여러 가지 형식 되었습니다 설명2,3,,45 포함 한 우리가 개발 인구 일괄 생성 하 플라스 미드를 포함 하는 효 모에 대 한 선택 하는 조건 하에서 재배 되는 긍정적인 Y2H 상호 작용6. 워크플로 우리 개발, 되 나 DEEPN (동적 농축 단백질 네트워크의 평가 위한), 하나의 단백질 (또는 도메인) 와 상호 작용 하는 단백질을 식별 하기 위해 같은 먹이 라이브러리에서 차동 interactomes 식별. 다른 단백질 또는 conformationally 별개의 돌연변이 도메인입니다. 이 워크플로의 주요 단계 중 하나는 적절 한 처리 및 DNA 시퀀싱 데이터의 분석 이다. 유사한 RNA-seq 실험의 Y2H 상호 작용 방식에서 선택 전후에 둘 다 각 유전자에 대 한 읽기 수 계산 하 여 몇 가지 정보를 얻을 수 있습니다. 그러나, Y2H 상호 작용을 만들 수 있는 특정된 단백질의 하위 도메인에 대 한 정보를 포함 하 여이 데이터 집합에서 훨씬 더 자세한 정보를 추출할 수 있습니다. 또한, 반면 DEEPN 방식은 귀중 한 많은 샘플 복제 분석 수 복잡 하 고 비싼입니다. 이 문제는 복제의 수는 제한6DEEPN 데이터 집합을 위해 특별히 개발 된 통계 모델 사용 하 여 완화 됩니다. 있도록 처리 및 DNA 시퀀싱 데이터 집합의 분석, 완전 한, 강력한, 안정적이 고 접근 없이 생물 정보학 전문 수 사관에 대 한, 우리는 분석의 모든 단계를 커버 하는 소프트웨어 프로그램의 한 벌을 개발 했다.

데스크톱 컴퓨터에서 실행 되는 독립 실행형 소프트웨어 프로그램의이 제품군 MAPster, DEEPN, 및 Stat_Maker 포함 되어 있습니다. MAPster 다운스트림 응용 프로그램에 사용 하기 위해 표준.sam 파일을 만드는 각 fastq 파일 대기7HISAT2 프로그램 사용 하 여 게놈에 매핑할 수 있는 그래픽 사용자 인터페이스입니다. DEEPN 여러 모듈 있다. 그것은 할당 하 고 해당 특정 유전자 유사한 ‘ 유전자 개수 ‘ 모듈을 사용 하는 RNA-seq 형식 정량화 하는 읽기를 계산. 그것은 또한 Gal4 transcriptional 도메인 및 먹이 시퀀스 사이의 교차점에 해당 하는 시퀀스를 추출 하 고 대조 비교 테이블 및 그래프 (를 사용 하 여 모듈 ‘Junction_Make’)에 의해 그들의 검사를 허용 하도록 이러한 연결의 위치 모듈 ‘Blast_Query’ 쉬운 검사와 정량, 접합 Gal4 접점 시퀀스의 비교를 허용 한다. Stat_Maker는 통계적으로 확률이 Y2H 안타에 우선 순위를 지정 하는 방법으로 유전자 농축 데이터 당 읽기 평가 합니다. 여기, 우리는 이러한 소프트웨어 프로그램을 사용 하 고 완전히 DEEPN Y2H에서 데이터 실험 DNA 시퀀스를 분석 하는 방법을 설명 합니다. 버전 DEEPN의 PC, 맥, 그리고 리눅스 시스템에서 실행할 수 있습니다. MAPster 매핑 프로그램 같은 다른 프로그램 및 DEEPN 통계 모듈 Stat_Maker 서브루틴 유닉스에서 실행 하 고 Mac 및 linux 시스템에만 사용할 수 있습니다에 의존.

Protocol

1. 매핑 Fastq 파일 참고: DEEPN 소프트웨어 뿐만 아니라 많은 생물 정보학 프로그램 참조 DNA에에서 그것의 위치에 대 한 각각의 시퀀스를 읽고 매핑된 점에서 DNA 시퀀스 데이터를 사용 합니다. 다양 한 매핑 프로그램이.sam 파일 이후 단계에서 사용을 생산 하기 위해 HISTAT2 프로그램을 사용 하 여 여기 MAPster 인터페이스를 포함 한 사용할 수 있습니다. 게놈의 올바른 버전을 …

Representative Results

Fastq 데이터 매핑: 첫 번째 단계실질적으로 모든 NGS 응용 프로그램 DEEPN 초기 출력은 짧은 시퀀스 읽기 게놈에 정렬 하 여 매핑할 수 합니다 파일을 포함 하 여, transcriptomic, 또는 다른 DNA8참조. 최근, HISAT2 맞춤 프로그램 최신의 색인 생성 알고리즘을 사용 하 여 매핑 속도7,9를 극적으로 증가 하는 …

Discussion

여기에 설명 된 소프트웨어 제품군 완전히 처리 하 고 높은 처리량 DEEPN 실험에서 DNA 시퀀싱 데이터를 분석 한 수 있습니다. 사용 하는 첫 번째 프로그램은 MAPster 표준 fastq 파일에서 DNA 순서 읽기 하 고 다운스트림 처리 DEEPN 소프트웨어를 포함 한 정보 프로그램의 전체 호스트에 대 한 참조 DNA에 그들의 위치를 지도. MAPster 인터페이스와 결합 입력된 파일, 여러 작업을 대기열에 능력의 유틸리티 cove…

Divulgaciones

The authors have nothing to disclose.

Acknowledgements

이 작품은 건강의 국가 학회에 의해 지원 되었다: NIH R21 EB021870-01A1 NSF 연구 프로젝트 그랜트에 의해: 1517110.

Materials

Mapster https://github.com/emptyewer/MAPster/releases
DEEPN software https://github.com/emptyewer/DEEPN/releases
Statmaker https://github.com/emptyewer/DEEPN/releases
Minimum computer system Apple Mac Intel Core i5 or better
4 Gb RAM or better
500 Gb Disk spce or better
OS 10.10 or higher
Dell Intel i5-7400 or better
4 Gb RAM or better
500 Gb Disk spce or better
Windows 7 or higher

Referencias

  1. Fields, S., Song, O. A novel genetic system to detect protein-protein interactions. Nature. 340 (6230), 245-246 (1989).
  2. Rajagopala, S. V. Mapping the Protein-Protein Interactome Networks Using Yeast Two-Hybrid Screens. Advances in Experimental Medicine and Biology. 883, 187-214 (2015).
  3. Weimann, M., et al. A Y2H-seq approach defines the human protein methyltransferase interactome. Nature Methods. 10 (4), 339-342 (2013).
  4. Yachie, N., et al. Pooled-matrix protein interaction screens using Barcode Fusion Genetics. Molecular Systems Biology. 12 (4), 863 (2016).
  5. Trigg, S. A., et al. CrY2H-seq: a massively multiplexed assay for deep-coverage interactome mapping. Nature Methods. , (2017).
  6. Pashkova, N., et al. DEEPN as an Approach for Batch Processing of Yeast 2-Hybrid Interactions. Cell Reports. 17 (1), 303-315 (2016).
  7. Kim, D., Langmead, B., Salzberg, S. L. HISAT: a fast spliced aligner with low memory requirements. Nature Methods. 12 (4), 357-360 (2015).
  8. Reinert, K., Langmead, B., Weese, D., Evers, D. J. Alignment of Next-Generation Sequencing Reads. Annual Review of Genomics and Human Genetics. 16, 133-151 (2015).
  9. Pertea, M., Kim, D., Pertea, G. M., Leek, J. T., Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nature Protocols. 11 (9), 1650-1667 (2016).
  10. Conesa, A., et al. A survey of best practices for RNA-seq data analysis. Genome Biology. 17, 13 (2016).

Play Video

Citar este artículo
Krishnamani, V., Peterson, T. A., Piper, R. C., Stamnes, M. A. Informatic Analysis of Sequence Data from Batch Yeast 2-Hybrid Screens. J. Vis. Exp. (136), e57802, doi:10.3791/57802 (2018).

View Video