Summary

间歇酵母 2-混合筛序列数据的信息化分析

Published: June 28, 2018
doi:

Summary

酵母菌群的深度测序为阳性酵母 2-混合相互作用可能产生大量的信息关于相互作用的伙伴蛋白。在这里, 我们描述了具体的生物信息学工具的操作和定制的更新软件来分析这些屏幕的序列数据。

Abstract

我们已经适应了酵母 2-杂交试验, 同时揭示了在一个单一的屏幕上大量的瞬时和静态蛋白质相互作用, 利用高通量的短读 DNA 测序。所产生的序列数据集不仅可以跟踪在选择的阳性酵母 2-混合相互作用的人群中丰富的基因, 而且还提供了足够的相互作用的蛋白质相关子域的详细信息。在这里, 我们描述了一整套独立的软件程序, 允许非专家执行所有的生物信息学和统计步骤, 以处理和分析 DNA 序列 fastq 文件从一批酵母 2-杂交试验。这些软件包含的处理步骤包括: 1) 映射和计数序列读数对应于酵母 2-混合猎物库中编码的每个候选蛋白;2) 评估浓缩剖面的统计分析程序;和 3) 工具, 以检查在编码区域内的平移帧和位置的每个丰富的质粒, 编码的相互作用的蛋白质的兴趣。

Introduction

一种发现蛋白质相互作用的方法是酵母 2-杂交 (Y2H) 试验, 它利用工程酵母细胞生长, 只有当一个兴趣蛋白质绑定到一个相互作用的伙伴1的片段。在大规模并行高通量测序的帮助下, 现在可以进行多 Y2H 交互的检测。有几种格式被描述2,3,4,5 , 包括一个我们开发的人口是分批种植的条件下, 选择酵母含有质粒, 产生积极的 Y2H 互动6。我们开发的工作流称为 DEEPN (动态富集, 用于评估蛋白质网络), 它识别出相同的猎物库中的差异 interactomes, 以识别与一种蛋白质 (或域) 的交互作用的蛋白质。另一种蛋白质或构象不同的突变域。该工作流的主要步骤之一是正确处理和分析 DNA 测序数据。有些信息可以通过计算每种基因在选择 Y2H 交互前后的次数, 比如 RNA 序列实验的方式来收集。但是, 可以从这些数据集中提取更多的深入信息, 包括有关特定蛋白质的子域的信息, 该子域能够产生 Y2H 的交互作用。此外, 虽然 DEEPN 方法是有价值的, 但分析许多样本复制可能是繁琐和昂贵的。使用一个专门为 DEEPN 数据集开发的统计模型来缓解这个问题, 因为复制的数量有限6。为了处理和分析 DNA 测序数据集可靠、完整、健壮、可供没有生物信息学专业知识的调查人员使用, 我们开发了一套涵盖所有分析步骤的软件程序。

这套单机版的软件程序在台式计算机上运行, 包括 MAPster、DEEPN 和 Stat_Maker。MAPster 是一个图形用户界面, 允许每个 fastq 文件排队使用 HISAT2 程序7映射到基因组, 生成一个标准. sam 文件, 以便在下游应用程序中使用。DEEPN 有几个模块。它分配和计数的读数对应的特定基因类似的 RNA 序列类型量化使用模块 ‘ 基因计数 ‘。它还提取与 Gal4 转录域和猎物序列相对应的序列, 并整理这些结点的位置, 以便通过比较表和图 (使用模块 “Junction_Make”) 进行检查。模块 ‘ Blast_Query ‘ 允许简单的检查, 定量, 并比较连接 Gal4 连接序列。Stat_Maker 以统计学的方式评估每种基因浓缩数据的读数, 以此来确定可能 Y2H 命中的优先级。在这里, 我们描述如何使用这些软件程序, 并充分分析 DNA 序列数据从 DEEPN Y2H 实验。DEEPN 版本可在 PC、Mac 和 Linux 系统上运行。其他程序, 如映射程序 MAPster 和 DEEPN 统计模块 Stat_Maker 依赖于在 Unix 下运行的子例程, 仅在 Mac 和 linux 系统上可用。

Protocol

1. 映射 Fastq 文件 注: DEEPN 软件以及许多生物信息学程序使用 dna 序列数据, 其中每个序列读取已被映射为其在参考 DNA 的位置。可以使用多种映射程序, 包括此处使用 HISTAT2 程序生成. sam 文件在后续步骤中使用的 MAPster 接口。 将序列数据映射到基因组的正确版本。对于 Y2H 的小鼠源库, 使用 UCSC mm10 基因组;对于那些使用人类基因的人, 使用 UCSC hg38 参考基因组, 为酿酒?…

Representative Results

映射 fastq 数据: 第一步在几乎所有的包括 DEEPN 的应用中, 初始输出是一个短序列读取的文件, 必须通过对基因组、transcriptomic 或其他参考 DNA8进行映射。最近, 开发了 HISAT2 对齐程序, 使用最先进的索引算法来显著提高映射速度7,9。HISAT2 在台式计算机上高效运行, 可以在几分钟内映射一个典型大小?…

Discussion

这里描述的软件套件允许一个从 DEEPN 实验中完全处理和分析高通量 DNA 测序数据。第一个程序使用的是 MAPster, 它采取的 DNA 序列读取标准的 fastq 文件, 并将其位置映射到参考 DNA 的下游处理由一个完整的信息学程序, 包括 DEEPN 软件。MAPster 接口的实用程序以及它对多个作业进行排队、组合输入文件、coveniently 名称输出文件的能力, 加上底层 HISAT2 程序7 it 控件的速度, 提供了一种易?…

Disclosures

The authors have nothing to disclose.

Acknowledgements

这项工作得到国家卫生研究院的支持: NIH R21 EB021870-01A1 和 NSF 研究项目赠款: 1517110。

Materials

Mapster https://github.com/emptyewer/MAPster/releases
DEEPN software https://github.com/emptyewer/DEEPN/releases
Statmaker https://github.com/emptyewer/DEEPN/releases
Minimum computer system Apple Mac Intel Core i5 or better
4 Gb RAM or better
500 Gb Disk spce or better
OS 10.10 or higher
Dell Intel i5-7400 or better
4 Gb RAM or better
500 Gb Disk spce or better
Windows 7 or higher

References

  1. Fields, S., Song, O. A novel genetic system to detect protein-protein interactions. Nature. 340 (6230), 245-246 (1989).
  2. Rajagopala, S. V. Mapping the Protein-Protein Interactome Networks Using Yeast Two-Hybrid Screens. Advances in Experimental Medicine and Biology. 883, 187-214 (2015).
  3. Weimann, M., et al. A Y2H-seq approach defines the human protein methyltransferase interactome. Nature Methods. 10 (4), 339-342 (2013).
  4. Yachie, N., et al. Pooled-matrix protein interaction screens using Barcode Fusion Genetics. Molecular Systems Biology. 12 (4), 863 (2016).
  5. Trigg, S. A., et al. CrY2H-seq: a massively multiplexed assay for deep-coverage interactome mapping. Nature Methods. , (2017).
  6. Pashkova, N., et al. DEEPN as an Approach for Batch Processing of Yeast 2-Hybrid Interactions. Cell Reports. 17 (1), 303-315 (2016).
  7. Kim, D., Langmead, B., Salzberg, S. L. HISAT: a fast spliced aligner with low memory requirements. Nature Methods. 12 (4), 357-360 (2015).
  8. Reinert, K., Langmead, B., Weese, D., Evers, D. J. Alignment of Next-Generation Sequencing Reads. Annual Review of Genomics and Human Genetics. 16, 133-151 (2015).
  9. Pertea, M., Kim, D., Pertea, G. M., Leek, J. T., Salzberg, S. L. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nature Protocols. 11 (9), 1650-1667 (2016).
  10. Conesa, A., et al. A survey of best practices for RNA-seq data analysis. Genome Biology. 17, 13 (2016).
check_url/57802?article_type=t

Play Video

Cite This Article
Krishnamani, V., Peterson, T. A., Piper, R. C., Stamnes, M. A. Informatic Analysis of Sequence Data from Batch Yeast 2-Hybrid Screens. J. Vis. Exp. (136), e57802, doi:10.3791/57802 (2018).

View Video