Summary

超 cyt: 一种用于简化高维细胞学数据分析的图形用户界面

Published: January 16, 2019
doi:

Summary

excyt 是一种基于 matlab 的图形用户界面 (gui), 允许用户通过常用的高维数据分析技术分析他们的流式细胞术数据, 包括通过 t-SNE 降低维数, 各种自动化和手动聚类分析方法、热图和新颖的高维流图。

Abstract

随着流式细胞仪的出现, 能够测量越来越多的参数, 科学家们继续开发更大的面板, 以表型地探索其细胞样本的特征。然而, 这些技术进步产生了高维数据集, 而在传统的基于手动的门控程序中, 这些数据集变得越来越难以客观地进行分析。为了更好地分析和呈现数据, 科学家们与具有分析高维数据专业知识的生物信息学家合作, 分析他们的流式细胞仪数据。虽然这些方法已被证明是非常有价值的研究流式细胞术, 他们尚未纳入一个简单和易于使用的包, 为缺乏计算或编程专业知识的科学家。为了满足这一需求, 我们开发了 excyt, 这是一种基于 matlab 的图形用户界面 (gui), 通过实施常用的高维数据分析技术, 简化了对高维流式细胞术数据的分析, 包括通过 t-SNE、各种自动和手动聚类分析方法、热图和新颖的高维流图来减小维数。此外, excyt 还为选定感兴趣的人群提供了传统的门控选项, 以便进一步进行 t-SNE 和聚类分析, 并能够直接在 t-SNE 图上应用门。该软件提供了处理已补偿或未补偿的 fcs 文件的额外优势。在需要采集后补偿的情况下, 用户可以选择为程序提供一个单一污渍的目录和一个未染色的样本。该程序检测所有通道中的正事件, 并使用此选择数据更客观地计算补偿矩阵。总之, excyt 提供了一个全面的分析管道, 以 fcs 文件的形式获取流式细胞仪数据, 并允许任何个人, 无论计算培训如何, 使用最新的算法方法来了解他们的数据。

Introduction

流式细胞术的进步以及大量细胞学的出现, 使临床医生和科学家能够快速识别出具有新分辨率的生物和临床上有趣的样品, 并对其进行表型表征, 从而产生较大的分辨率。信息丰富的高维数据集 1,2,3。虽然传统的流式细胞仪数据分析方法 (如手动门控) 对于那些标记很少且这些标记具有视觉可识别的数量的实验来说更为简单, 但这种方法可能无法生成分析高维数据集或在光谱上使用标记染色的数据集时可重现的结果。例如, 在一项多机构研究中, 正在进行细胞内染色 (ics) 检测, 以评估量化抗原特异性细胞反应的重现性, 尽管实验室间的精度和分析都很好, 特别是门控, 引入了一个重要的变异性来源 4。此外, 手工门控人口的过程, 除了高度主观, 是高度耗时和劳动密集型。然而, 以稳健、高效、及时的方式分析高维数据集的问题, 并不是研究科学的一个新问题。基因表达研究往往产生极高维的数据集 (往往按上百个基因的顺序), 在这些数据集中, 人工形式的分析根本不可行。为了解决这些数据集的分析问题, 在开发生物信息工具来分析基因表达数据方面做了大量的工作。这些算法方法最近刚刚被用于细胞学数据的分析, 因为参数的数量增加了, 并已被证明是非常宝贵的, 在分析这些高维数据集6,7

尽管产生和应用了各种算法和软件包, 使科学家能够将这些高维生物信息方法应用于他们的流式细胞术数据, 但这些分析技术在很大程度上仍然没有得到利用。虽然可能有多种因素限制了这些方法在细胞学数据方面的广泛采用, 但我们怀疑科学家使用这些方法的主要障碍是缺乏计算知识。事实上, 其中许多软件包 (flowcore、flowCore 和 opencyto) 都是用编程语言 (如 r) 编写的, 这些语言仍然需要实质性的编程知识。像 flowjo 这样的软件包由于使用简单、”即插即用” 的性质以及与 pc 操作系统的兼容性而受到科学家的青睐。为了向科学家不熟悉的编程提供各种公认和有价值的分析技术, 我们开发了 excyt, 这是一个图形用户界面 (gui), 可以很容易地安装在 pccymac 上, 它可以利用许多最新的技术包括用于直观可视化的维数约简、文献中引用的各种聚类方法, 以及新的特征, 用于利用热图和新颖的高维流箱图来探索这些聚类算法的输出。

excyt 是一个在 matlab 中构建的图形用户界面, 因此可以直接在 matlab 中运行, 也可以提供可用于在任何 pc/mac 上安装软件的安装程序。该软件可在 https://github.com/sidhomj/ExCYT。我们提出了一个详细的协议, 如何导入数据, 预处理它, 进行 t-SNE 降维度, 集群数据, 根据用户偏好对 & 过滤器集群进行排序, 并通过热图和新颖的方法显示感兴趣的集群的信息高维流箱图(图 1)。t-SNE 图中的轴是任意的, 以任意单位为单位, 因此为了用户界面的简单性, 并不总是在数字中显示出来。根据所指示标记的信号, “t-SNE 热图” 中数据点的着色从蓝色到黄色。在聚类解决方案中, 数据点的颜色是基于聚类数字的任意颜色。工作流的所有部分都可以在单面板 gui 中执行(图 2 & 表 1)。最后, 我们将演示使用 excyt 在以前发表的数据, 探索肾细胞癌的免疫景观的文献, 也用类似的方法进行分析。我们用来创建本手稿中的数字以及下面的协议的示例数据集可以在注册帐户时在 https://premium.cytobank.org/cytobank/projects/875 找到。

Protocol

1. 收集和准备细胞术数据 将所有单一污渍单独放置在文件夹中, 并按通道名称 (按荧光, 而不是标记) 标记。 2. 数据输入 & 预处理 若要暂停或保存整个分析管道, 请使用程序左下角的”保存工作区” 按钮将工作区另存为 “”。以后可以通过”加载工作区” 按钮加载的 mat ‘ 文件。不要一次运行该程序的多个实例。因此, 在加载新工作区时, 请…

Representative Results

为了测试 excyt 的可用性, 我们分析了 chevrier等人发布的一个程序数据集, 该数据集的标题是 “透明细胞肾癌的免疫图集”, 该小组在该数据集中对73例肿瘤样本进行了广泛的免疫面板分析。病人11。两个独立的面板, 一个髓质和淋巴板, 被用来表型表征肿瘤的微环境。我们的研究目的是总结他们的 t-SNE 和聚类分析的结果, 表明 excyt 可以用来得出相同的结…

Discussion

在这里, 我们提出了 excyt, 这是一个新的图形用户界面, 运行基于 matlab 的算法, 简化了对高维细胞术数据的分析, 允许没有编程背景的个人实现最新的高维数据分析算法。这种软件提供给更广泛的科学界将使科学家能够在直观和直接的工作流程中探索他们的流式细胞仪数据。通过进行 t-SNE 维数约简, 应用聚类方法, 能够快速通过这些聚类进行 s何种过滤, 并制作灵活、可定制的热图和高维流箱图, 科?…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

提交人没有得到任何承认。

Materials

Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

Riferimenti

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. . An efficient matlab algorithm for graph partitioning. , 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. . Pattern recognition and machine learning. , (2006).
check_url/it/57473?article_type=t

Play Video

Citazione di questo articolo
Sidhom, J., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

View Video