Waiting
로그인 처리 중...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Immunology and Infection

超 cyt: 一种用于简化高维细胞学数据分析的图形用户界面

Published: January 16, 2019 doi: 10.3791/57473

Summary

excyt 是一种基于 matlab 的图形用户界面 (gui), 允许用户通过常用的高维数据分析技术分析他们的流式细胞术数据, 包括通过 t-SNE 降低维数, 各种自动化和手动聚类分析方法、热图和新颖的高维流图。

Abstract

随着流式细胞仪的出现, 能够测量越来越多的参数, 科学家们继续开发更大的面板, 以表型地探索其细胞样本的特征。然而, 这些技术进步产生了高维数据集, 而在传统的基于手动的门控程序中, 这些数据集变得越来越难以客观地进行分析。为了更好地分析和呈现数据, 科学家们与具有分析高维数据专业知识的生物信息学家合作, 分析他们的流式细胞仪数据。虽然这些方法已被证明是非常有价值的研究流式细胞术, 他们尚未纳入一个简单和易于使用的包, 为缺乏计算或编程专业知识的科学家。为了满足这一需求, 我们开发了 excyt, 这是一种基于 matlab 的图形用户界面 (gui), 通过实施常用的高维数据分析技术, 简化了对高维流式细胞术数据的分析, 包括通过 t-SNE、各种自动和手动聚类分析方法、热图和新颖的高维流图来减小维数。此外, excyt 还为选定感兴趣的人群提供了传统的门控选项, 以便进一步进行 t-SNE 和聚类分析, 并能够直接在 t-SNE 图上应用门。该软件提供了处理已补偿或未补偿的 fcs 文件的额外优势。在需要采集后补偿的情况下, 用户可以选择为程序提供一个单一污渍的目录和一个未染色的样本。该程序检测所有通道中的正事件, 并使用此选择数据更客观地计算补偿矩阵。总之, excyt 提供了一个全面的分析管道, 以 fcs 文件的形式获取流式细胞仪数据, 并允许任何个人, 无论计算培训如何, 使用最新的算法方法来了解他们的数据。

Introduction

流式细胞术的进步以及大量细胞学的出现, 使临床医生和科学家能够快速识别出具有新分辨率的生物和临床上有趣的样品, 并对其进行表型表征, 从而产生较大的分辨率。信息丰富的高维数据集 1,2,3。虽然传统的流式细胞仪数据分析方法 (如手动门控) 对于那些标记很少且这些标记具有视觉可识别的数量的实验来说更为简单, 但这种方法可能无法生成分析高维数据集或在光谱上使用标记染色的数据集时可重现的结果。例如, 在一项多机构研究中, 正在进行细胞内染色 (ics) 检测, 以评估量化抗原特异性细胞反应的重现性, 尽管实验室间的精度和分析都很好, 特别是门控, 引入了一个重要的变异性来源 4。此外, 手工门控人口的过程, 除了高度主观, 是高度耗时和劳动密集型。然而, 以稳健、高效、及时的方式分析高维数据集的问题, 并不是研究科学的一个新问题。基因表达研究往往产生极高维的数据集 (往往按上百个基因的顺序), 在这些数据集中, 人工形式的分析根本不可行。为了解决这些数据集的分析问题, 在开发生物信息工具来分析基因表达数据方面做了大量的工作。这些算法方法最近刚刚被用于细胞学数据的分析, 因为参数的数量增加了, 并已被证明是非常宝贵的, 在分析这些高维数据集6,7

尽管产生和应用了各种算法和软件包, 使科学家能够将这些高维生物信息方法应用于他们的流式细胞术数据, 但这些分析技术在很大程度上仍然没有得到利用。虽然可能有多种因素限制了这些方法在细胞学数据方面的广泛采用, 但我们怀疑科学家使用这些方法的主要障碍是缺乏计算知识。事实上, 其中许多软件包 (flowcore、flowCore 和 opencyto) 都是用编程语言 (如 r) 编写的, 这些语言仍然需要实质性的编程知识。像 flowjo 这样的软件包由于使用简单、"即插即用" 的性质以及与 pc 操作系统的兼容性而受到科学家的青睐。为了向科学家不熟悉的编程提供各种公认和有价值的分析技术, 我们开发了 excyt, 这是一个图形用户界面 (gui), 可以很容易地安装在 pccymac 上, 它可以利用许多最新的技术包括用于直观可视化的维数约简、文献中引用的各种聚类方法, 以及新的特征, 用于利用热图和新颖的高维流箱图来探索这些聚类算法的输出。

excyt 是一个在 matlab 中构建的图形用户界面, 因此可以直接在 matlab 中运行, 也可以提供可用于在任何 pc/mac 上安装软件的安装程序。该软件可在 https://github.com/sidhomj/ExCYT。我们提出了一个详细的协议, 如何导入数据, 预处理它, 进行 t-SNE 降维度, 集群数据, 根据用户偏好对 & 过滤器集群进行排序, 并通过热图和新颖的方法显示感兴趣的集群的信息高维流箱图(图 1)。t-SNE 图中的轴是任意的, 以任意单位为单位, 因此为了用户界面的简单性, 并不总是在数字中显示出来。根据所指示标记的信号, "t-SNE 热图" 中数据点的着色从蓝色到黄色。在聚类解决方案中, 数据点的颜色是基于聚类数字的任意颜色。工作流的所有部分都可以在单面板 gui 中执行(图 2 & 表 1)。最后, 我们将演示使用 excyt 在以前发表的数据, 探索肾细胞癌的免疫景观的文献, 也用类似的方法进行分析。我们用来创建本手稿中的数字以及下面的协议的示例数据集可以在注册帐户时在 https://premium.cytobank.org/cytobank/projects/875 找到。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 收集和准备细胞术数据

  1. 将所有单一污渍单独放置在文件夹中, 并按通道名称 (按荧光, 而不是标记) 标记。

2. 数据输入 & 预处理

  1. 若要暂停或保存整个分析管道, 请使用程序左下角的"保存工作区" 按钮将工作区另存为 ""。以后可以通过"加载工作区" 按钮加载的 mat ' 文件。不要一次运行该程序的多个实例。因此, 在加载新工作区时, 请确保检查没有其他正在运行的 excyt 实例。
  2. 要开始分析管道, 请首先选择类型的细胞学 (流式细胞仪或质量细胞仪–cytof), 在"文件选择参数"下, 从文件中选择要采样的事件数 (在本例中使用 2, 000)。成功导入数据后, 将弹出一个对话框, 通知用户数据已成功导入。
  3. "自动补偿" 按钮执行可选的自动补偿步骤, 如 bagwell & adams9所做的那样。选择包含单个污渍的目录。在用户界面对话中选择未染色的示例。
    1. 在此目录中的任何示例上放置一个向前散射门, 这些示例将用于选择事件来计算补偿矩阵。建议将未染色的样品用于此目的。此时, 已经实现了一种算法, 在未染色样本的99% 处设置一致的阈值, 以定义每个单一污渍中的正事件来计算补偿矩阵。完成此操作后, 对话框将通知用户已执行补偿。
  4. 接下来, 按"门填充"并选择感兴趣的细胞群, 就像流式细胞术分析中的惯例一样。选择单元格填充后, 输入下游分析事件的百分比 (在此 10, 000个事件中)。
  5. 接下来, 在 "预处理" 框的最右侧的列表框中选择用于分析的数字通道 (使用示例中显示的特定通道)。

3. t-SNE 分析

  1. t-SNE按钮, 让程序开始计算在 t-SNE 按钮下方的窗口中进行可视化的缩减维数数据集。要保存 t-SNE 的图像, 请按保存 tsn 图像。在每台 cpu @ 3.4 ghz 和 8 gm ram 的机器上, 对于 10, 000个事件, 此步骤大约需要 2分钟, 50, 000个事件需要 10分钟, 100, 000个事件需要20分钟。
  2. 要创建 "t-SNE 热图", 如多个 cytof 出版物1011中所示, 请从"特定于标记的 t-SNE" 弹出菜单中选择一个选项 (使用示例中显示的特定标记 cd64 或 cd3)。将弹出一个图形, 显示可保存用于图形生成的 t-SNE 图形的热图表示形式。
  3. 在用户的 t-SNE 绘图中选择感兴趣的区域, 以便使用gate t-SNE按钮进行进一步的下游分析。

4. 聚类分析

  1. 若要开始聚类分析, 请在"聚类分析方法" 列表框中选择一个选项 (在本例中, 我们 dbscan 在列表框右侧的对话框中的距离因子为 5)。按"群集" 按钮。
  2. 对于 "自动群集参数" 面板中的自动聚类算法, 请使用以下选项之一:
    1. 硬 k联署 (在 t-sne 上): 将 k 均意味着将聚类应用于减少的二维 t-SNE 数据, 并要求将聚类数提供给算法12
    2. 硬 k联署 (关于 hd 数据): 将 k 均表示聚类应用于提供给 t-SNE 算法的原始高维数据。同样, 需要向算法提供集群的数量。
    3. dbscan:应用聚类分析方法, 称为基于密度的噪声应用程序的空间聚类, 该方法将减少的二维 t-SNE 数据进行聚类, 并需要一个非维距离因子来确定集群。这种类型的聚类算法非常适合于聚类 t-SNE 约简, 因为它能够聚类通常存在于减少的 t-SNE 表示中的非球面聚类。此外, 由于它在二维数据上运行, 因此它是更快的聚类算法之一。
    4. 分层群集:将传统的分层聚类方法应用于高维数据, 在为算法提供设置聚类大小的距离因子之前, 在所有事件之间计算整个欧几里得距离矩阵。
    5. 网络图形-基于: 应用最近引入的聚类方法来分析流式细胞术数据时, 有罕见的亚群, 用户希望检测11,14。此方法依赖于首先创建一个图形, 用于确定数据中所有事件之间的连接。此步骤包括提供一个初始参数来创建图形, 即 k 最近的邻居的数量。此参数通常控制群集的大小。此时, 会弹出另一个对话框, 要求用户使用应用于图形的5种聚类算法中的一种。其中包括3个最大限度地提高图形模块化的选项、d起方法和光谱聚类算法 1415161718。如果需要一个通常更快的聚类解决方案, 我们建议频谱聚类或快贪婪模块化最大化。虽然模块化最大化方法与 d起方法一起确定了最佳的聚类数, 但频谱聚类需要为程序提供群集的数量。
    6. 自组织地图:使用人工神经网络对高维数据进行聚类。
    7. gmm–预期最大化: 使用预期最大化 (em) 技术创建高斯混合模型来群集高维数据。19这种类型的聚类方法还要求用户输入群集的数量。
    8. gmm 的变分贝叶斯推理: 创建高斯混合模型, 但与 em 不同, 它可以自动确定混合物分量的数量 k. 20 虽然程序确实需要给出多个聚类 (大于(算法将自行确定最佳数量)。
  3. 若要研究 t-SNE 绘图的特定区域, 请按"手动选择群集"按钮以绘制一组用户定义的群集。值得注意的是, 群集不能共享成员 (, 每个事件只能属于1个群集)。

5. 集群过滤

  1. 可以通过以下方式筛选手动或通过上述自动方法之一标识的群集集。
    1. 若要按实验中测量的任何标记对群集 (在"群集筛选器" 面板中) 进行排序, 请从 "排序" 弹出菜单中选择一个选项。要设置顺序是升序还是降序, 请按 "排序" 弹出菜单右侧的"升序"按钮。这将更新 "群集 (过滤)" 列表框中的群集列表, 并按该标记的中位聚类表达式的降序对其进行重新排序。在 "群集 (过滤)" 列表框中表示的百分比表示此群集所代表的人口的百分比。
    2. 要在特定通道中为给定群集设置最小阈值, 请从"阈值" 弹出菜单中选择一个选项 (在本例中, 我们使用标记 cd65, 并将阈值设置为 0.75)。要么在图形下方的数字框中键入一个值, 要么使用滑条设置阈值。设置阈值后, 按"添加高于阈值" 或 "添加到阈值以下" 以指定阈值的方向。设置此阈值后, 它将在 "群集筛选器" 面板旁边的 "阈值" 框中列出, 其中将列出标记、阈值和方向, 以便用户了解当前正在应用的阈值。最后, t-SNE 图形将通过模糊不符合过滤要求的集群进行更新, 并且 "集群 (过滤)" 列表框将更新, 以显示满足过滤要求的集群。
    3. 要设置群集频率的最小阈值, 请在"群集频率阈值" (%) 中输入数字截止值"群集筛选器" 面板中的框 (在本例中使用 1%)。

6. 可视化 & 聚类分析

  1. 若要选择群集以进行进一步分析和可视化, 请选择 "群集 (过滤) " 列表框中的群集, 然后按"选择 a"按钮将其移动到 "群集分析" 列表框中。
  2. 若要创建群集的热图, 请在 "群集分析" 列表框中选择感兴趣的群集, 然后按"群集的热图"按钮。按下此按钮时, 将弹出一个图形, 其中包含热图以及集群和参数轴上的树状图。垂直轴上的树形图将按密切相关的群集进行分组, 而水平轴上的树突图将对相互关联的标记进行分组。要保存热图, 请按文件导出设置出口.
  3. 若要创建 "高尺寸框绘图" 或 "高维流图", 请在"群集分析" 列表框中选择感兴趣的群集, 然后按 "高尺寸框图块" 按钮或 "高维流图"按钮。这些图可以用于直观地评估不同集群在所有维度中的给定通道的分布。
  4. 要显示传统二维流图中的聚类, 请在"常规流图" 面板中选择变换 (线性、log10、arcsinh) 和通道, 然后按"常规流图".

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

为了测试 excyt 的可用性, 我们分析了 chevrier等人发布的一个程序数据集, 该数据集的标题是 "透明细胞肾癌的免疫图集", 该小组在该数据集中对73例肿瘤样本进行了广泛的免疫面板分析。病人11。两个独立的面板, 一个髓质和淋巴板, 被用来表型表征肿瘤的微环境。我们的研究目的是总结他们的 t-SNE 和聚类分析的结果, 表明 excyt 可以用来得出相同的结论, 并显示其他的可视化和聚类分析方法。

在原稿中, 该小组描述了22个由淋巴面板识别的 t 细胞团和由骨髓状体面板识别的17个细胞团簇。在出版物的图 3 &图 4中, 该组显示了群集的热图、带有颜色编码群集解决方案的 t-SNE 图以及子面板 a、b、& c 中的 t-SNE 热图。为了执行分析, 我们从 cytobank 获得了手动门控数据, 并从每个文件中采样了 2, 000个事件, 或者在每个文件的事件少于 2, 000个事件的情况下, 按照原稿中所示的分析管道获取了整个文件。此时, 我们通过门控后子采样参数共采样了 100, 000个事件, 进行了 t-SNE 分析, 并使用各种聚类方法以各种方式对数据进行了探索。

首先, 我们通过完成 t-SNE 分析和创建各种标记的热图 (图 3 a), 按照与原稿相同的分析管道检查骨髓板 (图 3 a)。虽然原稿将 t-SNE 热图归一化为每个标记的 99%, 但 excyt 并不为其热图执行这种类型的归一化操作。然而, 如原稿中所述, 标记共表达的分布相似。然后, 我们应用了一种基于网络图的数据聚类方法, 通过创建具有 100 k-th200 边邻居的图形, 并通过使用 excyt 中的快速贪婪实现优化图形的模块化来对图形进行聚类, 我们在那里发现了19(图 3b)。在将 excyt 创建的这些星团的热图与原稿中公布的热图进行比较时, 我们注意到我们能够识别出类似的骨髓细胞簇 (图 3c)。值得注意的是, 原稿确定并对比了我们在 hla-drint cd68int cd68intcd64 int cd36 int cd36+cd11b+ (第13组) 和 hla-dr + (hla-dr +) 中确定的两个亚群.cd4+cd68+cd64+cd36-cd11b- (第18集).通过这两个群体的高维框图进行可视化, 揭示了所提到的六个标记 (图 1d) 中的统计显著差异 (-惠特尼)。

接下来, 我们用一种更传统、更快的分层聚类方法对淋巴面板进行了分析。这种方法通过 t-SNE 热图得到了类似的标记分布 (图 4 a)。此外, 通过分层聚类分析对数据进行聚类 (图 4b), 显示了类似的淋巴细胞集群 (图 4B)。值得注意的是, 我们还通过我们的高维流图 (图 4d)原稿中确定了独特的监管 t 细胞群, 原稿定义为 cd4+cd25 + fffp3 + ctla-4+cd127-(集群 17)。

最后, 我们希望在 excet 中采用一种方法来快速、定量地评估标记之间的协联。我们首先使用硬 k 均值聚类算法在二维 t-SNE 数据上建立了 5, 000个聚类 (图 4e)。然后, 我们使用所有这些集群的所有标记的中位表达式, 从这些集群创建一个热图 (图 4f)。由于这些热图是群集行以及相似的列, 这种方法通过应用一个精细的集群网格, 然后创建热图来抽象数据, 使我们能够轻松地拾取关联, 例如 tim-3、pd-1、cd38 和4-1 b。

Figure 1
图 1: excyt 管道 & 功能。(a) excyt 首先导入原始 fcs 数据, 在下游分析之前应用可选的补偿、门控和随机子采样。这可确保所分析的所有事件都与所分析的实验相关。然后执行 t-SNE 降维来可视化所有事件, 并生成 t-SNE 热图以可视化表型分布。最后, 各种聚类算法可以应用于 t-SNE 变换或高维原始数据。(b)新的排序和阈值功能使用户能够快速对可能的数百个集群进行排序, 以找到感兴趣的集群。(c)可以创建群集的热图, 以检查多个集群之间的比较情况以及哪些标记是共同关联的。(d)在欣赏数据的高维性质的同时, 可以生成新的高维流框图, 作为原始数据上的背指控簇的一种形式。请点击这里查看此图的较大版本.

Figure 2
图 2: xcyt 图形用户界面:excyt 图形用户界面允许在用户导入数据、进行 t-SNE 维数缩减、聚类分析以及最终的聚类分析和可视化时, 从面板的左侧到右位置简化工作流程。请点击这里查看此图的较大版本.

Figure 3
图 3: 来自 chevrier 等人的髓质子群的重述.(a) 用网络图-h 聚类算法 (c) 聚类解决方案在骨髓面板 ( d)上识别的聚类图 ( d)中识别的聚类图编码的骨髓面板 ( b) t-SNE 图的髓板-sbe 热图维盒图比较对比对比骨髓亚群 (集群 13 & 18) 在原稿中引用请点击这里查看这个数字的更大版本.

Figure 4
图 4: 来自 chevrier 等人的淋巴亚群的重述.(a)由分层聚类算法编码的淋巴面板(b) t-SNE 图的淋巴面板 (b ) t-SNE 热图, 由聚类分析器识别的聚类图(d)高维流5, 000个聚类分析群聚类解决方案中确定的监管 t 细胞群图(第1集), 对 t-SNE 数据进行分析 ( f)由 k 均值聚类溶液识别的淋巴类聚类分析显示标记关联的面板。请点击这里查看此图的较大版本.

大声 笑 描述 名称 (在 gui 中)
1 选择细胞学的类型
2 原始数据的随机亚采样
3个 选择要分析的文件 选择文件
4个 基于提供给软件的单一污渍目录的原始数据自动补偿 自动补偿
5 选择用于 t-SNE 和聚类分析的事件的消息 门人口
6 门控数据的随机分采样 (绝对数字)
7。 门控数据的随机分样 (占门控人口的百分比)
8 选择要分析的渠道
9 运行 t-SNE 降维量 t-SNE
10 t-SNE 窗口
11 保存工作区 保存工作区
12 加载工作区 加载工作区
13 在选择标记上创建 t-SNE 热图
14 门 t-SNE 对选定人群进行重做 t-SNE 分析 t-SNE 门
15 将 t-SNE 窗口另存为图像 保存 tsbe 图像
16 选择聚类算法 聚类分析方法
17 输入给定算法的聚类参数
18 聚类分析 集群
19 手动绘制群集 手动选择群集
20 清除所有群集以重做群集分析 清除群集
21 在当前筛选条件下显示群集 集群 (过滤)
22 从 "群集分析" 列表框中删除选择群集 删除 <--
23 将群集添加到群集分析列表框 选择-->
24 创建分析中所有事件的常规热图 活动热图
25 按选择标记对群集进行排序 排序
26 通过选择标记设置阈值 阈 值
27 从群集分析列表框中创建选定群集的常规热图 集群的热图
28 排序的翻转顺序 腾飞/下降
29 清除所有阈值 清除所有阈值
30 设置群集的频率阈值 群集频率阈值 (%)
31 "群集 (过滤)" 列表框中活动的当前阈值列表 阈 值
32 高尺寸箱体图 高尺寸箱体图
33 高尺寸流量图 高尺寸流量图
34 常规流量图的水平轴参数
35 常规流量图的垂直轴参数
36 水平轴上常规流图的数据转换
37。 垂直轴上常规流图的数据转换
38 创建常规流量图 常规流程图
39 显示群集以进行分析

表 1: excyt gui 中存在的所有函数的概述

软件名称/套餐 excyt cyt fcs 快递 流芯 开放的西托 流量均值
程序类型 Matlab Matlab 独立应用程序 R R R
给用户的价格 自由 自由 1, 000 美元 自由 自由 自由
图形用户界面 是的 是的 是的
降维技术 t-SNE t-sne, pca t-SNE, pca, spade 没有 没有 没有
聚类算法 k 均值
dbscan
分层聚类分析
自组织地图
基于多网络图的方法
GMM-EM
gmm-变分贝叶斯推理
k 均值
GMM-EM
基于单网络图的方法 (留声表)
k 均值 没有 手动门控工作流程的自动化 k 均值
分选能力 是的
高尺寸流图 是的

表 2: 软件辅助流式细胞仪分析解决方案概述

Subscription Required. Please recommend JoVE to your librarian.

Discussion

在这里, 我们提出了 excyt, 这是一个新的图形用户界面, 运行基于 matlab 的算法, 简化了对高维细胞术数据的分析, 允许没有编程背景的个人实现最新的高维数据分析算法。这种软件提供给更广泛的科学界将使科学家能够在直观和直接的工作流程中探索他们的流式细胞仪数据。通过进行 t-SNE 维数约简, 应用聚类方法, 能够快速通过这些聚类进行 s何种过滤, 并制作灵活、可定制的热图和高维流箱图, 科学家们将不仅能够实现灵活、可定制的热图和高维流箱图。了解其样本中唯一定义的子群, 但能够创建直观且易于同事理解的可视化。

虽然该程序可以灵活地处理各种数据类型 (传统的流式细胞术与质量细胞学), 但对于程序的最佳效用, 有几个考虑因素。首先是关于数据质量, 特别是流式细胞术数据。适当的补偿和重叠发射光谱的解析是至关重要的。补偿不足的数据会无意中导致标记的错误协联和不具有真正生物意义的集群的形成。因此, 在进行 t-SNE 分析和进一步的下游分析之前, 输入数据具有良好的质量是非常可取的。此外, 使用 excyt 中实现的自动补偿算法需要所有通道都有清晰的单色污渍, 以便准确计算补偿参数。

使用 excyt 的另一个重要考虑因素是, 当将多个 fcs 文件连接到一个分析中 (如本手稿所示) 时, 它们必须在所有渠道中进行比较。首先, 这意味着需要在所有样本中使用相同的面板,并且样本之间没有跨所有通道的漂移。例如, 如果一个人在不同的日子里阅读两个样本, 在这两天在 fitc 中染色 cd8, 但在一天内, 细胞仪的电压设置不同, 导致 cd8 群稍有移动, 那么在下游分析中就会产生错误的聚类, 因为这种转变是作为仪器变化的函数产生的, 而不是由于生物意义。虽然 excyt 的未来版本可能能够将样本归一化到它们的单一污渍, 但在这一点上, 必须仔细考虑 fcs 文件可以相互比较, 然后再将它们导入到 excyt 中。

最后, 聚类分析的过程并不是绝对的。不同的聚类算法和参数可以生成不同的聚类解。该算法的解是否合适, 是由用户通过综合他们对生物学的理解和聚类解决方案来确定的。例如, 当了解肿瘤的免疫环境时, 一个人可能对宏观星团 (t 细胞与 b 细胞对骨髓细胞) 感兴趣, 而另一个人可能对宏观星团的亚群感兴趣。群集的分辨率由用户决定, 因此, 没有一个群集解决方案是 "正确的"。这是使用 excyt 中提供的高维流图的主要优点之一。可视化给定集群在所有通道中的分布的能力可以帮助用户确定他们是否不仅以与生物学相关的方式聚集, 而且以与实验中提出的科学问题相关的方式进行分组。虽然我们的目标是提供文献中用于聚类高维流式细胞术数据的大量方法, 同时提供其他聚类方法, 但我们建议使用 k-pift 和 dbscan 等方法通过快速浏览数据迭代群集数量和大小, 并转向网络图和高斯混合模型方法, 以便采用更可靠但更耗时的方法。

考虑到这些因素, excyt 仍然是探索高维细胞术数据的一个高度灵活和有价值的工具, 并提供了独特的差异化功能, 而不是其他可用的软件包来进行这种类型的分析(表 2).首先, excet 利用维数约简和聚类算法的方法, 在没有任何脚本编程知识的情况下使用, 在大多数流式细胞术分析方法上进行了区分。此外, 通过聚合文献中引用的许多聚类算法, 我们相信我们为聚类数据提供了最多的选项。最后, 我们通过新的高维流图进行集群过滤和分类以及显示的独特功能, 使用户能够快速、高效地探索其集群的特征, 从而使 "发现" 过程变得罕见亚人口简单和有效。

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

作者没有什么可透露的。

Acknowledgments

提交人没有得到任何承认。

Materials

Name Company Catalog Number Comments
Desktop SuperMicro Custom Build Computer used to run analysis
MATLAB Mathworks N/A Software used to develop ExCYT

DOWNLOAD MATERIALS LIST

References

  1. Benoist, C., Hacohen, N. Flow cytometry, amped up. Science. 332 (6030), 677-678 (2011).
  2. Ornatsky, O., et al. Highly multiparametric analysis by mass cytometry. Journal of immunological methods. 361 (1), 1-20 (2010).
  3. Tanner, S. D., et al. Flow cytometer with mass spectrometer detection for massively multiplexed single-cell biomarker assay. Pure and Applied Chemistry. 80 (12), 2627-2641 (2008).
  4. Maecker, H. T., et al. Standardization of cytokine flow cytometry assays. BMC immunology. 6 (1), 13 (2005).
  5. Brazma, A., Vilo, J. Gene expression data analysis. FEBS letters. 480 (1), 17-24 (2000).
  6. Pyne, S., et al. Automated high-dimensional flow cytometric data analysis. Proceedings of the National Academy of Sciences. 106 (21), 8519-8524 (2009).
  7. Ge, Y., Sealfon, S. C. flowPeaks: a fast unsupervised clustering for flow cytometry data via K-means and density peak finding. Bioinformatics. 28 (15), 2052-2058 (2012).
  8. Venkatesh, V. Determinants of perceived ease of use: Integrating control, intrinsic motivation, and emotion into the technology acceptance model. Information systems research. 11 (4), 342-365 (2000).
  9. Bagwell, C. B., Adams, E. G. Fluorescence spectral overlap compensation for any number of flow cytometry parameters. Annals of the New York Academy of Sciences. 677 (1), 167-184 (1993).
  10. Lavin, Y., et al. Innate immune landscape in early lung adenocarcinoma by paired single-cell analyses. Cell. 169 (4), 750-765 (2017).
  11. Chevrier, S., et al. An immune atlas of clear cell renal cell carcinoma. Cell. 169 (4), 736-749 (2017).
  12. Hartigan, J. A., Wong, M. A. Algorithm AS 136: A k-means clustering algorithm. Journal of the Royal Statistical Society. Series C (Applied Statistics). 28 (1), 100-108 (1979).
  13. Ester, M., Kriegel, H. P., Sander, J., Xu, X. Density-based spatial clustering of applications with noise. International Conference Knowledge Discovery and Data Mining. 240, (1996).
  14. Levine, J. H., et al. Data-driven phenotypic dissection of AML reveals progenitor-like cells that correlate with prognosis. Cell. 162 (1), 184-197 (2015).
  15. Blondel, V. D., Guillaume, J. L., Lambiotte, R., Lefebvre, E. Fast unfolding of communities in large networks. Journal of statistical mechanics: theory and experiment. 2008 (10), P10008 (2008).
  16. Le Martelot, E., Hankin, C. Fast multi-scale detection of relevant communities in large-scale networks. The Computer Journal. 56 (9), 1136-1150 (2013).
  17. Newman, M. E. Fast algorithm for detecting community structure in networks. Physical review E. 69 (6), 066133 (2004).
  18. Hespanha, J. P. An efficient matlab algorithm for graph partitioning. , University of California. 1-8 (2004).
  19. Moon, T. K. The expectation-maximization algorithm. IEEE Signal processing. 13 (6), 47-60 (1996).
  20. Bishop, C. M. Pattern recognition and machine learning. , Springer. (2006).

Tags

收回 第143期 流式细胞仪 高维分析 t-SNE 聚类 热图 降维度
超 cyt: 一种用于简化高维细胞学数据分析的图形用户界面
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Sidhom, J. W., Theodros, D., Murter, More

Sidhom, J. W., Theodros, D., Murter, B., Zarif, J. C., Ganguly, S., Pardoll, D. M., Baras, A. ExCYT: A Graphical User Interface for Streamlining Analysis of High-Dimensional Cytometry Data. J. Vis. Exp. (143), e57473, doi:10.3791/57473 (2019).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter