Biology

使用表征细胞周期同步损失模型进行跨实验比较的同步时间序列数据比对

Published: June 9, 2023 doi: 10.3791/65466

Sophia A. Campione¹, Christina M. Kelliher², David A. Orlando³, Trung Q. Tran⁴, Steven B. Haase¹

¹Department of Biology, Duke University, ²Department of Biology, University of Massachusetts, ³Orlando Data Science LLC, ⁴Department of Computer Science, Duke University

Summary

分析同步时间序列实验的一个挑战是，实验在同步恢复时间和细胞周期周期方面通常不同。因此，来自不同实验的测量结果无法汇总分析或轻松比较。在这里，我们描述了一种对齐实验的方法，以便进行特定于阶段的比较。

Abstract

研究细胞周期通常取决于同步细胞群，以测量细胞遍历细胞周期时时间序列中的各种参数。然而，即使在类似的条件下，重复实验也显示出从同步恢复和穿越细胞周期所需的时间差异，从而阻止了每个时间点的直接比较。在突变群体或影响同步恢复时间和/或细胞周期的替代生长条件下，比较实验动态测量的问题会加剧。

我们之前发表了一个名为表征细胞周期同步损失（CLOCCS）的参数数学模型，该模型监测同步细胞群如何从同步释放并通过细胞周期进行。然后，可以使用从模型中学习到的参数将同步时间序列实验中的实验时间点转换为归一化的时间尺度（生命线点）。生命线量表不是代表从实验开始到几分钟经过的时间，而是代表从同步到细胞周期进入，然后通过细胞周期的各个阶段的进展。由于生命线点对应于同步群体中平均细胞的阶段，因此这种归一化的时间尺度允许在实验之间进行直接比较，包括具有不同周期和恢复时间的实验。此外，该模型已被用于对齐不同物种（例如，酿酒酵母和 庞贝裂殖酵母）之间的细胞周期实验，从而能够直接比较细胞周期测量，这可能会揭示进化的相似性和差异性。

Introduction

在细胞周期中同步进行的时间序列测量是研究控制细胞周期进程机制的标准方法¹，²，³，⁴，⁵，⁶，⁷^，⁸.跨同步/发布时间序列实验进行比较的能力对于我们理解这些动态过程至关重要。使用重复实验来证实研究结果可以增加结论可重复性的信心。此外，环境条件之间、突变体之间甚至物种之间的比较可以揭示许多关于细胞周期调控的新见解。然而，从同步恢复和细胞周期进展速度的实验间变异性损害了在重复之间或在改变细胞周期时间的实验之间进行时间点到时间点比较的能力。由于这些挑战，重复通常不包括在完整的时间序列中（例如，Spellman等^人4）。当收集整个时间序列的重复时，无法汇总分析数据，而是使用单个重复进行分析，而其他重复通常降级为补充数字（例如，Orlando et ^al.8）。此外，具有不同回收率或细胞周期进展特征的实验之间的比较是困难的。如果^跟踪这些标志物事件，则测量感兴趣的事件和细胞周期标志物之间的较小间隔（例如，芽出现，S期进入或后期发作）可以帮助减少误差1，²，³，⁹，^10，11^，¹²。但是，使用这些临时方法，细微但重要的差异可能仍未被发现或模糊。最后，单细胞分析允许在不依赖同步或比对的情况下分析细胞周期进程¹³，尽管单细胞研究中的大规模测量可能具有挑战性且成本高昂。

为了克服这些困难，我们开发了表征细胞周期同步损失（CLOCCS）模型，以帮助分析对同步群体进行的时间序列测量¹⁴^，¹⁵。CLOCCS是一种灵活的数学模型，它描述了同步细胞在细胞周期阶段中的分布，因为它们在细胞周期中从同步中释放并取得进展。分支过程框架使该模型能够解释母细胞和子细胞分裂后的不对称质量 ，如酿酒酵母 所观察到的，同时仍然适用于通过裂变分裂的生物，如 S. pombe。该模型可以从一组不同的测量类型中获取输入，以指定细胞周期阶段。它可以摄取出芽细胞周期阶段数据，其中包括随时间推移的芽细胞百分比的测量，从而可以估计未出芽G1阶段¹⁴^，¹⁵之外的细胞数量。该模型还可以摄取测量DNA含量的流式细胞术数据，从而能够评估从G1到S，S到G2以及M到G1¹⁵的里程碑式转变。荧光形态标志物也可用于识别细胞周期阶段。肌球蛋白环、细胞核和纺锤体极体（SPB）的荧光标记可用于确定细胞周期阶段，这些被纳入CLOCCS模型¹¹;但是，这些测量将不在本协议中描述。此外，分离指数被用作S . pombe¹⁴建模数据的输入。因此，该模型可用于各种生物体的细胞周期分析，并且可以进一步扩展。

CLOCCS是一个参数模型，允许从输入数据（例如，出芽百分比，DNA含量）对多个参数进行完整的贝叶斯推断。这些参数包括同步恢复时间，细胞周期的长度（母细胞和子细胞分别估计）以及细胞在每个时间点的平均细胞周期位置。这些参数代表了群体中平均细胞的行为，使研究人员能够将每个时间点映射到表示为生命线点的细胞周期位置。到生命线点的转换取决于 CLOCCS 参数 lambda （λ）和 mu0 （μ₀）¹⁴^，¹⁵。参数λ对应于母细胞的平均细胞周期。然而，由于母女延迟¹⁴，¹⁵^，这不是包括母细胞和子细胞的完整群体的平均细胞周期。CLOCCS还推断参数delta（δ），该参数对应于母子延迟，因此可以计算整个群体的平均细胞周期。最后，由于每个实验在从细胞周期同步释放后开始，因此从同步方法恢复所需的时间由 CLOCCS 参数_{μ 0} 表示。CLOCCS 将模型拟合到输入细胞周期阶段数据，然后使用随机游走马尔可夫链蒙特卡罗算法¹⁴^，¹⁵ 推断这些参数。通过将多个实验映射到共同的细胞周期生命线时间尺度，可以在重复或恢复时间或细胞周期周期^{不相同的实验}之间进行直接的阶段特异性比较8，¹⁴^，¹⁵。

由于同步群体在时间序列^14，15^，¹⁶，¹⁷的过程中以某种速率失去同步^，同步丢失率的可变性也会阻碍实验之间的定量比较。通过确定种群的位置及其分布的方差，CLOCCS解释了同步损失率的差异。这个强大的工具允许跨实验进行具体和详细的比较，从而不仅能够在重复之间，而且能够在环境条件、突变体甚至具有显着不同细胞周期计时¹⁴^，¹⁵ 的物种之间进行直接相关比较。

本文描述了一种使用CLOCCS的方法，通过拟合同步/发布时间序列实验的数据来估计参数，将数据映射到共同的生命线尺度，然后在重复或实验之间进行相关比较。生命线比对允许在这些实验中进行直接的阶段特异性比较，从而可以聚合和比较重复，并在具有不同恢复时间和细胞周期的实验中进行更相关的比较。

Subscription Required. Please recommend JoVE to your librarian.

Protocol

1. 收集细胞周期阶段和实验数据

使用所需的同步方法（例如，Leman等人¹⁸中描述的离心淘析或Rosebrock 19中描述的交配信息素停滞;Leman等人¹⁸和Rosebrock¹⁹也包括从同步释放的方法）使细胞相对于细胞周期同步同步）。在整个时间序列中开始采样，确保时间序列的长度至少为两个完整的细胞周期，并且最好在每个细胞周期中收集至少 10 个样本。在每个时间点，收集细胞周期期数据（出芽或流式细胞术）的样品和实验数据的样品，如下所述。
如果使用出芽数据作为细胞周期阶段数据，请收集有关出芽的数据以进行 CLOCCS 比对。
1. 在整个时间序列中采样。对于每个时间点，收集细胞，并通过将 200 μL 超声细胞培养物与 200 μL 固定剂溶液混合来固定它们，如 Leman 等人 ¹⁸ 中所述。
2. 对于标准出芽，使用具有40倍物镜和血细胞计数器的透射光学显微镜在每个时间点至少计数200个细胞。将步骤1.2.1中的细胞样品加入血细胞计数器中，如果密度阻止计数，则稀释。记录每个时间点的出芽和未出芽细胞的数量。计算出芽细胞的百分比，并绘制出芽曲线中每个时间点的图。
  注意：指定细胞周期阶段信息的其他方法可用，但本协议中未描述这些方法。其他方法在 CLOCCS 自述文件和以前的工作¹¹ 中进行了描述。
如果使用流式细胞术 DNA 含量数据作为细胞周期阶段数据，请收集流式细胞术 DNA 染色数据以进行流式细胞术 CLOCCS 比对。
1. 在整个时间序列中采样。对于每个时间点，收集细胞，并按照Haase和Reed²⁰中的描述修复它们。
2. 对DNA进行染色，并使用标准流式细胞术分析进行分析。Haase和Reed²⁰中描述了酿酒酵母的推荐染色方案。
收集相关的组学或相关的实验数据。对于标准转录组学数据，如Leman等人¹⁸ 和Kelliher等人²¹^，²²中所述进行收集。确保数据与包含细胞周期阶段数据的时间点相关联，以便进行下游对齐。为了获得最佳对齐效果，请确保包含实验数据的每个时间点也具有与之关联的相位数据。
注意：实验数据可以采取多种形式。传统上，我们使用描述的比对方法来比对时间序列转录组学实验。然而，与时间点相关的任何类型的数据都可以对齐（即蛋白质组学²²）。

2. 安装所需软件

注意：本节假定已安装 Conda、Java 19 和 Git（材料表）。

通过在终端中输入以下命令来下载CLOCCS_alignment存储库：
git clone git clone https://gitlab.com/haase-lab-group/cloccs_alignment.git
使用 conda_req.yml 文件创建 Conda 环境，方法是在克隆CLOCCS_alignment存储库的文件夹中的终端中输入以下命令：
Conda env create -f conda_req.yml

3. 使用CLOCCS对实验进行参数化

双击CLOCCS_alignment存储库中 CLOCCS 文件夹中的cloccs_v2023.jar文件，然后等待图形用户界面打开。此屏幕允许输入 CLOCCS 运行的选项，并在运行后显示结果。
输入常规设置。
1. 通过在关联的文本输入框中键入来设置 Sim 退火、烧入和迭代。模拟退 火（模拟退 火）识别良好的起始参数值，“ 燃烧” 搜索后验模式， 最后阶段 允许得出所有后验推断。较高的值会增加运行时间，但也会增加准确性。
2. 通过使用标记为温度的文本框和下拉菜单 Synchro 指定以摄氏度为单位的温度和同步方法来输入实验条件。方法，分别。
3. （可选）在“高级设置”菜单中配置高级设置。高级设置允许为每个参数设置先验（“mu0”、“sigma0”、“sigmav”、“lambda”、“bud.start”、“bud.end”）。
  注意：有关高级设置的详细信息，请参阅自述文件.txt CLOCCS_alignment存储库的 CLOCCS 文件夹中。
输入用于出芽数据的设置。
1. 从 模型类型 下拉菜单中选择适当的选项。默认选项芽用于出芽酵母的标准出芽信息。
  注意：下拉菜单中还存在其他更高级的选项：突变体用于经历多个出芽周期而没有分裂的突变体的出芽信息，BudSSLSMR 用于出芽信息和额外的纺锤体极体和肌球蛋白环信息，BudNucDivNeck用于出芽信息以及额外的分裂和芽颈细胞核信息。这些高级选项在 CLOCCS 自述文件和以前的工作¹¹、¹⁴^、¹⁵ 中进行了描述。
2. 使用“数据导入 ”面板导入数据 ，方法是在文本输入框中键入内容，或通过单击 “选择文件” 按钮上传文件。第一列指定时间点。其余两列指定出芽数据，并且可以采用以下任一选项：未出芽细胞数（无芽）、芽细胞数（芽）或细胞总数（总计）。
输入用于流式细胞术数据的设置。对于每个实验 ，请运行 步骤 3.3 或步骤 3.4。
注意：流式细胞术数据和出芽数据可以一起使用。虽然之前我们描述了将它们一起运行¹⁵，但对于此工具，它们必须独立运行，然后进行比较。
1. 按照 补充文件 1 （在CLOCCS_alignment存储库中也称为 CLOCCS/flow_cytometry_conversion_instructions.txt）中的说明，将 .fcs 文件转换为正确的流式细胞术 CLOCCS 输入格式。
2. 从模型类型下拉菜单中选择流选项。
3. 使用 “数据导入”面板导入数据。单击 “选择文件”，然后选择在步骤 3.4.1 中生成的文件。
4. 通过在拟合时间框中选择时间点，选择应绘制流式细胞仪 CLOCCS 拟合的时间点。
为出芽或流式细胞术选择所有输入后，单击“ 应用 ”按钮，然后单击屏幕顶部的 “样品 ”按钮。
通过选择预测拟合选项卡，查看具有 预测拟 合的出芽曲线或流式细胞术图。默认情况下，此选项卡在上一步之后立即打开。
查看每个参数的参数直方图，方法是选择 “参数直方图 ”选项卡，然后从以下选项中选择与感兴趣参数对应的子选项卡： mu0、delta、sigma0、sigmav、lambda、bud.start、bud.end 等。
通过选择后验分数选项卡查看后验分数图。
查看设置，并通过选择“ 设置 ”选项卡进一步更改它们;通过选择“日志”选项卡查看以前运行的日志。
通过选择后 验参数 选项卡从拟合中获取 CLOCCS 参数。生成的表将具有以下形式：每行由一个参数组成，最后一行是后排。这些列由均值的预测参数、2.5% 的置信区间下限、97.5% 的置信区间上限和接受率组成。
1. 记录用于每个实验的比对参数：同步恢复时间（μ₀）和母细胞的平均细胞周期（λ）。
2. 通过计算母细胞周期（λ）和子细胞周期（λ + δ）的平均值来计算细胞周期，其中δ是子细胞特异性延迟。
  注意：重复第3节，将所有实验包括在比较中。

4. 使用 Python 转换函数和 CLOCCS 参数将时间点转换为生命线点

注：时间点和生命线点之间的转换需要两个转换公式²¹.CLOCCS_alignment存储库中提供了用于转换和数据可视化的 Python 实现，如下所述。

通过在终端中输入以下命令来激活 Conda 环境：conda 激活CLOCCS_alignment
通过在终端中键入以下命令打开交互式 Python 笔记本：Jupyter 笔记本
在所需文件夹中创建新的 Python 笔记本。
注意：已包含一个示例笔记本来演示标准用法，可以在CLOCCS_对齐存储库的 Alignment/JOVE_example.ipynb 中找到。
通过在第一个单元格中运行以下命令来导入包含对齐函数的 Python 文件：
%运行path_to_repo/cloccs_alignment/对齐/实用程序.py
1. 将CLOCCS_alignment存储库的路径替换为path_to_repo。
如果使用出芽数据作为单元周期阶段数据，则通过在新单元中运行以下命令来导入包含每个时间点出芽百分比的数据框：
budding_df = pd.read_csv（“path_to_folder/budding_filename.tsv”， sep =“\t”， index_col=0）
1. 替换相应的文件路径和文件名。如果该文件是.csv文件，请删除 sep =“\t”
如果使用出芽数据作为细胞周期阶段数据，则通过在新像元中输入以下函数，将出芽数据与生命线点时间刻度对齐：
aligned_budding_df = df_conversion_from_parameters（budding_df、时间点、param_mu0、param_lambda）
1. 对于时间点，将时间点列表替换为budding_df数据框的索引。
2. 对于param_mu0和param_lambda，请将第 3 节中萌芽的 CLOCCS 运行中学到的参数替换为实验。
如果使用流式细胞术数据，请在新单元格中运行以下命令来导入流式细胞术数据：
flow_samples = flow_cytometry_import（flow_input_folder）
1. 对于flow_input_folder，请替换包含流式细胞术 .fcs 文件的文件夹的相应路径。
如果使用流式细胞术数据，请在新单元格中键入以下命令，为每个实验的时间点和生命线点生成转换表：
flow_converter = convert_tp_to_ll（时间点、param_mu0、param_lambda）
1. 对于时间点，请替换流式细胞术数据中的时间点列表。
2. 对于param_mu0和param_lambda，请替换从第3节中运行的流式细胞术CLOCCS中学到的参数进行实验。
通过在新单元格中运行以下命令，将包含实验数据的数据框导入笔记本：
data_df = pd.read_csv（“path_to_folder/exp_data_filename.tsv”， sep =“\t”， index_col=0）
1. 替换相应的文件路径和文件名。如果该文件是.csv文件，请删除 sep =“\t”。
  注意：可以对任何表格数据执行此操作。实验数据必须仅将时间点作为数据框的列或索引。可以在CLOCCS_alignment存储库中找到示例数据。
通过在新单元格中输入以下函数，将实验数据与生命线点时间刻度对齐：
lifeline_aligned_df = df_conversion_from_parameters（data_df、时间点、param_mu0、param_lambda、插值、下部、上部）
1. 对于时间点，请将时间点列表替换为上一步中实验data_df的索引或列。
2. 对于param_mu0和param_lambda，请替换第 3 节中从 CLOCCS 获得的值。
  注意：参数可以来自在任何接受的细胞周期相数据类型上执行的任何CLOCCS运行。
3. （可选）将插值替换为 True 或 False，或留空（默认值为 False）。
  注意：设置为 False 时，不会插值数据。设置为 True 时，将对生命线点进行舍入和插值，以填充生命线点之间的值，以便在生命线点的范围内每个整数都有一个点。这样可以更好地跨数据集进行比较。
4. （可选）将下层和上层替换为无或 整数值。
  注意：如果设置为 “无”，则保留插值后的所有生命线点。提供整数时，这将截断数据，以便生命线点的范围从较低到较高。这允许跨具有不同下层或上层的数据集进行比较。
通过在新单元格中输入以下命令来下载与生命线对齐的数据集：lifeline_aligned_df.to_csv（“path_to_desired_location/name_of_file.tsv”， sep = “\t”）
重复步骤4.5-4.11，将所有实验包含在比较中。

5. 比较出芽曲线和流式细胞术数据

通过使用 Python 实用程序功能在新单元格中输入以下命令，在对齐之前绘制出芽曲线：
plot_budding_curves（list_of_budding_curves， list_for_legend = leg_list， point_type = str_type，标题 = str_title）
1. 替换包含所有所需出芽曲线的数据框的列表，以绘制 list_of_budding_curves-[bud_df1、bud_df2、bud_df3]。
2. 如果需要，将图例的标签列表 - [实验 1，实验 2，突变体] 替换为leg_list。如果不是，请排除或替换“ 无”。
3. 用时间代替str_type。
4. 如果需要，将字符串标题 “比较萌芽曲线” 替换为str_title。如果不是，请替换“ 无”或排除。
按照步骤 5.1 中的说明，使用 Python 实用程序功能绘制对齐后的萌芽曲线，但用对齐的萌芽曲线列表代替list_of_budding_curves，用 生命线 代替 point_type而不是时间。
要绘制流式细胞术数据，请使用步骤4.8中生成的转换器在相应的生命线点绘制.fcs文件中的相关数据。
使用转换器表将生命线点转换为细胞周期阶段（表1）。
注意：也可以按照步骤5.1中的说明绘制此图， 但相位表示 point_type而不是时间。

6. 比较实验数据

根据文献信息或研究感兴趣的基因确定要在折线图中绘制的基因列表。
使用 Python 实用程序文件中提供的plot_linegraph_comparison，通过在新单元格中键入以下命令，对原始、对齐或对齐和插值的数据框执行折线图比较：
plot_linegraph_comparison（list_of_dfs， list_for_legend，基因列表， point_type = str_type，标题 = str_title）
1. 将要比较的实验的数据框列表替换为list_of_dfs。
  注：数据框可以未对齐或对齐;但是，必须在步骤 6.2.4 中输入相应的point_type。
2. 按照与list_for_legend数据框列表相同的顺序替换每个数据框的标题列表。
3. 替换要为基因列表绘制的基因名称列表（必须包含在数据框的索引中）。
4. 将点类型替换为str_type。对步骤 6.2.1 中的对齐数据框使用生命线（默认值为生命线点刻度）或相位（细胞周期阶段生命线刻度），或在步骤 6.2.1 中对未对齐的数据帧使用时间。
5. 将可选的字符串标题替换为str_title。
使用文献或算法确定要包含在热图中的基因列表，以确定顶级周期基因。
注意：为了进行正确的热图比较，应在步骤 6.2 中对齐、插值和时间刻度调整数据;对于每个实验，它应具有相同的开始和结束生命线值。
1. 运行周期性算法以确定顶部周期基因²³，²⁴^，或使用所需的替代方法来确定基因列表（即文献结果）。
2. 在新单元格中使用以下命令将 .csv 或 .tsv 基因列表文件导入笔记本：
  sort_df = pd.read_csv（“path_to_folder/sorting_filename.tsv”， sep=“\t”， index_col=0）
3. 替换相应的文件路径和文件名。如果该文件是.csv文件，请删除 sep=“\t”。
使用 Python 实用程序文件中提供的函数plot_heatmap_comparison，通过在新单元格中键入以下命令，对对齐、插值和相位对齐的数据框执行热图比较：
plot_heatmap_comparison（list_of_dfs、list_for_legend、基因列表、标题 = str_title）
1. 替换要比较的实验的对齐数据框列表，以list_of_dfs。
2. 按照与list_for_legend数据框列表相同的顺序替换每个数据框的标题列表。
3. 替换要为基因列表绘制的基因名称列表（必须包含在数据框的索引中）。
4. 将可选的字符串标题替换为str_title。
  注意：列表中的第一个数据帧是将用于对热图中的基因进行排序的数据框。基因将按该数据框的第一个周期中的最大值排序，并且列表中的后续数据框将使用相同的顺序。

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

上述协议和图1 中工作流程中描述的步骤应用于五个细胞周期同步时间序列实验，以证明两种代表性的比较：具有不同同步方法（交配信息素和离心淘析¹⁸）和测序平台（RNA测序[RNA-seq]和微阵列）的重复之间，以及跨实验条件。用 酿酒酵母进行多次实验，收集每个实验的细胞周期期和实验数据。工作流程包括使用 CLOCCS 对各种同步/发布时间序列实验进行参数化，使用这些参数将实验与常见的可比较生命线规模对齐，然后使用这些对齐的实验进行两个代表性比较。

为了证明跨重复的代表性比较，我们选择了在相同菌株和相同实验条件下进行的三个实验，称为条件1。其中两个实验是彼此的直接重复，并且都通过微阵列分析进行分析，并通过离心淘析同步。第三个实验使用RNA-seq分析进行分析，并通过α因子交配信息素阻滞同步。为了证明具有不同细胞周期的实验的第二次比较，将上述条件1 RNA-seq实验（细胞周期：71分钟）与条件2（细胞周期：82分钟）和条件3（细胞周期：110分钟）进行比较（表2）。对于每个实验，细胞在各自的条件下生长，同步，释放，然后在两个或多个细胞周期中采样。收集出芽和/或流式细胞术数据以提供有关细胞周期阶段的信息，并收集微阵列或RNA-seq时间序列转录组学数据，如Leman等人¹⁸ （补充表S1）中所述。

对于每个实验，数据采用图 2 中描述的形式，其中将条件 2 实验作为演示示例。每个数据集都有一个萌芽曲线，可以推断细胞周期阶段。该曲线由时间序列中每个时间点的出芽百分比值组成，然后绘制该值以产生显示多个细胞周期振荡的出芽曲线（图2）。细胞周期阶段数据还采用时间序列中每个时间点的流式细胞术DNA含量染色数据的形式。绘制条件 2 的选择时间点（图 2）。流式细胞术文件被合并到一个表中，其中包含每个时间点每个对数荧光箱中的细胞，以便使用Python实用程序中的flow_cytometry_CLOCCS_file_from_fcs功能输入CLOCCS。每个数据集还包含实验数据。在这种情况下，数据是转录组学数据，数据被组织成基因行，每个基因在实验的每个时间点都有一个RNA丰度值（图2）。

我们已经演示了CLOCCS的使用以及条件2 RNA-seq数据集向生命线点的转换;然而，这个过程对于其他实验也是相同的。将萌芽信息输入到CLOCCS算法中，如协议第3节所述，如图3A所示。使用了 Sim 退火、烧入、迭代和高级设置的默认值。选择合适的实验条件。“芽”的模型类型用于萌芽数据。观察所得的CLOCCS出芽拟合，以确保出芽曲线正确拟合，如数据点用95%的小置信带叠加相应的拟合曲线所示（图3B和补充图S1）。记录后验参数表（图3C）中的参数μ_0和λ，用于对齐。将条件2的流式细胞术数据分别输入到CLOCCS中，如方案第3节所述。目前，CLOCCS预计流式细胞仪将产生10位数据，具有1，024个通道;然而，现代流式细胞仪可以有更多的通道。由于我们的流式细胞仪产生的数据超过 1，024 个通道，因此数据被分箱到 1，024 个箱中。利用流式细胞术细胞周期阶段数据，CLOCCS为每个选定的时间点生成适合的CLOCCS（图3D和补充图S2），并提供类似于图3C中出芽的后验参数表的后验参数表。表2描述了CLOCCS为其他每个实验运行的出芽参数，补充表S2描述了CLOCCS运行的流式细胞术参数。

使用母细胞周期（λ）和恢复时间（_{μ 0}）对应的CLOCCS参数进行生命线比对。需要注意的是，λ并不一定代表细胞群的平均细胞周期。在细胞经历完全分裂的情况下，母细胞和子细胞的数量相等，因此平均细胞周期是母细胞的细胞周期（λ）和子细胞的细胞周期周期（λ + δ）之间的平均值;具体而言，delta（δ）是子级特定延迟的长度。这是我们用于每个实验的细胞周期周期的计算（表2）。对于每个实验，相应的参数λ和μ 0随后用于Python实用程序文件中提供的转换函数df_conversion_from_parameters，如条件2所示（图4A）。对于萌芽曲线，数据未插值。但是，对于实验数据，使用插值对生命线对齐的数据集进行重采样，以便每个生命线点都包含插值数据以改进绘图。为了确保与生命线对齐的数据集具有相同的生命线点范围，设置了生命线下限和上限以截断这些点的数据。当插值设置为 True 时，这些较低和上部参数将输入到 df_conversion_from_parameters 函数中。对于条件 1 比较，对于所有数据集，它们分别设置为 44 和 270，对于跨环境条件的比较，它们分别设置为 50 和 300。在示例 Python 笔记本 JOVE_example.ipynb 中可以看到这些函数用于对齐和比较的示例用法，用于生成图形的代码可以在CLOCCS_alignment存储库的 JOVE_Figures.ipynb 笔记本中看到。

这种从时间点到生命线点的转换取决于使用μ₀（恢复时间）和λ（母周期）的两个公式²¹（图4A）。第一个公式是 Equation 1 恢复阶段公式（图4A）。此公式仅用于恢复阶段内的时间点，该时间点由μ 0 之前（包括₀）的时间点组成，因为_{0 μ}对应于恢复时间。然后将时间点转换为以100个生命线点结尾的生命线规模范围（表1），标志着恢复阶段的结束和第一个细胞周期的开始。恢复后阶段使用第二个公式（ Equation 2 图 4A），该公式将每个后续恢复后时间点转换为 100 之后的生命线点。随后的每个100个生命线点对应于一个新的细胞周期，第一个周期对应于生命线点100至200，第二个周期对应于生命线点200至300，依此类推（表1）。从时间点到生命线点的转换将使用该数据集的相应 CLOCCS 参数单独应用于每个数据集。将每个数据集转换为生命线规模后，细胞周期阶段将对齐，从而可以在数据集之间进行特定于阶段的比较。

表 3 显示了使用来自萌芽的 CLOCCS 运行的参数将选定时间点转换为各自的生命线点，以便对条件 2 数据集进行代表性转换。从条件 2 RNA-seq 收集的出芽数据绘制在出芽曲线中，显示未对齐时间尺度（以分钟为单位）（图 4B）和生命线点对齐时间尺度（图 4C）随时间推移的出芽百分比使用 Python 函数plot_budding_curves在 Python 笔记本中。生命线点可以很容易地转换为实验和细胞周期阶段信息（表1），并且恢复阶段和第一至第三个细胞周期相应地手工编码（图4B，C）。由于每个生命线点对应于一个细胞周期阶段，因此可以使用由生命线对齐确定的细胞周期阶段通过Python函数标记单个流式细胞术图。这些相与通过细胞术分析确定的条件2的相相匹配。为条件2数据集收集的流式细胞术数据绘制选定时间点，并使用流式细胞术生命线对齐确定的细胞周期阶段进行标记。在每种情况下，数据都与对齐确定的相位相匹配（图4D）。

需要注意的是，每个样本的每个基因的表达水平保持不变，但时间点的标记从以分钟为单位的时间更改为生命线点。但是，转换不是线性的。恢复阶段（以灰色突出显示）在执行转换为生命线点后占用实验时间的较高百分比（图4B，C）。生命线秤的优点是它允许详细的相信息和跨实验的相比较。相位信息包含在生命线点中，如上所述，如表1所示。此外，G1包含在每个细胞周期的前15.5个生命线点中，S包含在接下来的20个生命线点中，G2 / M包含在接下来的64.5个生命线点中（表1）。然而，这人为地将恢复时间限制在每个连续细胞周期的相同时间跨度，即使恢复阶段在原始时间点尺度上看起来非常短。这不会掩盖比较，因为每个实验的阶段都是一致的。在大多数情况下，比较在同一实验和生物阶段发生的点的数据比在以分钟为单位的同一时间点上比较数据更相关。

一旦使用Python实用程序文件中提供的Python函数将所有实验转换为对齐的生命线规模，就可以对其进行比较。在这里，我们展示了实验之间的两种常见比较：一种是跨平台和同步方法的类似实验的重复（图5），另一种是周期长度变化的不同实验条件之间的比较（图6和图7）。如上所述，第一次比较是两个淘析微阵列重复和一个α因子同步RNA-seq实验。在比对之前，两个微阵列重复显示出相似的同步性和细胞周期动力学，但条件1微阵列2重复似乎略有延迟（图5A）。在比较未对齐的数据集时，发现了最显着的差异;条件1 RNA-seq第二周期似乎与两个微阵列实验的第一个周期一致。这种差异可能与不同的转录组平台无关，而是与不同的同步方法有关。微阵列实验中的细胞群通过离心淘析同步，而RNA-seq实验中的细胞群通过交配信息素处理同步。事实上，与淘析相比，与交配信息素的同步大大减少了恢复时间（图5A和表2）。

尽管在经过时间方面绘制时重复之间存在明显差异，但在生命线对齐后，曲线几乎相同，并且可以跨重复进行更详细和相关的组合（图5B）。恢复阶段对齐，以便每个实验在同一生命线点开始，并且通过生命线对齐对周期的变化进行归一化。由于比对，重复项中同一生命线点的实验值发生在相同的细胞周期阶段，从而能够计算重复项之间的实验方差。 图5B 标记了回收和细胞周期阶段，以提供有关每个实验中细胞周期阶段的其他信息。然后可以使用实用程序文件中提供的 Python 函数将这种生命线对齐应用于实验数据集（图 5C，D），如上所述df_conversion_from_parameters。

在 图5D中，对转录组数据进行对齐，并使用Python笔记本中的plot_linegraph_comparison Python函数绘制 CDC20 基因的表达动力学。在比对之前，微阵列实验的第一个峰表达似乎与RNA-seq实验的第二个峰对齐（图5C）;然而，在比对后，每个数据集的第一个细胞周期峰正确对齐（图5D）。此外，RNA-seq数据集和微阵列数据集之间实验的峰宽似乎有所不同，但在比对后，峰宽更对齐（图5C，D）。

第二个比较是在具有不同细胞周期的不同环境条件下进行的实验（图6）。如上所述，在这里，我们将条件1中的酿 酒酵母 数据集与条件2和条件3进行了比较，它们分别对应于71，82和110分钟的细胞周期。细胞周期的这些差异在比较细胞周期阶段对齐之前的实验时引入了不确定性，如未对齐的出芽曲线所示。周期差异在未对齐的出芽曲线中可见（图 6A）。然而，当它们使用该协议进行CLOCCS对齐时，三条曲线看起来非常相似，因此可以比较实验数据（图6B）。

使用流式细胞术CLOCCS参数，将条件1和条件2与共同的生命线尺度对齐，并在条件2中绘制DNA含量直方图，在条件1中绘制等效生命线点。比较了跨生命线点的DNA含量的流式细胞术测量（图6C）。由于DNA含量测量不是连续的，也不容易插值，我们只能比较最近的生命线点。两个条件之间每个可比较生命线点的细胞周期阶段数据并不相同（图6C），这表明条件1的CLOCCS拟合和由此产生的参数可能略有错位。这可能是由于与条件2相比，条件1的流式细胞术数据的CLOCCS拟合度较差（补充图2）。然而，仅在一个样品中对齐有偏差，因此仍然可以改进特定于阶段的比较。

然后将出芽生命线比对应用于条件 1、条件 2 和条件 3（图 7）中 RNA-seq 实验的实验数据，方法是在实验数据上使用df_conversion_from_parameters函数中的出芽 CLOCCS 参数。对转录组学数据进行比对，并显示三个实验中每个时间序列的 基因CDC20 的基因表达。在对齐之前， CDC20 的转录本动力学是不重叠的（图7A）。比对后， CDC20 基因表达的第一和第二峰在所有三个数据集中都更加紧密地对齐。对齐后，很明显峰发生在相同的细胞周期阶段，但曲线的形状不同（图7B）。与其他两个条件相比，条件3具有更低和更宽的第一峰，即使考虑到细胞周期的差异，这表明这些差异可能与正在测试的实验条件有关（图7B）。

也可以进行大规模的转录组学比较。对于这些比较，通过在每个数据集上运行周期性算法JTK_CYCLE²³ 个并取顶部周期性基因的交集，选择了278个基因。然而，可以使用任何所需的方法或从文献中选择基因。这些基因在未对齐（图7C）和对齐（图7D）热图的所有三个条件下使用Python笔记本中的plot_heatmap_comparison Python函数以相同的顺序绘制。这些热图允许同时进行数百个基因水平的比较。可以对未对齐的实验进行比较，包括曲线动力学的变化、相对于相邻基因的峰值时间和周期长度等（图7C）。然而，无法进行详细的阶段特异性比较，因为时间点不一定与不同条件下的相同细胞周期阶段相关。尽管对齐后第二个循环看起来相似，但第一个循环在条件之间略有偏移（图7D）。这种转变可能反映了这样一个事实，即条件3的出芽细胞周期阶段信息质量较低。尽管如此，三个条件的实验对齐允许改进特定阶段的比较。在比对之前，尚不清楚每种情况下的第一个表达峰是否会出现在同一细胞周期阶段（图7C）;但是，在对齐后，可以以特定于阶段的方式比较实验（图7D）。在对齐之前，条件3中的峰似乎比其他两个条件中的峰宽得多（图7C）;然而，在对齐后，很明显条件3中的峰在对齐时与其他条件的宽度相似（图7D）。

这些具有代表性的结果证明了使用CLOCCS将实验与通用时间尺度对齐的过程。在比对之前，直接时间点比较通常与类似的细胞周期阶段无关。将经过的实验时间（以分钟为单位）转换为代表细胞周期阶段的生命线点，允许在细胞周期中同一点的实验之间进行阶段特异性和生物学相关的比较。

图 1：CLOCCS 生命线对齐工作流程概述。 使用 CLOCCS 对齐两个示例数据集的实验工作流程，然后是数据集之间的代表性比较。说明了协议的主要步骤：为每个数据集收集未对齐的细胞周期阶段和实验数据（步骤1），使用CLOCCS对每个数据集进行参数化（步骤2和步骤3），将数据集对齐到共同的生命线（步骤4），最后，比较细胞周期阶段和实验动力学（步骤5和步骤6）。未对齐的细胞周期阶段数据被输入到CLOCCS中以提供学习的参数，然后用于与共同的生命线尺度进行对齐。然后比较这些对齐的数据集。缩写：CLOCCS = 表征细胞周期同步的丧失。请点击此处查看此图的大图。

图2：细胞周期阶段的格式和工作流程所需的实验数据。工作流程所需的数据由两个主要部分组成：细胞周期阶段数据和细胞周期实验数据。细胞周期阶段数据可以由时间序列中每个时间点的细胞周期出芽数据或流式细胞术 DNA 含量数据组成。实验数据可以采取多种形式，但在这种情况下，是转录组学数据，其中包括时间序列中每个时间点的每个基因的基因表达数据。请点击此处查看此图的大图。

图 3：在 酿酒酵母 细胞周期数据集上运行 CLOCCS 的结果示例。 （A） CLOCCS 图形用户界面的屏幕截图，其中包含为条件 2 出芽数据提供的输入值和设置。输入时间、未出芽像元数和芽化像元数，以及模型类型、迭代和条件等。（B）结果的“预测拟合”选项卡下生成的条件 2 的 CLOCCS 出芽拟合的屏幕截图。每个数据点都有一个关联的采样误差线，对应于数据的 95% 二项式比例置信区间（对于每个时间点，至少计数 200 个单元格 [在 204 到 295 个单元格之间]）。生成的出芽拟合曲线以紫色显示 CLOCCS 拟合的 95% 置信区间的置信区间。（C）条件 2 初芽 CLOCCS 运行生成的“后验参数”表的屏幕截图，包括平均值处的 CLOCCS 参数、2.5% 置信区间和 97.5% 置信区间。还显示了后验率和接受率。（D）流式细胞术 CLOCCS 在 70 分钟和 150 分钟时适合条件 2 的屏幕截图。请点击此处查看此图的大图。

图 4：条件 2 数据集从时间点到对齐 生命线点的转换过程示例。（A）用于从时间点转换为生命线点的转换公式。Python 笔记本中用于转换和绘制萌芽曲线的 Python 函数的屏幕截图。（B）未对齐的条件 2 出芽曲线，以分钟为单位显示每个时间点的出芽百分比。细胞周期和恢复阶段突出显示如下：恢复（灰色），第一细胞周期（蓝色），第二细胞周期（洋红色）和第三细胞周期（鲑鱼）。（C）对齐的条件 2 出芽曲线显示相同的出芽百分比，但绘制在生命线对齐的刻度上。细胞周期和恢复阶段如图 C所示突出显示。（D）条件2中所选时间点的对齐流式细胞术图，对应于基于生命线尺度的不同细胞周期阶段：G1的开始，S期的开始，G2 / M的开始和G2 / M的晚期。

图 5：对齐和未对齐条件 1 重复实验比较的代表性结果。 条件 1 重复的比较：条件 1 RNA-seq（蓝色）、条件 1 微阵列 1（紫色）和条件 1 微阵列 2（灰色）。（A）条件 1 数据集的未对齐萌芽曲线。（B）条件 1 数据集的对齐萌芽曲线。生命线点已转换为细胞周期阶段，并在x轴下方进行颜色编码。（C）条件1数据集中代表性基因 CDC20的未对齐基因表达。（D）条件1数据集中代表性基因 CDC20的对齐基因表达。请点击此处查看此图的大图。

图 6：不同周期的实验中对齐和未对齐细胞周期阶段数据比较的代表性结果。 比较具有三种不同环境条件的数据集的细胞周期阶段数据，因此，三个不同的细胞周期：条件 1 RNA-seq（细胞周期：71 分钟）、条件 2 RNA-seq（细胞周期：82 分钟）和条件 3 RNA-seq（细胞周期：110 分钟）。（A）数据集的未对齐萌芽曲线。（B）数据集的对齐萌芽曲线。（C）条件 2（顶行）的流式细胞术 DNA 含量直方图与条件 1（底行）中的等效生命线点的比较。请点击此处查看此图的大图。

图7：在不同周期的实验中比较对齐和未对齐转录组数据的代表性结果。与 图 6 中数据集相关的转录组学数据的比较：条件 1 RNA-seq、条件 2 和条件 3。（A）条件1，条件2和条件3 RNA-seq数据集中代表性基因 CDC20的未对齐基因表达。（B）数据集中 CDC20 的对齐基因表达。（C）每个数据集的顶部细胞周期周期基因的未对齐热图，顺序相同。（D）来自图C 的相同细胞周期周期基因的生命线对齐热图以相同的顺序排列。紫色虚线对应于生命线点 100 和 200。请点击此处查看此图的大图。

表1：生命线点到细胞周期阶段的转换。 生命线点尺度与实验中相应阶段之间的转换键。生命线点 0-100 对应于从同步中恢复。随后每100个生命线点对应一个新的细胞周期，前15.5个生命线点对应G1，接下来的20个对应S期，剩余的生命线点对应G2/ M。

表 2：出芽的 CLOCCS 参数。 从代表性结果中得到每个实验的出芽CLOCCS参数“lambda”和“mu0”。此外，还显示了每个实验的子特异性延迟“Delta”和计算的细胞周期。请按此下载此表格。

表 3：转换表，显示条件 2 的时间点（以分钟为单位）与其各自对应的生命线点之间的转换。请按此下载此表格。

补充图S1：CLOCCS萌芽适合条件1和条件3。 生成的 CLOCCS 出芽拟合的屏幕截图适用于（A）条件 1 RNA 序列出芽数据，（B）条件 1 微阵列 1 出芽数据，（C）条件 1 微阵列芯片 2 出芽数据，以及条件 3 出芽数据。CLOCCS萌芽适合条件2如图 3B所示。95%置信带和采样误差线如CLOCCS文档¹⁴^，¹⁵和图3中所述。对于每个时间序列的每个时间点，大约计数 200 个细胞。请点击此处下载此文件。

补充图S2：CLOCCS流式细胞术适用于条件1和条件2。 流式细胞术CLOCCS的屏幕截图适用于图6C所示条件2（顶行：A-D）和条件1（底行：E，F）的样品。请点击此处下载此文件。

补充图S3：对齐对CLOCCS参数变化的敏感性。在 CLOCCS 拟合和（D，E）的置信区间内，使用 CLOCCS 参数 λ 和 μ0 中的（A-C）变化比较条件 1 RNA-Seq 数据集的比对，参数变化较大。CLOCCS对（A）参数μ0，（B）参数λ和（C）参数μ0和λ的平均值与参数表中输出的2.5%和97.5%置信值之间的比较。（D）使用 μ0 平均值的对齐与 μ0 参数的大变化（μ0 的 200% 至 0.25%）之间的比较。（E）使用 λ 平均值的对齐与 λ 参数的较大变化（λ 的 200% 至 0.25%）之间的比较。请点击此处下载此文件。

补充表S1：每个实验的数据收集说明。 对于每个实验，此表提供了出芽数据、流式细胞术数据、转录组学数据和同步方法的描述。请点击此处下载此文件。

补充表S2：流式细胞术CLOCCS运行的CLOCCS参数。 条件 1 和条件 2 流式细胞术 CLOCCS 运行的 CLOCCS 参数“mu0”和“λ”。请点击此处下载此文件。

补充文件 1：将流式细胞术数据转换为 CLOCCS 输入格式的说明。 对于流式细胞术数据的CLOCCS使用，需要特定的输入格式。此文件提供有关协议步骤 3.4.1 的更详细说明，以说明如何使用 Python 实用程序函数执行此转换。请点击此处下载此文件。

Subscription Required. Please recommend JoVE to your librarian.

Discussion

本文提出了一种更准确和定量地评估同步细胞群时间序列实验数据的方法。该方法利用从CLOCCS中学习的参数，CLOCCS是一种贝叶斯推理模型，它使用输入的细胞周期阶段数据（例如出芽数据和流式细胞术DNA含量数据）来参数化每个实验¹⁴^，¹⁵。CLOCCS使用输入的细胞周期阶段数据来推断每个实验的参数，然后将其用于与通用生命线尺度对齐。将多个同步/发布时间序列实验转换为单个生命线对齐的时间尺度，可以在实验之间进行特定于阶段的相关比较，并聚合多个重复实验，这在以前是困难或不可能的。

该协议的关键步骤包括收集数据、运行 CLOCCS、对齐数据集以及跨数据集进行比较。首先，必须收集数据以用于此协议。数据必须包括包含有关感兴趣问题的实验数据（即转录组学数据、基因表达数据、蛋白质组学数据）和包含细胞周期阶段信息的细胞周期阶段数据（即出芽数据、流式细胞术 DNA 含量数据）。然后，可以在CLOCCS中使用细胞周期阶段数据来收集每个实验的参数信息。 参数μ₀ （恢复阶段长度）和 λ （母细胞周期）用于将时间点转换为生命线点。生命线点对齐允许直接比较对齐的时间序列。

该方法的一个限制是，正确的对齐取决于确定数据的良好拟合。实现最佳的CLOCCS拟合取决于细胞周期阶段数据的质量以及在CLOCCS实验中使用正确的输入设置。对细胞周期阶段数据的拟合决定了学习参数的准确性，因此极大地影响了对齐的准确性，因为它取决于这些参数的使用。由于参数的广泛变化会极大地影响对齐，因此在CLOCCS输出中提供的置信区间内变化最小（补充图S3）。重要的是要注意，这种对参数变化的敏感性也允许具有不同细胞周期时间的数据集之间的对齐。

CLOCCS拟合的精度可以使用得到的CLOCCS拟合曲线以及相应的误差线和误差带来确定（图3B，D，补充图S1和补充图S2）。CLOCCS 拟合选项卡显示原始数据点，以及 CLOCCS 拟合曲线，其置信带对应于 CLOCCS 拟合的置信区间，误差线对应于数据的 95% 二项式比例置信区间，因为假设计数是独立的二项式随机变量¹⁴。例如，出芽数据上的置信条测量给定样本的出芽细胞比例的置信度。

确定 CLOCCS 拟合质量的一种方法是确定数据的误差线是否与 CLOCCS 拟合的置信区间带重叠。另一个迹象是CLOCCS拟合的95%置信带的宽广度。通常，表带的宽度会随着拟合优度的增加而减小。对齐不良的指示是原始数据的细胞周期阶段与从对齐推断的细胞周期阶段不匹配。通过确认每个时间点，细胞周期相信息数据指示的相位与对齐分配的细胞周期相位匹配，可以仔细检查每个比对。

不良的CLOCCS拟合或不良的对齐可能是低质量的细胞周期相数据的结果。高质量的出芽数据在停滞后立即具有非常低的出芽百分比，而在第一个峰值处具有非常高的出芽百分比。随后的波峰和波谷将失去同步性，但应明显且均匀分布。由于生命线点代表群体的平均细胞周期阶段，因此同步性差也会阻碍正确的对齐。高质量的流式细胞术DNA含量数据对于对应于相应细胞周期阶段的每个时间点将具有不同的1C和2C峰。此外，细胞周期阶段数据不足会引入参数可识别性问题。在数据充足的情况下，可以推断参数，并且在 CLOCCS 运行之间不会发生实质性变化。但是，当细胞周期阶段数据仅包含一个完整的细胞周期时，无法解开该协议中描述的参数（lambda，delta，mu0）。为了改进参数估计，应为CLOCCS拟合¹⁴^，¹⁵使用足够且构建良好的细胞周期数据。此外，CLOCCS模型使用Orlando等人¹⁵中描述的先验信息，但可以调整此信息以更好地适应所使用的实验条件。

如果细胞周期阶段数据的质量良好，那么重新调整CLOCCS设置可能有助于产生更准确的拟合。例如，可以增加所选的迭代次数以提高准确性。确认在CLOCCS中选择了正确的同步方法也很有用，因为与淘脱相比，α因子阻滞与更短的恢复时间有关。

这种方法在当前支持的细胞周期阶段数据类型方面也受到限制。但是，CLOCCS是灵活的，可以进行调整以支持其他类型的数据。例如，CLOCCS以前已被调整为支持纺锤体极体，肌球蛋白环和细胞^核11 的细胞周期荧光标记，以用作细胞周期相位标识符。此外，CLOCCS与 酿酒酵母 以外的物种一起使用成为可能。CLOCCS接受分离指数作为 S. pombe¹⁴中细胞周期阶段的标志，以及流式细胞术DNA含量数据，这些数据很容易收集到许多物种¹⁵。这允许比较两个完全不同的物种在细胞周期同一阶段的实验数据，并且可以深入了解细胞周期在进化过程中的变化。

虽然只有支持形式的细胞周期阶段数据可以与这种生命线对齐方法一起使用，但这种方法与所使用的时间序列实验数据类型无关。在该协议中，我们已经证明了它在对齐单个基因的基因表达以及数百个基因的时间序列转录组数据中的用途。我们已经表明，这种方法可用于跨平台比较，从而在RNA-seq数据集和在类似条件下采集的微阵列数据集之间进行比较。我们还表明，通过将洗脱的数据集（条件 1 微阵列）与被 alpha 因子捕获的数据集（条件 1 RNA-seq）进行比较，这种方法可用于将数据集与不同的同步方法对齐。以前，CLOCCS还用于使用出芽细胞周期阶段数据²²来对齐时间序列转录组和时间序列蛋白质组学数据，这允许直接比较mRNA动力学和相应蛋白质的动力学。CLOCCS还被用于对齐跨物种的时间序列数据，例如酿酒酵母和S. pombe¹⁴之间的对齐以及酿酒酵母的第一个周期和致病酵母Cryptococcus neoformans²¹之间的对齐。最后，CLOCCS比对目前特定于细胞周期时间序列数据，尚未适应于其他类型的节律过程。一个特别感兴趣的领域是昼夜节律，其中昼夜节律时间（CT）通常用于对齐实验，尽管其实现并不一致。另一个感兴趣的领域是研究发育节律，例如疟疾寄生虫的节律。例如，如Smith等人²⁵所述，恶性疟原虫菌株与不同时期的对齐将允许跨菌株进行更详细的比较。将这些周期性过程的对齐进行比较将有助于更好地了解这些重要的节律生物学功能。如本协议所述，通过使用CLOCCS进行生命线比对，这些类型的细胞周期比较成为可能。

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

作者没有利益冲突需要披露。

Acknowledgments

S. Campione和S. Haase得到了美国国家科学基金会（DMS-1839288）和美国国立卫生研究院（5R01GM126555）的资助。此外，作者还要感谢周华瑞（杜克大学）对手稿的评论和协议的beta测试。我们还要感谢 Francis Motta（佛罗里达大西洋大学）和 Joshua Robinson 在 Java 代码方面的帮助。

Materials

Name	Company	Catalog Number	Comments
2x PBS			For Fixative Solution. Described in Leman 2014.
4% formaldehyde			For Fixative Solution.
100% Ethanol			For flow cytometry fixation. Described in Haase 2002.
CLOCCS			https://gitlab.com/haase-lab-group/cloccs_alignment.git
Flow Cytometer			For flow cytometry protocol.
Git			https://git-scm.com/
Java 19			https://www.oracle.com/java/technologies/downloads/#java19
Microscope			For counting cells and buds.
Miniconda			https://docs.conda.io/en/latest/
Protease solution			For flow cytometry protocol. Described in Haase 2002.
RNAse A solution			For flow cytometry protocol. Described in Haase 2002.
SYTOX Green Nucleic Acid Stain	Invitrogen	S7020	For flow cytometry staining. Described in Haase 2002.
Tris			pH 7.5

DOWNLOAD MATERIALS LIST

References

Tyers, M., Tokiwa, G., Futcher, B. Comparison of the Saccharomyces cerevisiae G1 cyclins: Cln3 may be an upstream activator of Cln1, Cln2 and other cyclins. EMBO Journal. 12 (5), 1955-1968 (1993).
Schwob, E., Nasmyth, K. CLB5 and CLB6, a new pair of B cyclins involved in DNA replication in Saccharomyces cerevisiae. Genes and Development. 7, 1160-1175 (1993).
Polymenis, M., Schmidt, E. V. Coupling of cell division to cell growth by translational control of the G1 cyclin CLN3 in yeast. Genes and Development. 11 (19), 2522-2531 (1997).
Spellman, P. T., et al. Comprehensive identification of cell cycle-regulated genes of the yeast Saccharomyces cerevisiae by microarray hybridization. Molecular Biology of the Cell. 9 (12), 3273-3297 (1998).
Cho, R. J., et al. A genome-wide transcriptional analysis of the mitotic cell cycle. Molecular Cell. 2 (1), 65-73 (1998).
Bar-Joseph, Z. Analyzing time series gene expression data. Bioinformatics. 20 (16), 2493-2503 (2004).
Pramila, T., Wu, W., Miles, S., Noble, W. S., Breeden, L. L. The Forkhead transcription factor Hcm1 regulates chromosome segregation genes and fills the S-phase gap in the transcriptional circuitry of the cell cycle. Genes and Development. 20 (16), 2266-2278 (2006).
Orlando, D. A., et al. Global control of cell-cycle transcription by coupled CDK and network oscillators. Nature. 453 (7197), 944-947 (2008).
Nash, R., Tokiwa, G., Anand, S., Erickson, K., Futcher, A. B. The WHI1+ gene of Saccharomyces cerevisiae tethers cell division to cell size and is a cyclin homolog. EMBO Journal. 7 (13), 4335-4346 (1988).
Basco, R. D., Segal, M. D., Reed, S. I. Negative regulation of G1 and G2 by S-phase cyclins of Saccharomyces cerevisiae. Molecular and Cellular Biology. 15 (9), 5030-5042 (1995).
Mayhew, M. B., Robinson, J. W., Jung, B., Haase, S. B., Hartemink, A. J. A generalized model for multi-marker analysis of cell cycle progression in synchrony experiments. Bioinformatics. 27 (13), 295-303 (2011).
Qu, Y., et al. Cell cycle inhibitor Whi5 records environmental information to coordinate growth and division in yeast. Cell Reports. 29 (4), 987-994 (2019).
Di Talia, S., Skotheim, J. M., Bean, J. M., Siggia, E. D., Cross, F. R. The effects of molecular noise and size control on variability in the budding yeast cell cycle. Nature. 448 (7156), 947-951 (2007).
Orlando, D. A., et al. A probabilistic model for cell cycle distributions in synchrony experiments. Cell Cycle. 6 (4), 478-488 (2007).
Orlando, D. A., Iversen, E. S., Hartemink, A. J., Haase, S. B. A branching process model for flow cytometry and budding index measurements in cell synchrony experiments. Annals of Applied Statistics. 3 (4), 1521-1541 (2009).
Duan, F., Zhang, H. Correcting the loss of cell-cycle synchrony in clustering analysis of microarray data using weights. Bioinformatics. 20 (11), 1766-1771 (2004).
Darzynkiewicz, Z., Halicka, H. D., Zhao, H. Cell synchronization by inhibitors of DNA replication induces replication stress and DNA damage response: analysis by flow cytometry. Methods in Molecular Biology. 761, 85-96 (2011).
Leman, A. R., Bristow, S. L., Haase, S. B. Analyzing transcription dynamics during the budding yeast cell cycle. Methods in Molecular Biology. 1170, 295-312 (2014).
Rosebrock, A. P. Synchronization and arrest of the budding yeast cell cycle using chemical and genetic methods. Cold Spring Harbor Protocols. 2017 (1), (2017).
Haase, S. B., Reed, S. I. Improved flow cytometric analysis of the budding yeast cell cycle. Cell Cycle. 1 (2), 132-136 (2002).
Kelliher, C. M., Leman, A. R., Sierra, C. S., Haase, S. B. Investigating conservation of the cell-cycle-regulated transcriptional program in the fungal pathogen, Cryptococcus neoformans. PLoS Genetics. 12 (12), e1006453 (2016).
Kelliher, C. M., et al. Layers of regulation of cell-cycle gene expression in the budding yeast Saccharomyces cerevisiae. Molecular Biology of the Cell. 29 (22), 2644-2655 (2018).
Hughes, M. E., Hogenesch, J. B., Kornacker, K. JTK_CYCLE: An efficient nonparametric algorithm for detecting rhythmic components in genome-scale data sets. Journal of Biological Rhythms. 25 (5), 372-380 (2010).
Deckard, A., Anafi, R. C., Hogenesch, J. B., Haase, S. B., Harer, J. Design and analysis of large-scale biological rhythm studies: A comparison of algorithms for detecting periodic signals in biological data. Bioinformatics. 29 (24), 3174-3180 (2013).
Smith, L. M., et al. An intrinsic oscillator drives the blood stage cycle of the malaria parasite Plasmodium falciparum. Science. 368 (6492), 754-759 (2020).

Biology

使用表征细胞周期同步损失模型进行跨实验比较的同步时间序列数据比对

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgments

Materials

References

Tags

Cite this Article

Get cutting-edge science videos from JoVE sent straight to your inbox every month.