竞争风险模型的基于 R 的景观验证

Published: September 16, 2022

doi:

Haiping Lin*^1,3, Hongjuan Zheng*², Chenyang Ge, Lixian Ling, Ruihua Yin, Qinghua Wang, Xia Zhang, Shishi Zhou, Xiayun Jin, Xifeng Xu, Jianfei Fu

¹Department of Hepatobiliary Surgery, Affiliated Jinhua Hospital,Zhejiang University School of Medicine, ²Department of Medical Oncology, Affiliated Jinhua Hospital,Zhejiang University School of Medicine, ³Department of Colorectal Surgery, Affiliated Jinhua Hospital,Zhejiang University School of Medicine

Summary

本协议描述了R中的代码，用于评估竞争风险模型的辨别和校准能力，以及用于内部和外部验证的代码。

Abstract

Cox比例风险模型广泛用于临床环境中的生存分析，但它无法应对多种生存结果。与传统的Cox比例风险模型不同，竞争风险模型考虑竞争事件的存在及其与列线图（一种图形计算设备）的组合，列线图是临床医生进行精确预后预测的有用工具。在这项研究中，我们报告了一种建立竞争风险列线图的方法，即评估其辨别力（即相关指数和曲线下面积）和校准（即校准曲线）能力，以及净收益（即决策曲线分析）。此外，还使用原始数据集的自举重采样进行内部验证，并使用已建立的竞争风险列线图的外部数据集进行外部验证，以证明其外推能力。竞争风险列线图应作为临床医生在考虑竞争风险的情况下预测预后的有用工具。

Introduction

近年来，随着精准医学的发展，新兴的预后因素被确定出来，结合分子和临床病理因素的预后模型在临床环境中越来越受到关注。然而，非图形模型，如Cox比例风险模型，具有系数值的结果，临床医生很难理解¹。相比之下，列线图是回归模型（包括 Cox 回归模型、竞争风险模型等）的可视化工具，回归模型是专为数学函数² 的近似图形计算而设计的二维图。它能够评估临床模型中不同级别的变量，并计算风险评分（RS）以预测预后。

模型评估在模型构建中是必不可少的，并且通常接受两个特征进行评估：判别和校准。在临床模型中，鉴别是指模型将发生事件的个体与未发生事件的个体（例如死亡患者与存活患者）区分开来的能力，并且一致性指数（C指数）或受试者工作特征曲线下面积（AUC）通常用于表征它^3,4.校准是将模型的预测概率与实际概率进行比较的过程，校准曲线已被广泛用于表示它。此外，模型验证（内部和外部验证）是模型构建中的重要步骤，只有经过验证的模型才能进一步外推⁵。

Cox比例风险模型是医学研究中使用的回归模型，用于调查预后因素与生存状态之间的关联。然而，Cox比例风险模型只考虑结果的两种状态[Y（0,1）]，而研究对象通常面临两种以上的状态，并且出现竞争风险[Y（0,1,2）]¹。总生存期（OS）定义为从起源日期（例如治疗）到因任何原因死亡的时间，是生存分析中最重要的终点。然而，OS未能区分癌症特异性死亡和非癌症特异性死亡（例如，心血管事件和其他不相关原因），因此忽略了竞争风险⁶。在这些情况下，竞争风险模型是预测生存状态的首选，同时考虑竞争风险⁷。构建和验证Cox比例风险模型的方法已经确立，而关于验证竞争风险模型的报告很少。

在我们之前的研究中，建立了特定的竞争风险列线图，列线图和竞争风险模型的组合以及基于竞争风险模型的风险评分估计⁸。本研究旨在提出评估和验证已建立的竞争风险列线图的不同方法，该方法应作为临床医生在考虑竞争风险的情况下预测预后的有用工具。

Protocol

监测、流行病学和最终结果（SEER）数据库是一个开放访问的癌症数据库，仅包含去识别的患者数据（SEER ID： 12296-Nov2018）。因此，本研究免于浙江大学医学院附属金华医院评审委员会的批准。 1. 数据准备和R包准备准备并导入数据。>数据集<-读取.csv（“…/乳腺癌数据.xlsx”） #Import 数据。注意：数据在补充文件 1 中上传。…

Representative Results

在这项研究中，从SEER数据库中检索了乳腺癌患者的数据，并作为示例数据。SEER数据库提供了占美国人口约34.6%的癌症数据，并获得了访问该数据库的许可（参考编号12296-Nov2018）。采用直接法和加权法分别建立了两个列线图（图1），包括组织学类型、分化分级、T分期和N期。每个变量水平的点数和总点对应的概率几乎相同，但观察到一些细微的差异。Zha…

Discussion

这项研究比较了通过两种不同方法建立的竞争风险列线图，并对已建立的列线图进行了评估和验证。具体而言，本研究提供了一个基于直接方法建立列线图的分步教程，以及计算C指数和绘制校准曲线。

R软件中的均方根包广泛用于Cox比例风险模型的构建和评估，但不适用于竞争风险模型。对于具有多个结果的模型，Zhang等人报告了使用R软件中的riskRegression包对竞?…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

该研究得到了浙江省医学科技计划项目（批准号2013KYA212）、浙江省自然科学基金一般计划（批准号Y19H160126）和金华市科技局重点计划（批准号2016-3-005,2018-3-001d和2019-3-013）的资助。

Materials

R software	None	Not Applicable	Version 3.6.2 or higher
Computer system	Microsoft	Windows 10	Windows 10 or higher

Riferimenti

Andersen, P. K., Gill, R. D. Cox’s regression model for counting processes: A large sample study. The Annals of Statistics. 10 (4), 1100-1120 (1982).
Lubsen, J., Pool, J., vander Does, E. A practical device for the application of a diagnostic or prognostic function. Methods of Information in Medicine. 17 (2), 127-129 (1978).
Harrell, F. E., Lee, K. L., Mark, D. B. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics In Medicine. 15 (4), 361-387 (1996).
Hung, H., Chiang, C. -. T. Estimation methods for time-dependent AUC models with survival data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique. 38 (1), 8-26 (2010).
Moons, K. G. M., et al. Risk prediction models: I. Development, internal validation, and assessing the incremental value of a new (bio)marker. Heart. 98 (9), 683-690 (2012).
Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
Wu, L., et al. Establishing a competing risk regression nomogram model for survival data. Journal of Visualized Experiments. (164), e60684 (2020).
Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals of Translational Medicine. 5 (20), 403 (2017).
Zhang, Z. H., et al. Overview of model validation for survival regression model with competing risks using melanoma study data. Annals Of Translational Medicine. 6 (16), 325 (2018).
Newson, R. Confidence intervals for rank statistics: Somers’ D and extensions. Stata Journal. 6 (3), 309-334 (2006).
Davison, A. C., Hinkley, D. V., Schechtman, E. Efficient bootstrap simulation. Biometrika. 73 (3), 555-566 (1986).
Roecker, E. B. Prediction error and its estimation for subset-selected models. Technometrics. 33 (4), 459-468 (1991).
Steyerberg, E. W., Harrell, F. E. Prediction models need appropriate internal, internal-external, and external validation. Journal of Clinical Epidemiology. 69, 245-247 (2016).
Zhang, Z., Chen, L., Xu, P., Hong, Y. Predictive analytics with ensemble modeling in laparoscopic surgery: A technical note. Laparoscopic, Endoscopic and Robotic Surgery. 5 (1), 25-34 (2022).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Citazione di questo articolo

Lin, H., Zheng, H., Ge, C., Ling, L., Yin, R., Wang, Q., Zhang, X., Zhou, S., Jin, X., Xu, X., Fu, J. An R-Based Landscape Validation of a Competing Risk Model. J. Vis. Exp. (187), e64018, doi:10.3791/64018 (2022).

竞争风险模型的基于 R 的景观验证

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Divulgazioni

Acknowledgements

Materials

Riferimenti

Tags

Play Video

Citazione di questo articolo

View Video

竞争风险模型的基于 R 的景观验证

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Divulgazioni

Acknowledgements

Materials

Riferimenti

Tags

Play Video

Citazione di questo articolo

View Video

✖

To prove you're not a robot, please enter the text in the image below