An R-Based Landscape Validation of a Competing Risk Model

Haiping Lin; Hongjuan Zheng; Chenyang Ge; Lixian Ling; Ruihua Yin; Qinghua Wang; Xia Zhang; Shishi Zhou; Xiayun Jin; Xifeng Xu; Jianfei Fu

doi:10.3791/64018

JoVE Journal > Cancer Research

Cancer Research

Uma validação de cenário baseada em R de um modelo de risco concorrente

Published: September 16, 2022

doi:

10.3791/64018

Haiping Lin*^1,3, Hongjuan Zheng*², Chenyang Ge, Lixian Ling, Ruihua Yin, Qinghua Wang, Xia Zhang, Shishi Zhou, Xiayun Jin, Xifeng Xu, Jianfei Fu

¹Department of Hepatobiliary Surgery, Affiliated Jinhua Hospital,Zhejiang University School of Medicine, ²Department of Medical Oncology, Affiliated Jinhua Hospital,Zhejiang University School of Medicine, ³Department of Colorectal Surgery, Affiliated Jinhua Hospital,Zhejiang University School of Medicine

Summary

O presente protocolo descreve códigos em R para avaliar as habilidades de discriminação e calibração de um modelo de risco competitivo, bem como códigos para validação interna e externa do mesmo.

Abstract

O modelo de risco proporcional de Cox é amplamente aplicado para análises de sobrevida em cenários clínicos, mas não é capaz de lidar com múltiplos desfechos de sobrevida. Diferentemente do modelo tradicional de risco proporcional de Cox, os modelos de risco concorrentes consideram a presença de eventos concorrentes e sua combinação com um nomograma, um dispositivo gráfico de cálculo, que é uma ferramenta útil para os clínicos realizarem uma predição prognóstica precisa. Neste estudo, relatamos um método para estabelecer o nomograma de risco competitivo, ou seja, a avaliação de suas habilidades de discriminação (i.e., índice de concordância e área sob a curva) e calibração (i.e., curvas de calibração), bem como o benefício líquido (i.e., análise da curva de decisão). Além disso, validação interna usando reamostras de bootstrap do conjunto de dados original e validação externa usando um conjunto de dados externo do nomograma de risco concorrente estabelecido também foram realizadas para demonstrar sua capacidade de extrapolação. O nomograma de risco competitivo deve servir como uma ferramenta útil para os clínicos preverem o prognóstico com a consideração de riscos competitivos.

Introduction

Nos últimos anos, fatores prognósticos emergentes têm sido identificados com o desenvolvimento da medicina de precisão, e modelos prognósticos combinando fatores moleculares e clínico-patológicos vêm chamando cada vez mais atenção em cenários clínicos. No entanto, modelos não gráficos, como o modelo de risco proporcional de Cox, com resultados de valores de coeficientes, são de difícil compreensão para os clínicos¹. Em comparação, um nomograma é uma ferramenta de visualização de modelos de regressão (incluindo o modelo de regressão de Cox, modelo de risco competitivo, etc.), um diagrama bidimensional projetado para a computação gráfica aproximada de uma função matemática². Permite a avaliação de diferentes níveis de variáveis em um modelo clínico e o cálculo de escores de risco (ES) para predizer prognóstico.

A avaliação do modelo é essencial na construção do modelo, e duas características são geralmente aceitas para avaliação: discriminação e calibração. Em modelos clínicos, a discriminação refere-se à capacidade de um modelo separar indivíduos que desenvolvem eventos daqueles que não desenvolvem, como pacientes que morrem versus aqueles que permanecem vivos, e o índice de concordância (C-index) ou a área sob a curva receiver operating characteristic (AUC) são tipicamente usados para caracterizá-la ^3,4. A calibração é um processo de comparação das probabilidades previstas de um modelo com as probabilidades reais, e curvas de calibração têm sido amplamente utilizadas para representá-lo. Além disso, a validação de modelos (validação interna e externa) é uma etapa importante na construção do modelo, e apenas modelos validados podem ser extrapolados⁵.

O modelo de risco proporcional de Cox é um modelo de regressão utilizado em pesquisas médicas para investigar as associações entre fatores prognósticos e status de sobrevida. No entanto, o modelo de risco proporcional de Cox considera apenas dois status de desfecho [Y (0, 1)], enquanto os sujeitos do estudo geralmente enfrentam mais de dois status, e riscos concorrentes surgem [Y (0, 1, 2)]¹. A sobrevida global (SG), que é definida como o tempo desde a data de origem (por exemplo, tratamento) até a data do óbito por qualquer causa, é o desfecho mais importante na análise de sobrevida. No entanto, a OS falha em diferenciar a morte específica por câncer da morte não específica por câncer (por exemplo, eventos cardiovasculares e outras causas não relacionadas), ignorando riscos competitivos⁶. Nessas situações, o modelo de risco competitivo é preferido para a predição do status de sobrevida com a consideração de riscos competitivos⁷. A metodologia de construção e validação de modelos de riscos proporcionais de Cox está bem estabelecida, enquanto há poucos relatos sobre a validação de modelos de risco concorrentes.

Em nosso estudo anterior, um nomograma de risco competitivo específico, uma combinação de um nomograma e um modelo de risco competitivo e uma estimativa de escore de risco baseada em um modelo de risco competitivo foram estabelecidos⁸. Este estudo tem como objetivo apresentar diferentes métodos de avaliação e validação do nomograma de risco competitivo estabelecido, que deve servir como uma ferramenta útil para os clínicos predizerem o prognóstico com a consideração de riscos competitivos.

Protocol

O banco de dados de Vigilância, Epidemiologia e Resultados Finais (SEER) é um banco de dados de câncer de acesso aberto que contém apenas dados de pacientes não identificados (SEER ID: 12296-Nov2018). Portanto, este estudo foi isento da aprovação do comitê de revisão do Hospital Jinhua Afiliado, Faculdade de Medicina da Universidade de Zhejiang. 1. Preparação dos dados e preparação dos pacotes R Prepare e importe os dados.> Dataset <- read.csv("….

Representative Results

Neste estudo, os dados de pacientes com câncer de mama foram recuperados do banco de dados do SEER e serviram como exemplo de dados. O banco de dados SEER fornece dados sobre câncer, representando cerca de 34,6% da população dos Estados Unidos, e foi obtida permissão para acessar o banco de dados (número de referência 12296-Nov2018). Dois nomogramas (Figura 1), ambos incluindo tipo histológico, grau diferenciado, estádio T e estádio N, foram estabelecido…

Discussion

Este estudo comparou nomogramas de risco concorrentes estabelecidos por dois métodos distintos e realizou avaliação e validação dos nomogramas estabelecidos. Especificamente, este estudo forneceu um tutorial passo-a-passo para estabelecer o nomograma com base em um método direto, bem como calcular o índice C e traçar as curvas de calibração.

O pacote rms no software R é amplamente utilizado para a construção e avaliação de modelos de risco proporcional de Cox, mas não …

Disclosures

The authors have nothing to disclose.

Acknowledgements

O estudo foi apoiado por subsídios do Projeto de Plano de Ciência e Tecnologia Médica da Província de Zhejiang (números de concessão 2013KYA212), o programa geral da Fundação de Ciências Naturais da Província de Zhejiang (número de bolsa Y19H160126) e o programa-chave do Departamento Municipal de Ciência e Tecnologia de Jinhua (número de concessão 2016-3-005, 2018-3-001d e 2019-3-013).

Materials

R software	None	Not Applicable	Version 3.6.2 or higher
Computer system	Microsoft	Windows 10	Windows 10 or higher

References

Andersen, P. K., Gill, R. D. Cox’s regression model for counting processes: A large sample study. The Annals of Statistics. 10 (4), 1100-1120 (1982).
Lubsen, J., Pool, J., vander Does, E. A practical device for the application of a diagnostic or prognostic function. Methods of Information in Medicine. 17 (2), 127-129 (1978).
Harrell, F. E., Lee, K. L., Mark, D. B. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics In Medicine. 15 (4), 361-387 (1996).
Hung, H., Chiang, C. -. T. Estimation methods for time-dependent AUC models with survival data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique. 38 (1), 8-26 (2010).
Moons, K. G. M., et al. Risk prediction models: I. Development, internal validation, and assessing the incremental value of a new (bio)marker. Heart. 98 (9), 683-690 (2012).
Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
Wu, L., et al. Establishing a competing risk regression nomogram model for survival data. Journal of Visualized Experiments. (164), e60684 (2020).
Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals of Translational Medicine. 5 (20), 403 (2017).
Zhang, Z. H., et al. Overview of model validation for survival regression model with competing risks using melanoma study data. Annals Of Translational Medicine. 6 (16), 325 (2018).
Newson, R. Confidence intervals for rank statistics: Somers’ D and extensions. Stata Journal. 6 (3), 309-334 (2006).
Davison, A. C., Hinkley, D. V., Schechtman, E. Efficient bootstrap simulation. Biometrika. 73 (3), 555-566 (1986).
Roecker, E. B. Prediction error and its estimation for subset-selected models. Technometrics. 33 (4), 459-468 (1991).
Steyerberg, E. W., Harrell, F. E. Prediction models need appropriate internal, internal-external, and external validation. Journal of Clinical Epidemiology. 69, 245-247 (2016).
Zhang, Z., Chen, L., Xu, P., Hong, Y. Predictive analytics with ensemble modeling in laparoscopic surgery: A technical note. Laparoscopic, Endoscopic and Robotic Surgery. 5 (1), 25-34 (2022).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Cite This Article

Lin, H., Zheng, H., Ge, C., Ling, L., Yin, R., Wang, Q., Zhang, X., Zhou, S., Jin, X., Xu, X., Fu, J. An R-Based Landscape Validation of a Competing Risk Model. J. Vis. Exp. (187), e64018, doi:10.3791/64018 (2022).

Uma validação de cenário baseada em R de um modelo de risco concorrente

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

Uma validação de cenário baseada em R de um modelo de risco concorrente

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Disclosures

Acknowledgements

Materials

References

Tags

Play Video

Cite This Article

View Video

✖

To prove you're not a robot, please enter the text in the image below