Summary

Une validation du paysage basé sur R d’un modèle de risque concurrent

Published: September 16, 2022
doi:

Summary

Le présent protocole décrit les codes en R pour évaluer les capacités de discrimination et d’étalonnage d’un modèle de risque concurrent, ainsi que les codes pour la validation interne et externe de celui-ci.

Abstract

Le modèle à risques proportionnels de Cox est largement appliqué pour les analyses de survie en milieu clinique, mais il n’est pas en mesure de faire face à de multiples résultats de survie. Différent du modèle traditionnel à risques proportionnels de Cox, les modèles de risque concurrents tiennent compte de la présence d’événements concurrents et de leur combinaison avec un nomogramme, un dispositif de calcul graphique, qui est un outil utile pour les cliniciens pour effectuer une prédiction pronostique précise. Dans cette étude, nous présentons une méthode pour établir le nomogramme de risque concurrent, c’est-à-dire l’évaluation de ses capacités de discrimination (c.-à-d. indice de concordance et aire sous la courbe) et d’étalonnage (c.-à-d. courbes d’étalonnage), ainsi que l’avantage net (c.-à-d. analyse de la courbe de décision). De plus, une validation interne à l’aide de rééchantillonnages bootstrap de l’ensemble de données original et une validation externe à l’aide d’un ensemble de données externe du nomogramme de risque concurrent établi ont également été effectuées pour démontrer sa capacité d’extrapolation. Le nomogramme du risque concurrent devrait être un outil utile pour les cliniciens afin de prédire le pronostic en tenant compte des risques concurrents.

Introduction

Au cours des dernières années, des facteurs pronostiques émergents ont été identifiés avec le développement de la médecine de précision, et les modèles pronostiques combinant des facteurs moléculaires et clinicopathologiques attirent de plus en plus l’attention dans les milieux cliniques. Cependant, les modèles non graphiques, tels que le modèle à risques proportionnels de Cox, avec les résultats des valeurs des coefficients, sont difficiles à comprendre pour les cliniciens1. En comparaison, un nomogramme est un outil de visualisation de modèles de régression (incluant le modèle de régression de Cox, le modèle de risque concurrent, etc.), un diagramme bidimensionnel conçu pour le calcul graphique approximatif d’une fonction mathématique2. Il permet d’évaluer différents niveaux de variables dans un modèle clinique et de calculer des scores de risque (RS) pour prédire le pronostic.

L’évaluation du modèle est essentielle dans la construction du modèle, et deux caractéristiques sont généralement acceptées pour l’évaluation : la discrimination et l’étalonnage. Dans les modèles cliniques, la discrimination fait référence à la capacité d’un modèle à séparer les personnes qui développent des événements de celles qui n’en développent pas, comme les patients qui meurent par rapport à ceux qui restent en vie, et l’indice de concordance (indice C) ou l’aire sous la courbe des caractéristiques opératoires du récepteur (ASC) sont généralement utilisés pour la caractériser 3,4. L’étalonnage est un processus de comparaison des probabilités prédites d’un modèle avec les probabilités réelles, et les courbes d’étalonnage ont été largement utilisées pour le représenter. De plus, la validation du modèle (validation interne et externe) est une étape importante dans la construction du modèle, et seuls les modèles validés peuvent être extrapolés5.

Le modèle à risques proportionnels de Cox est un modèle de régression utilisé en recherche médicale pour étudier les associations entre les facteurs pronostiques et le statut de survie. Cependant, le modèle à risques proportionnels de Cox ne tient compte que de deux statuts de résultat [Y (0, 1)], tandis que les sujets de l’étude font souvent face à plus de deux statuts et que des risques concurrents surviennent [Y (0, 1, 2)]1. La survie globale (SG), qui est définie comme le temps écoulé entre la date d’origine (p. ex. le traitement) et la date du décès, quelle qu’en soit la cause, est le critère d’évaluation le plus important dans l’analyse de la survie. Cependant, le système d’exploitation ne parvient pas à différencier les décès spécifiques au cancer des décès non spécifiques au cancer (par exemple, les événements cardiovasculaires et autres causes non liées), ignorant ainsi les risques concurrents6. Dans ces situations, le modèle de risque concurrent est préféré pour la prédiction du statut de survie avec la prise en compte des risques concurrents7. La méthodologie de construction et de validation des modèles à risques proportionnels de Cox est bien établie, alors qu’il y a eu peu de rapports concernant la validation de modèles de risque concurrents.

Dans notre étude précédente, un nomogramme de risque concurrent spécifique, une combinaison d’un nomogramme et d’un modèle de risque concurrent, et une estimation du score de risque basée sur un modèle de risque concurrent ont été établis8. Cette étude vise à présenter différentes méthodes d’évaluation et de validation du nomogramme de risque concurrent établi, qui devrait servir d’outil utile aux cliniciens pour prédire le pronostic en tenant compte des risques concurrents.

Protocol

La base de données Surveillance, Epidemiology, and End Results (SEER) est une base de données sur le cancer en libre accès qui ne contient que des données anonymisées sur les patients (ID SEER : 12296-Nov2018). Par conséquent, cette étude a été exemptée de l’approbation du comité d’examen de l’hôpital affilié Jinhua, École de médecine de l’Université du Zhejiang. 1. Préparation des données et des emballages R Préparez et importez les donné…

Representative Results

Dans cette étude, les données des patientes atteintes d’un cancer du sein ont été extraites de la base de données SEER et ont servi d’exemple. La base de données SEER fournit des données sur le cancer représentant environ 34,6% de la population des États-Unis, et l’autorisation d’accéder à la base de données a été obtenue (numéro de référence 12296-Nov2018). Deux nomogrammes (figure 1), tous deux comprenant le type histologique, le grade d…

Discussion

Cette étude a comparé des nomogrammes de risque concurrents établis par deux méthodes distinctes et a procédé à l’évaluation et à la validation des nomogrammes établis. Plus précisément, cette étude a fourni un tutoriel étape par étape pour établir le nomogramme basé sur une méthode directe, ainsi que pour calculer l’indice C et tracer les courbes d’étalonnage.

Le progiciel efficace du logiciel R est largement utilisé pour la construction et l’évaluation d…

Disclosures

The authors have nothing to disclose.

Acknowledgements

L’étude a été financée par des subventions du Medical Science & Technology Plan Project de la province du Zhejiang (numéros de subvention 2013KYA212), du programme général de la Fondation des sciences naturelles de la province du Zhejiang (numéro de subvention Y19H160126) et du programme clé du Bureau municipal des sciences et technologies de Jinhua (numéro de subvention 2016-3-005, 2018-3-001d et 2019-3-013).

Materials

R software None Not Applicable Version 3.6.2 or higher 
Computer system Microsoft  Windows 10  Windows 10 or higher

References

  1. Andersen, P. K., Gill, R. D. Cox’s regression model for counting processes: A large sample study. The Annals of Statistics. 10 (4), 1100-1120 (1982).
  2. Lubsen, J., Pool, J., vander Does, E. A practical device for the application of a diagnostic or prognostic function. Methods of Information in Medicine. 17 (2), 127-129 (1978).
  3. Harrell, F. E., Lee, K. L., Mark, D. B. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics In Medicine. 15 (4), 361-387 (1996).
  4. Hung, H., Chiang, C. -. T. Estimation methods for time-dependent AUC models with survival data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique. 38 (1), 8-26 (2010).
  5. Moons, K. G. M., et al. Risk prediction models: I. Development, internal validation, and assessing the incremental value of a new (bio)marker. Heart. 98 (9), 683-690 (2012).
  6. Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
  7. Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
  8. Wu, L., et al. Establishing a competing risk regression nomogram model for survival data. Journal of Visualized Experiments. (164), e60684 (2020).
  9. Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals of Translational Medicine. 5 (20), 403 (2017).
  10. Zhang, Z. H., et al. Overview of model validation for survival regression model with competing risks using melanoma study data. Annals Of Translational Medicine. 6 (16), 325 (2018).
  11. Newson, R. Confidence intervals for rank statistics: Somers’ D and extensions. Stata Journal. 6 (3), 309-334 (2006).
  12. Davison, A. C., Hinkley, D. V., Schechtman, E. Efficient bootstrap simulation. Biometrika. 73 (3), 555-566 (1986).
  13. Roecker, E. B. Prediction error and its estimation for subset-selected models. Technometrics. 33 (4), 459-468 (1991).
  14. Steyerberg, E. W., Harrell, F. E. Prediction models need appropriate internal, internal-external, and external validation. Journal of Clinical Epidemiology. 69, 245-247 (2016).
  15. Zhang, Z., Chen, L., Xu, P., Hong, Y. Predictive analytics with ensemble modeling in laparoscopic surgery: A technical note. Laparoscopic, Endoscopic and Robotic Surgery. 5 (1), 25-34 (2022).
check_url/64018?article_type=t

Play Video

Cite This Article
Lin, H., Zheng, H., Ge, C., Ling, L., Yin, R., Wang, Q., Zhang, X., Zhou, S., Jin, X., Xu, X., Fu, J. An R-Based Landscape Validation of a Competing Risk Model. J. Vis. Exp. (187), e64018, doi:10.3791/64018 (2022).

View Video