Summary

Una convalida del panorama R-based di un modello di rischio concorrente

Published: September 16, 2022
doi:

Summary

Il presente protocollo descrive i codici in R per valutare le capacità di discriminazione e calibrazione di un modello di rischio concorrente, nonché i codici per la convalida interna ed esterna di esso.

Abstract

Il modello di rischio proporzionale di Cox è ampiamente applicato per le analisi di sopravvivenza in contesti clinici, ma non è in grado di far fronte a esiti di sopravvivenza multipli. A differenza del tradizionale modello di rischio proporzionale di Cox, i modelli di rischio concorrenti considerano la presenza di eventi concorrenti e la loro combinazione con un nomogramma, un dispositivo grafico di calcolo, che è uno strumento utile per i medici per condurre una previsione prognostica precisa. In questo studio, riportiamo un metodo per stabilire il nomogramma di rischio concorrente, cioè la valutazione delle sue capacità di discriminazione (cioè indice di concordanza e area sotto la curva) e calibrazione (cioè curve di calibrazione), nonché il beneficio netto (cioè l’analisi della curva decisionale). Inoltre, sono state eseguite anche la convalida interna utilizzando ricampioni bootstrap del set di dati originale e la convalida esterna utilizzando un set di dati esterno del nomogramma di rischio concorrente stabilito per dimostrare la sua capacità di estrapolazione. Il nomogramma del rischio concorrente dovrebbe servire come strumento utile per i medici per prevedere la prognosi con la considerazione dei rischi concorrenti.

Introduction

Negli ultimi anni, i fattori prognostici emergenti sono stati identificati con lo sviluppo della medicina di precisione e i modelli prognostici che combinano fattori molecolari e clinicopatologici stanno attirando una crescente attenzione in ambito clinico. Tuttavia, i modelli non grafici, come il modello di rischio proporzionale di Cox, con risultati dei valori dei coefficienti, sono difficili da comprendere per i medici1. In confronto, un nomogramma è uno strumento di visualizzazione di modelli di regressione (incluso il modello di regressione di Cox, il modello di rischio concorrente, ecc.), un diagramma bidimensionale progettato per il calcolo grafico approssimativo di una funzione matematica2. Consente la valutazione di diversi livelli di variabili in un modello clinico e il calcolo dei punteggi di rischio (RS) per prevedere la prognosi.

La valutazione del modello è essenziale nella costruzione del modello e due caratteristiche sono generalmente accettate per la valutazione: discriminazione e calibrazione. Nei modelli clinici, la discriminazione si riferisce alla capacità di un modello di separare gli individui che sviluppano eventi da quelli che non lo fanno, come i pazienti che muoiono rispetto a quelli che rimangono in vita, e l’indice di concordanza (indice C) o l’area sotto la curva caratteristica operativa del ricevitore (AUC) sono tipicamente utilizzati per caratterizzarlo 3,4. La calibrazione è un processo di confronto delle probabilità previste di un modello con le probabilità effettive e le curve di calibrazione sono state ampiamente utilizzate per rappresentarlo. Inoltre, la convalida del modello (convalida interna ed esterna) è un passo importante nella costruzione del modello e solo i modelli convalidati possono essere ulteriormente estrapolati5.

Il modello di rischio proporzionale di Cox è un modello di regressione utilizzato nella ricerca medica per studiare le associazioni tra fattori prognostici e stato di sopravvivenza. Tuttavia, il modello di rischio proporzionale di Cox considera solo due stati di esito [Y (0, 1)], mentre i soggetti dello studio spesso affrontano più di due stati e sorgono rischi concorrenti [Y (0, 1, 2)]1. La sopravvivenza globale (OS), che è definita come il tempo che intercorre tra la data di origine (ad esempio, il trattamento) e la data di morte dovuta a qualsiasi causa, è l’endpoint più importante nell’analisi della sopravvivenza. Tuttavia, l’OS non riesce a distinguere la morte specifica per cancro dalla morte non specifica per cancro (ad esempio, eventi cardiovascolari e altre cause non correlate), ignorando così i rischi concorrenti6. In queste situazioni, il modello di rischio concorrente è preferito per la previsione dello stato di sopravvivenza con la considerazione dei rischi concorrenti7. La metodologia di costruzione e convalida dei modelli di rischio proporzionale di Cox è ben consolidata, mentre ci sono state poche relazioni riguardanti la convalida di modelli di rischio concorrenti.

Nel nostro studio precedente, sono stati stabiliti uno specifico nomogramma di rischio concorrente, una combinazione di un nomogramma e un modello di rischio concorrente e una stima del punteggio di rischio basata su un modello di rischio concorrente8. Questo studio mira a presentare diversi metodi di valutazione e convalida del nomogramma di rischio concorrente stabilito, che dovrebbe servire come strumento utile per i medici per prevedere la prognosi con la considerazione dei rischi concorrenti.

Protocol

Il database di sorveglianza, epidemiologia e risultati finali (SEER) è un database di tumori ad accesso aperto che contiene solo dati di pazienti non identificati (ID SEER: 12296-Nov2018). Pertanto, questo studio è stato esentato dall’approvazione del comitato di revisione dell’ospedale affiliato Jinhua, Zhejiang University School of Medicine. 1. Preparazione dei dati e preparazione dei pacchetti R Preparare e importare i dati.> Dataset <- read.csv("…/Bre…

Representative Results

In questo studio, i dati delle pazienti con cancro al seno sono stati recuperati dal database SEER e sono serviti come dati di esempio. Il database SEER fornisce dati sul cancro che rappresentano circa il 34,6% della popolazione degli Stati Uniti ed è stato ottenuto il permesso di accedere al database (numero di riferimento 12296-novembre 2018). Due nomogrammi (Figura 1), entrambi comprendenti il tipo istologico, il grado differenziato, lo stadio T e lo stadio N,…

Discussion

Questo studio ha confrontato i nomogrammi di rischio concorrenti stabiliti con due metodi distinti e ha condotto la valutazione e la convalida dei nomogrammi stabiliti. In particolare, questo studio ha fornito un tutorial passo-passo per stabilire il nomogramma basato su un metodo diretto, nonché calcolare l’indice C e tracciare le curve di calibrazione.

Il pacchetto rms nel software R è ampiamente utilizzato per la costruzione e la valutazione di modelli di rischio proporzionale di…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Lo studio è stato sostenuto da sovvenzioni del Medical Science & Technology Plan Project della provincia di Zhejiang (numero di sovvenzione 2013KYA212), dal programma generale della Fondazione per le scienze naturali della provincia di Zhejiang (numero di sovvenzione Y19H160126) e dal programma chiave del Jinhua Municipal Science & Technology Bureau (numero di sovvenzione 2016-3-005, 2018-3-001d e 2019-3-013).

Materials

R software None Not Applicable Version 3.6.2 or higher 
Computer system Microsoft  Windows 10  Windows 10 or higher

References

  1. Andersen, P. K., Gill, R. D. Cox’s regression model for counting processes: A large sample study. The Annals of Statistics. 10 (4), 1100-1120 (1982).
  2. Lubsen, J., Pool, J., vander Does, E. A practical device for the application of a diagnostic or prognostic function. Methods of Information in Medicine. 17 (2), 127-129 (1978).
  3. Harrell, F. E., Lee, K. L., Mark, D. B. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics In Medicine. 15 (4), 361-387 (1996).
  4. Hung, H., Chiang, C. -. T. Estimation methods for time-dependent AUC models with survival data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique. 38 (1), 8-26 (2010).
  5. Moons, K. G. M., et al. Risk prediction models: I. Development, internal validation, and assessing the incremental value of a new (bio)marker. Heart. 98 (9), 683-690 (2012).
  6. Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
  7. Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
  8. Wu, L., et al. Establishing a competing risk regression nomogram model for survival data. Journal of Visualized Experiments. (164), e60684 (2020).
  9. Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals of Translational Medicine. 5 (20), 403 (2017).
  10. Zhang, Z. H., et al. Overview of model validation for survival regression model with competing risks using melanoma study data. Annals Of Translational Medicine. 6 (16), 325 (2018).
  11. Newson, R. Confidence intervals for rank statistics: Somers’ D and extensions. Stata Journal. 6 (3), 309-334 (2006).
  12. Davison, A. C., Hinkley, D. V., Schechtman, E. Efficient bootstrap simulation. Biometrika. 73 (3), 555-566 (1986).
  13. Roecker, E. B. Prediction error and its estimation for subset-selected models. Technometrics. 33 (4), 459-468 (1991).
  14. Steyerberg, E. W., Harrell, F. E. Prediction models need appropriate internal, internal-external, and external validation. Journal of Clinical Epidemiology. 69, 245-247 (2016).
  15. Zhang, Z., Chen, L., Xu, P., Hong, Y. Predictive analytics with ensemble modeling in laparoscopic surgery: A technical note. Laparoscopic, Endoscopic and Robotic Surgery. 5 (1), 25-34 (2022).
check_url/64018?article_type=t

Play Video

Cite This Article
Lin, H., Zheng, H., Ge, C., Ling, L., Yin, R., Wang, Q., Zhang, X., Zhou, S., Jin, X., Xu, X., Fu, J. An R-Based Landscape Validation of a Competing Risk Model. J. Vis. Exp. (187), e64018, doi:10.3791/64018 (2022).

View Video