Summary

En R-basert landskapsvalidering av en konkurrerende risikomodell

Published: September 16, 2022
doi:

Summary

Denne protokollen beskriver koder i R for evaluering av diskriminerings- og kalibreringsevnen til en konkurrerende risikomodell, samt koder for intern og ekstern validering av denne.

Abstract

Cox’ proporsjonale hasardmodell er mye brukt for overlevelsesanalyser i kliniske settinger, men den er ikke i stand til å håndtere flere overlevelsesutfall. Forskjellig fra den tradisjonelle Cox proporsjonale faremodellen, vurderer konkurrerende risikomodeller tilstedeværelsen av konkurrerende hendelser og deres kombinasjon med et nomogram, en grafisk beregningsenhet, som er et nyttig verktøy for klinikere å gjennomføre en presis prognostisk prediksjon. I denne studien rapporterer vi en metode for å etablere det konkurrerende risikonomogrammet, det vil si evalueringen av dets diskriminering (dvs. konkordansindeks og areal under kurven) og kalibreringsevner (dvs. kalibreringskurver), samt nettofordelen (dvs. beslutningskurveanalyse). I tillegg ble det også utført intern validering ved hjelp av bootstrap-resamples av det opprinnelige datasettet og ekstern validering ved hjelp av et eksternt datasett av det etablerte konkurrerende risikonomogrammet for å demonstrere dets ekstrapoleringsevne. Det konkurrerende risikonomogrammet bør tjene som et nyttig verktøy for klinikere til å forutsi prognose med hensyn til konkurrerende risiko.

Introduction

I de senere år har nye prognostiske faktorer blitt identifisert med utviklingen av presisjonsmedisin, og prognostiske modeller som kombinerer molekylære og kliniskpatologiske faktorer trekker økende oppmerksomhet i kliniske omgivelser. Imidlertid er ikke-grafiske modeller, som Cox-proporsjonal hasardmodell, med resultater av koeffisientverdier, vanskelig for klinikere å forstå1. Til sammenligning er et nomogram et visualiseringsverktøy av regresjonsmodeller (inkludert Cox-regresjonsmodellen, konkurrerende risikomodell, etc.), et todimensjonalt diagram designet for omtrentlig grafisk beregning av en matematisk funksjon2. Det muliggjør verdsettelse av ulike nivåer av variabler i en klinisk modell og beregning av risikoscore (RS) for å forutsi prognose.

Modellevaluering er essensielt i modellkonstruksjon, og to egenskaper er generelt akseptert for evaluering: diskriminering og kalibrering. I kliniske modeller refererer diskriminering til en modells evne til å skille individer som utvikler hendelser fra de som ikke gjør det, for eksempel pasienter som dør mot de som forblir i live, og konkordansindeksen (C-indeks) eller området under mottakerens operasjonskarakteristiske kurve (AUC) brukes vanligvis til å karakterisere den 3,4. Kalibrering er en prosess for å sammenligne de predikerte sannsynlighetene til en modell med de faktiske sannsynlighetene, og kalibreringskurver har blitt mye brukt til å representere den. I tillegg er modellvalidering (intern og ekstern validering) et viktig trinn i modellkonstruksjon, og bare validerte modeller kan ekstrapoleres ytterligere5.

Cox’ proporsjonale hasardmodell er en regresjonsmodell som brukes i medisinsk forskning for å undersøke sammenhenger mellom prognostiske faktorer og overlevelsesstatus. Cox’ proporsjonale hasardmodell tar imidlertid bare hensyn til to utfallsstatuser [Y (0, 1)], mens forsøkspersoner ofte står overfor mer enn to statuser, og konkurrerende risikoer oppstår [Y (0, 1, 2)]1. Total overlevelse (OS), som er definert som tiden fra opprinnelsesdato (f.eks. behandling) til dødsdato uansett årsak, er det viktigste endepunktet i overlevelsesanalysen. OS klarer imidlertid ikke å skille kreftspesifikk død fra ikke-kreftspesifikk død (f.eks. kardiovaskulære hendelser og andre ikke-relaterte årsaker), og ignorerer dermed konkurrerende risikoer6. I disse situasjonene foretrekkes den konkurrerende risikomodellen for prediksjon av overlevelsesstatus med hensyn til konkurrerende risiko7. Metodikken for å konstruere og validere Cox’ proporsjonale faremodeller er veletablert, mens det har vært få rapporter om validering av konkurrerende risikomodeller.

I vår tidligere studie ble det etablert et spesifikt konkurrerende risikonomogram, en kombinasjon av et nomogram og en konkurrerende risikomodell og en risikoskårestimering basert på en konkurrerende risikomodell8. Denne studien tar sikte på å presentere ulike metoder for evaluering og validering av det etablerte konkurrerende risikonomogrammet, som skal tjene som et nyttig verktøy for klinikere til å forutsi prognose med hensyn til konkurrerende risiko.

Protocol

Databasen Surveillance, Epidemiology, and End Results (SEER) er en åpen kreftdatabase som bare inneholder avidentifiserte pasientdata (SEER-ID: 12296-Nov2018). Derfor ble denne studien unntatt fra godkjenning av gjennomgangsstyret for det tilknyttede Jinhua-sykehuset, Zhejiang University School of Medicine. 1. Dataforberedelse og forberedelse av R-pakker Klargjør og importer dataene.> Datasett <- les.csv ("…/Brystkreftdata.xlsx") #Import data.MER…

Representative Results

I denne studien ble data om pasienter med brystkreft hentet fra SEER-databasen og fungerte som eksempeldata. SEER-databasen gir data om kreft som representerer rundt 34.6% av USAs befolkning, og tillatelse til å få tilgang til databasen ble oppnådd (referansenummer 12296-Nov2018). To nomogrammer (figur 1), begge med histologisk type, differensiert karakter, T-stadium og N-stadium, ble etablert med henholdsvis direkte metode og vektet metode. Poengene for hvert …

Discussion

Denne studien sammenlignet konkurrerende risikonomogrammer etablert ved to forskjellige metoder og gjennomførte evaluering og validering av de etablerte nomogrammene. Spesielt ga denne studien en trinnvis veiledning for å etablere nomogrammet basert på en direkte metode, samt beregne C-indeksen og plotte kalibreringskurvene.

RMS-pakken i R-programvaren er mye brukt til konstruksjon og evaluering av Cox proporsjonale faremodeller, men den er ikke anvendelig for konkurrerende risikom…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Studien ble støttet av tilskudd fra Medical Science & Technology Plan Project of Zhejiang-provinsen (tilskuddsnummer 2013KYA212), det generelle programmet til Zhejiang Province Natural Science Foundation (tilskuddsnummer Y19H160126), og nøkkelprogrammet til Jinhua Municipal Science & Technology Bureau (tilskuddsnummer 2016-3-005, 2018-3-001d og 2019-3-013).

Materials

R software None Not Applicable Version 3.6.2 or higher 
Computer system Microsoft  Windows 10  Windows 10 or higher

References

  1. Andersen, P. K., Gill, R. D. Cox’s regression model for counting processes: A large sample study. The Annals of Statistics. 10 (4), 1100-1120 (1982).
  2. Lubsen, J., Pool, J., vander Does, E. A practical device for the application of a diagnostic or prognostic function. Methods of Information in Medicine. 17 (2), 127-129 (1978).
  3. Harrell, F. E., Lee, K. L., Mark, D. B. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics In Medicine. 15 (4), 361-387 (1996).
  4. Hung, H., Chiang, C. -. T. Estimation methods for time-dependent AUC models with survival data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique. 38 (1), 8-26 (2010).
  5. Moons, K. G. M., et al. Risk prediction models: I. Development, internal validation, and assessing the incremental value of a new (bio)marker. Heart. 98 (9), 683-690 (2012).
  6. Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
  7. Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
  8. Wu, L., et al. Establishing a competing risk regression nomogram model for survival data. Journal of Visualized Experiments. (164), e60684 (2020).
  9. Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals of Translational Medicine. 5 (20), 403 (2017).
  10. Zhang, Z. H., et al. Overview of model validation for survival regression model with competing risks using melanoma study data. Annals Of Translational Medicine. 6 (16), 325 (2018).
  11. Newson, R. Confidence intervals for rank statistics: Somers’ D and extensions. Stata Journal. 6 (3), 309-334 (2006).
  12. Davison, A. C., Hinkley, D. V., Schechtman, E. Efficient bootstrap simulation. Biometrika. 73 (3), 555-566 (1986).
  13. Roecker, E. B. Prediction error and its estimation for subset-selected models. Technometrics. 33 (4), 459-468 (1991).
  14. Steyerberg, E. W., Harrell, F. E. Prediction models need appropriate internal, internal-external, and external validation. Journal of Clinical Epidemiology. 69, 245-247 (2016).
  15. Zhang, Z., Chen, L., Xu, P., Hong, Y. Predictive analytics with ensemble modeling in laparoscopic surgery: A technical note. Laparoscopic, Endoscopic and Robotic Surgery. 5 (1), 25-34 (2022).
check_url/64018?article_type=t

Play Video

Cite This Article
Lin, H., Zheng, H., Ge, C., Ling, L., Yin, R., Wang, Q., Zhang, X., Zhou, S., Jin, X., Xu, X., Fu, J. An R-Based Landscape Validation of a Competing Risk Model. J. Vis. Exp. (187), e64018, doi:10.3791/64018 (2022).

View Video