Summary

En R-baseret landskabsvalidering af en konkurrerende risikomodel

Published: September 16, 2022
doi:

Summary

Denne protokol beskriver koder i R til evaluering af en konkurrerende risikomodels diskriminerings- og kalibreringsevne samt koder til intern og ekstern validering af den.

Abstract

Cox-proportional faremodellen anvendes i vid udstrækning til overlevelsesanalyser i kliniske omgivelser, men den er ikke i stand til at klare flere overlevelsesresultater. Forskellig fra den traditionelle Cox proportional faremodel overvejer konkurrerende risikomodeller tilstedeværelsen af konkurrerende begivenheder og deres kombination med et nomogram, en grafisk beregningsenhed, som er et nyttigt værktøj for klinikere til at foretage en præcis prognostisk forudsigelse. I denne undersøgelse rapporterer vi en metode til etablering af det konkurrerende risikonomogram, det vil sige evalueringen af dets diskrimination (dvs. konkordansindeks og areal under kurven) og kalibreringsevner (dvs. kalibreringskurver) samt nettofordelen (dvs. beslutningskurveanalyse). Derudover blev der også udført intern validering ved hjælp af bootstrap-resamples af det oprindelige datasæt og ekstern validering ved hjælp af et eksternt datasæt af det etablerede konkurrerende risikonomogram for at demonstrere dets ekstrapoleringsevne. Det konkurrerende risikonomogram bør tjene som et nyttigt værktøj for klinikere til at forudsige prognose under hensyntagen til konkurrerende risici.

Introduction

I de senere år er nye prognostiske faktorer blevet identificeret med udviklingen af præcisionsmedicin, og prognostiske modeller, der kombinerer molekylære og kliniskpatologiske faktorer, tiltrækker stigende opmærksomhed i kliniske omgivelser. Imidlertid er ikke-grafiske modeller, såsom Cox proportional hazard model, med resultater af koefficientværdier, vanskelige for klinikere at forstå1. Til sammenligning er et nomogram et visualiseringsværktøj af regressionsmodeller (herunder Cox-regressionsmodellen, konkurrerende risikomodel osv.), Et todimensionelt diagram designet til den omtrentlige grafiske beregning af en matematisk funktion2. Det muliggør værdiansættelse af forskellige niveauer af variabler i en klinisk model og beregning af risikoscore (RS) for at forudsige prognosen.

Modelevaluering er afgørende i modelkonstruktion, og to egenskaber accepteres generelt til evaluering: diskrimination og kalibrering. I kliniske modeller henviser diskrimination til en models evne til at adskille personer, der udvikler begivenheder, fra dem, der ikke gør det, såsom patienter, der dør versus dem, der forbliver i live, og konkordansindekset (C-indeks) eller området under modtagerens driftskarakteristikkurve (AUC) bruges typisk til at karakterisere det 3,4. Kalibrering er en proces til sammenligning af de forudsagte sandsynligheder for en model med de faktiske sandsynligheder, og kalibreringskurver er blevet brugt i vid udstrækning til at repræsentere den. Derudover er modelvalidering (intern og ekstern validering) et vigtigt skridt i modelkonstruktion, og kun validerede modeller kan ekstrapoleres yderligere5.

Cox proportional hazard model er en regressionsmodel, der anvendes i medicinsk forskning til at undersøge sammenhængen mellem prognostiske faktorer og overlevelsesstatus. Cox-proportional faremodel tager imidlertid kun hensyn til to statusser for resultatet [Y (0, 1)], mens forsøgspersoner ofte står over for mere end to statusser, og konkurrerende risici opstår [Y (0, 1, 2)]1. Samlet overlevelse (OS), som defineres som tiden fra oprindelsesdatoen (f.eks. behandling) til dødsdatoen uanset årsag, er det vigtigste endepunkt i overlevelsesanalysen. Imidlertid undlader operativsystemet at skelne kræftspecifik død fra ikke-kræftspecifik død (f.eks. kardiovaskulære hændelser og andre ikke-relaterede årsager) og ignorerer dermed konkurrerende risici6. I disse situationer foretrækkes den konkurrerende risikomodel til forudsigelse af overlevelsesstatus under hensyntagen til konkurrerende risici7. Metoden til konstruktion og validering af Cox-proportionale faremodeller er veletableret, mens der kun har været få rapporter om validering af konkurrerende risikomodeller.

I vores tidligere undersøgelse blev der etableret et specifikt konkurrerende risikonomogram, en kombination af et nomogram og en konkurrerende risikomodel og en risikoscoreestimering baseret på en konkurrerende risikomodel8. Denne undersøgelse har til formål at præsentere forskellige metoder til evaluering og validering af det etablerede konkurrerende risikonomogram, som skal tjene som et nyttigt værktøj for klinikere til at forudsige prognose under hensyntagen til konkurrerende risici.

Protocol

SEER-databasen (Surveillance, Epidemiology, and End Results) er en kræftdatabase med åben adgang, der kun indeholder afidentificerede patientdata (SEER-id: 12296-nov. 2018). Derfor blev denne undersøgelse fritaget for godkendelse af bedømmelsesudvalget for det tilknyttede Jinhua Hospital, Zhejiang University School of Medicine. 1. Forberedelse af data og forberedelse af R-pakker Forbered og importér dataene.> Datasæt <- læs.csv ("…/Breast cancer Data…

Representative Results

I denne undersøgelse blev data fra patienter med brystkræft hentet fra SEER-databasen og fungerede som eksempeldata. SEER-databasen indeholder data om kræft, der repræsenterer omkring 34,6% af den amerikanske befolkning, og der blev opnået tilladelse til at få adgang til databasen (referencenummer 12296-nov2018). To nomogrammer (figur 1), begge inklusive histologisk type, differentieret grad, T-trin og N-trin, blev etableret ved hjælp af henholdsvis den dir…

Discussion

Denne undersøgelse sammenlignede konkurrerende risikonomogrammer etableret ved to forskellige metoder og gennemførte evaluering og validering af de etablerede nomogrammer. Specifikt gav denne undersøgelse en trinvis vejledning til etablering af nomogrammet baseret på en direkte metode samt beregning af C-indekset og plotning af kalibreringskurverne.

RMS-pakken i R-software bruges i vid udstrækning til konstruktion og evaluering af Cox-proportionale faremodeller, men den kan ikke …

Disclosures

The authors have nothing to disclose.

Acknowledgements

Undersøgelsen blev støttet af tilskud fra Medical Science &; Technology Plan Project of Zhejiang Province (bevillingsnumre 2013KYA212), det generelle program for Zhejiang Province Natural Science Foundation (bevillingsnummer Y19H160126) og nøgleprogrammet for Jinhua Municipal Science &; Technology Bureau (tilskudsnummer 2016-3-005, 2018-3-001d og 2019-3-013).

Materials

R software None Not Applicable Version 3.6.2 or higher 
Computer system Microsoft  Windows 10  Windows 10 or higher

References

  1. Andersen, P. K., Gill, R. D. Cox’s regression model for counting processes: A large sample study. The Annals of Statistics. 10 (4), 1100-1120 (1982).
  2. Lubsen, J., Pool, J., vander Does, E. A practical device for the application of a diagnostic or prognostic function. Methods of Information in Medicine. 17 (2), 127-129 (1978).
  3. Harrell, F. E., Lee, K. L., Mark, D. B. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics In Medicine. 15 (4), 361-387 (1996).
  4. Hung, H., Chiang, C. -. T. Estimation methods for time-dependent AUC models with survival data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique. 38 (1), 8-26 (2010).
  5. Moons, K. G. M., et al. Risk prediction models: I. Development, internal validation, and assessing the incremental value of a new (bio)marker. Heart. 98 (9), 683-690 (2012).
  6. Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
  7. Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
  8. Wu, L., et al. Establishing a competing risk regression nomogram model for survival data. Journal of Visualized Experiments. (164), e60684 (2020).
  9. Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals of Translational Medicine. 5 (20), 403 (2017).
  10. Zhang, Z. H., et al. Overview of model validation for survival regression model with competing risks using melanoma study data. Annals Of Translational Medicine. 6 (16), 325 (2018).
  11. Newson, R. Confidence intervals for rank statistics: Somers’ D and extensions. Stata Journal. 6 (3), 309-334 (2006).
  12. Davison, A. C., Hinkley, D. V., Schechtman, E. Efficient bootstrap simulation. Biometrika. 73 (3), 555-566 (1986).
  13. Roecker, E. B. Prediction error and its estimation for subset-selected models. Technometrics. 33 (4), 459-468 (1991).
  14. Steyerberg, E. W., Harrell, F. E. Prediction models need appropriate internal, internal-external, and external validation. Journal of Clinical Epidemiology. 69, 245-247 (2016).
  15. Zhang, Z., Chen, L., Xu, P., Hong, Y. Predictive analytics with ensemble modeling in laparoscopic surgery: A technical note. Laparoscopic, Endoscopic and Robotic Surgery. 5 (1), 25-34 (2022).
check_url/64018?article_type=t

Play Video

Cite This Article
Lin, H., Zheng, H., Ge, C., Ling, L., Yin, R., Wang, Q., Zhang, X., Zhou, S., Jin, X., Xu, X., Fu, J. An R-Based Landscape Validation of a Competing Risk Model. J. Vis. Exp. (187), e64018, doi:10.3791/64018 (2022).

View Video