Summary

En R-baserad landskapsvalidering av en konkurrerande riskmodell

Published: September 16, 2022
doi:

Summary

Detta protokoll beskriver koder i R för utvärdering av en konkurrerande riskmodells diskriminerings- och kalibreringsförmåga samt koder för intern och extern validering av den.

Abstract

Cox proportionella riskmodell används i stor utsträckning för överlevnadsanalyser i kliniska miljöer, men den kan inte hantera flera överlevnadsresultat. Till skillnad från den traditionella Cox-proportionella riskmodellen överväger konkurrerande riskmodeller förekomsten av konkurrerande händelser och deras kombination med ett nomogram, en grafisk beräkningsanordning, vilket är ett användbart verktyg för kliniker att genomföra en exakt prognostisk förutsägelse. I denna studie redovisar vi en metod för att fastställa det konkurrerande risknomogrammet, det vill säga utvärderingen av dess diskrimineringsförmåga (dvs. konkordansindex och area under kurvan) och kalibreringsförmåga (dvs. kalibreringskurvor) samt nettonyttan (dvs. beslutskurvanalys). Dessutom utfördes intern validering med bootstrap-omsampling av den ursprungliga datauppsättningen och extern validering med hjälp av en extern dataset av det etablerade konkurrerande risknomogrammet för att visa dess extrapoleringsförmåga. Det konkurrerande risknomogrammet bör fungera som ett användbart verktyg för kliniker att förutsäga prognos med beaktande av konkurrerande risker.

Introduction

Under de senaste åren har nya prognostiska faktorer identifierats med utvecklingen av precisionsmedicin, och prognostiska modeller som kombinerar molekylära och kliniska patologiska faktorer väcker allt större uppmärksamhet i kliniska miljöer. Icke-grafiska modeller, såsom Cox proportionella riskmodell, med resultat av koefficientvärden, är dock svåra för kliniker att förstå1. I jämförelse är ett nomogram ett visualiseringsverktyg för regressionsmodeller (inklusive Cox-regressionsmodellen, konkurrerande riskmodell etc.), ett tvådimensionellt diagram utformat för ungefärlig grafisk beräkning av en matematisk funktion2. Det möjliggör värdering av olika nivåer av variabler i en klinisk modell och beräkning av riskpoäng (RS) för att förutsäga prognos.

Modellutvärdering är avgörande i modellkonstruktion, och två egenskaper är allmänt accepterade för utvärdering: diskriminering och kalibrering. I kliniska modeller avser diskriminering en modells förmåga att skilja individer som utvecklar händelser från dem som inte gör det, såsom patienter som dör kontra de som förblir vid liv, och konkordansindex (C-index) eller området under mottagarens operativa karakteristikkurva (AUC) används vanligtvis för att karakterisera det 3,4. Kalibrering är en process för att jämföra de förutsagda sannolikheterna för en modell med de faktiska sannolikheterna, och kalibreringskurvor har använts i stor utsträckning för att representera den. Dessutom är modellvalidering (intern och extern validering) ett viktigt steg i modellkonstruktionen, och endast validerade modeller kan extrapoleras ytterligare5.

Cox proportionella riskmodell är en regressionsmodell som används inom medicinsk forskning för att undersöka sambanden mellan prognostiska faktorer och överlevnadsstatus. Cox proportionella riskmodell tar emellertid endast hänsyn till två statusar för utfall [Y (0, 1)], medan studieämnen ofta står inför mer än två statuser och konkurrerande risker uppstår [Y (0, 1, 2)]1. Total överlevnad (OS), som definieras som tiden från ursprungsdatum (t.ex. behandling) till dödsdatum oavsett orsak, är det viktigaste effektmåttet i överlevnadsanalys. Operativsystemet misslyckas dock med att skilja cancerspecifik död från icke-cancerspecifik död (t.ex. kardiovaskulära händelser och andra orelaterade orsaker), vilket ignorerar konkurrerande risker6. I dessa situationer föredras den konkurrerande riskmodellen för att förutsäga överlevnadsstatus med beaktande av konkurrerande risker7. Metoden för att konstruera och validera Cox proportionella riskmodeller är väletablerad, medan det har förekommit få rapporter om validering av konkurrerande riskmodeller.

I vår tidigarestudie fastställdes ett specifikt konkurrerande risknomogram, en kombination av ett nomogram och en konkurrerande riskmodell och en riskpoänguppskattning baserad på en konkurrerande riskmodell 8. Denna studie syftar till att presentera olika metoder för utvärdering och validering av det etablerade konkurrerande risknomogrammet, vilket bör fungera som ett användbart verktyg för kliniker att förutsäga prognos med hänsyn till konkurrerande risker.

Protocol

SEER-databasen (Surveillance, Epidemiology, and End Results) är en öppen cancerdatabas som endast innehåller avidentifierade patientdata (SEER-ID: 12296-nov2018). Därför var denna studie undantagen från godkännandet av granskningsnämnden för det anslutna Jinhua-sjukhuset, Zhejiang University School of Medicine. 1. Dataförberedelse och förberedelse av R-paket Förbered och importera data.> Dataset <- läs.csv("…/Bröstcancerdata.xlsx") #Impor…

Representative Results

I denna studie hämtades data från patienter med bröstcancer från SEER-databasen och fungerade som exempeldata. SEER-databasen tillhandahåller data om cancer som representerar cirka 34,6% av USA: s befolkning, och tillstånd att komma åt databasen erhölls (referensnummer 12296-nov2018). Två nomogram (figur 1), båda inklusive histologisk typ, differentierad grad, T-steg och N-steg, upprättades med hjälp av den direkta metoden respektive den viktade metode…

Discussion

Denna studie jämförde konkurrerande risknomogram etablerade med två olika metoder och genomförde utvärdering och validering av de etablerade nomogrammen. Specifikt gav denna studie en steg-för-steg-handledning för att fastställa nomogrammet baserat på en direkt metod, samt beräkna C-index och plotta kalibreringskurvorna.

RMS-paketet i R-programvara används ofta för konstruktion och utvärdering av Cox proportionella riskmodeller, men det är inte tillämpligt för konkurre…

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Studien stöddes av bidrag från Medical Science & Technology Plan Project i Zhejiang-provinsen (bidragsnummer 2013KYA212), det allmänna programmet för Zhejiang Province Natural Science Foundation (bidragsnummer Y19H160126) och nyckelprogrammet för Jinhua Municipal Science & Technology Bureau (bidragsnummer 2016-3-005, 2018-3-001d och 2019-3-013).

Materials

R software None Not Applicable Version 3.6.2 or higher 
Computer system Microsoft  Windows 10  Windows 10 or higher

Riferimenti

  1. Andersen, P. K., Gill, R. D. Cox’s regression model for counting processes: A large sample study. The Annals of Statistics. 10 (4), 1100-1120 (1982).
  2. Lubsen, J., Pool, J., vander Does, E. A practical device for the application of a diagnostic or prognostic function. Methods of Information in Medicine. 17 (2), 127-129 (1978).
  3. Harrell, F. E., Lee, K. L., Mark, D. B. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics In Medicine. 15 (4), 361-387 (1996).
  4. Hung, H., Chiang, C. -. T. Estimation methods for time-dependent AUC models with survival data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique. 38 (1), 8-26 (2010).
  5. Moons, K. G. M., et al. Risk prediction models: I. Development, internal validation, and assessing the incremental value of a new (bio)marker. Heart. 98 (9), 683-690 (2012).
  6. Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
  7. Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
  8. Wu, L., et al. Establishing a competing risk regression nomogram model for survival data. Journal of Visualized Experiments. (164), e60684 (2020).
  9. Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals of Translational Medicine. 5 (20), 403 (2017).
  10. Zhang, Z. H., et al. Overview of model validation for survival regression model with competing risks using melanoma study data. Annals Of Translational Medicine. 6 (16), 325 (2018).
  11. Newson, R. Confidence intervals for rank statistics: Somers’ D and extensions. Stata Journal. 6 (3), 309-334 (2006).
  12. Davison, A. C., Hinkley, D. V., Schechtman, E. Efficient bootstrap simulation. Biometrika. 73 (3), 555-566 (1986).
  13. Roecker, E. B. Prediction error and its estimation for subset-selected models. Technometrics. 33 (4), 459-468 (1991).
  14. Steyerberg, E. W., Harrell, F. E. Prediction models need appropriate internal, internal-external, and external validation. Journal of Clinical Epidemiology. 69, 245-247 (2016).
  15. Zhang, Z., Chen, L., Xu, P., Hong, Y. Predictive analytics with ensemble modeling in laparoscopic surgery: A technical note. Laparoscopic, Endoscopic and Robotic Surgery. 5 (1), 25-34 (2022).
check_url/it/64018?article_type=t

Play Video

Citazione di questo articolo
Lin, H., Zheng, H., Ge, C., Ling, L., Yin, R., Wang, Q., Zhang, X., Zhou, S., Jin, X., Xu, X., Fu, J. An R-Based Landscape Validation of a Competing Risk Model. J. Vis. Exp. (187), e64018, doi:10.3791/64018 (2022).

View Video