Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Cancer Research

경쟁 위험 모델의 R 기반 조경 유효성 검사An R-based landscape validation of a competing risk model

Published: September 16, 2022 doi: 10.3791/64018
* These authors contributed equally

Summary

본 프로토콜은 경쟁 위험 모델의 식별 및 보정 능력을 평가하기 위한 R의 코드와 내부 및 외부 검증을 위한 코드를 설명합니다.

Abstract

Cox 비례 위험 모델은 임상 환경에서 생존 분석에 널리 적용되지만 여러 생존 결과에 대처할 수는 없습니다. 기존의 Cox 비례 위험 모델과 달리 경쟁 위험 모델은 경쟁 이벤트의 존재와 임상의가 정확한 예후 예측을 수행하는 데 유용한 도구인 그래픽 계산 장치인 노모그램과의 조합을 고려합니다. 이 연구에서 우리는 경쟁 위험 노모그램을 설정하는 방법, 즉 차별(즉, 일치 지수 및 곡선 아래 면적) 및 교정(즉, 교정 곡선) 능력의 평가와 순 이익(즉, 결정 곡선 분석). 또한, 기존 데이터셋의 부트스트랩 리샘플링을 이용한 내부검증과 기존 경쟁위험노모그램의 외부 데이터셋을 이용한 외부 검증도 수행하여 외삽 능력을 입증하였다. 경쟁 위험 노모그램은 임상의가 경쟁 위험을 고려하여 예후를 예측하는 데 유용한 도구 역할을 해야 합니다.

Introduction

최근 몇 년 동안 정밀 의학의 발달로 새로운 예후 요인이 확인되었으며 분자 및 임상 병리학 적 요인을 결합한 예후 모델이 임상 환경에서 점점 더 주목을 받고 있습니다. 그러나, 계수 값의 결과가 있는 Cox 비례 위험 모델과 같은 비그래픽 모델은 임상의가 이해하기 어렵다1. 이에 비해 노모그램은 회귀 모델(Cox 회귀 모델, 경쟁 위험 모델 등 포함)의 시각화 도구로, 수학 함수 2의 대략적인 그래픽 계산을 위해 설계된2차원 다이어그램이다. 이를 통해 임상 모델에서 다양한 수준의 변수를 평가하고 위험 점수(RS)를 계산하여 예후를 예측할 수 있습니다.

모델 평가는 모델 구축에 필수적이며 일반적으로 식별과 보정이라는 두 가지 특성이 평가에 허용됩니다. 임상 모델에서 차별은 사망한 환자와 생존한 환자와 같이 사건이 발생하는 개인과 그렇지 않은 개인을 구분하는 모델의 능력을 말하며, 일치 지수(C-index) 또는 수신기 작동 특성 곡선 아래 면적(AUC)은 일반적으로 이를 특성화하는 데 사용됩니다 3,4. 캘리브레이션은 모델의 예측 확률과 실제 확률을 비교하는 프로세스이며, 이를 표현하기 위해 캘리브레이션 곡선이 널리 사용되었습니다. 또한, 모델 검증(내부 및 외부 검증)은 모델 구축에서 중요한 단계이며, 검증된 모델만 추가로 외삽할 수 있다5.

Cox 비례 위험 모델은 예후 인자와 생존 상태 간의 연관성을 조사하기 위해 의학 연구에서 사용되는 회귀 모델입니다. 그러나 Cox 비례 위험 모델은 두 가지 결과 상태 [Y (0, 1)]만을 고려하는 반면, 연구 대상자는 종종 두 가지 이상의 상태에 직면하고 경쟁 위험이 발생합니다 [Y (0, 1, 2)]1. 기원일(예: 치료)부터 모든 원인으로 인한 사망일까지의 시간으로 정의되는 전체 생존(OS)은 생존 분석에서 가장 중요한 종점입니다. 그러나, OS는 암 특이적 사망과 비암 특이적 사망(예: 심혈관 사건 및 기타 관련 없는 원인)을 구별하지 못하여 경쟁 위험을 무시한다6. 이러한 상황에서, 경쟁적 위험(competing risk)은 경쟁적 위험(competing)을 고려한 생존 상태 예측을 위해 선호된다7. Cox 비례 위험 모델을 구성하고 검증하는 방법론은 잘 정립되어 있지만 경쟁 위험 모델의 검증에 관한 보고서는 거의 없습니다.

이전 연구에서는 특정 경쟁 위험 노모그램, 노모그램과 경쟁 위험 모델의 조합, 경쟁 위험 모델을 기반으로 한 위험 점수 추정을 설정했습니다8. 이 연구는 확립된 경쟁 위험 노모그램의 다양한 평가 및 검증 방법을 제시하는 것을 목표로 하며, 이는 임상의가 경쟁 위험을 고려하여 예후를 예측하는 데 유용한 도구 역할을 해야 합니다.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

SEER(Surveillance, Epidemiology, and End Results) 데이터베이스는 비식별화된 환자 데이터(SEER ID: 12296-Nov2018)만 포함하는 오픈 액세스 암 데이터베이스입니다. 따라서 본 연구는 저장대학교 의과대학 부속 진화병원 심사위원회의 승인을 면제받았다.

1. 데이터 준비 및 R 패키지 준비

  1. 데이터를 준비하고 가져옵니다.
    > 데이터 세트<- read.csv(".../Breast cancer Data.xlsx") #Import 데이터 입니다.
    참고: 데이터는 보충 파일 1에 업로드됩니다.
  2. R 패키지를 설치하고 로드합니다.
    > 패키지 <- c("rms","cmprsk","mstate","survival","riskRegression","
    prodlim")
    > req.pcg <- 함수(pcg){
    새로운 <- PCG[!( pcg %in% installed.packages()[, "패키지"])]
    if (length(new)) install.packages(new, 종속성 = T)
    sapply(pcg, 필요, ch = T)
    }
    > req.pcg(패키지)

    참고: 패키지 rms, cmprsk, mstate, survival, riskRegressionprodlim (http://www.r-projectrg/)을 사용하여 R 소프트웨어 (버전 3.6.2) 기반으로 다음 절차를 수행하십시오.

2. 두 가지 방법으로 경쟁 위험 노모그램을 설정합니다.

  1. 직접적인 방법으로 경쟁 위험 노모그램을 설정합니다.
    > mod_cph <- cph(Surv(생존 월, 상태) ~ 요인1+ 요인2+...,
    x=T, y=T, surv=T, data=데이터 세트)
    > nom <- nomogram(mod_cph, fun=list(function(x) 1-surv_cph(36, x)...),
    funlabel=c("3년 이벤트1 Prob." ...), lp=F)
    #Take 36번째 달을 예로 들 수 있습니다.
    > mod_crr <- crr(생존 월, fstatus, failcode=1, cov1=cov)
    > 점수 <- log(log((1-real.3y),(1-cif.min36)))/(maxbeta/100)
    > 플롯(nom)
  2. 가중치가 적용된 방법으로 경쟁 위험 노모그램을 설정합니다.
    > df.w <- crprep("생존 월", fstatus",
    데이터 = 데이터 세트, trans = c (1,2), cens = 0,
    keep=c("factor1"," factor2"...))
    > mod.w <- cph(Surv(Tstart, Tstop, status==1) ~ factor1+factor2+...,
    데이터=df.w, 가중치=가중치.cens, 하위 집합=failcode==1, surv=T)
    > nom.w <- 노모그램(mod.w...)

3. 경쟁 위험 노모그램의 판별 능력

  1. 차별에 대한 C-index
    1. 매트릭스 cov 를 경쟁 위험 모델 mod_crr에 맞추고 예측된 매트릭스 SUV를 얻습니다.
      > SUV <- predict.crr(mod_crr, cov)
    2. suv에서 특정 월의 누적 발생률을 구하고 rcorr.cens 함수를 사용하여 C-지수를 계산합니다.
      > cif36 <- suv[which(suv[,1]==36),][-1]
      > rcorr <- rcorr.cens(1-cif36,Surv(Dataset$Survivalmonths,Dataset$tumordeath))
      > cindex <- rcorr[1]
  2. 차별에 대한 AUC
    1. Score 함수(riskRegression package)를 사용하여 경쟁 위험 모델의 예측 성능을 채점합니다.
      > fgr.w <- FGR(Hist(Survivalmonths, fstatus) ~ factor1+ factor2+..., data=Dataset, cause=1)
      > 점수 <- Score(list("Fine-Gray" = fgr.w),
    2. "점수"에서 AUC를 추출합니다.
      > 점수$AUC

4. 경쟁 위험 모델의 보정 능력

  1. 경쟁 위험 모델의 95% 신뢰 구간을 갖는 검량선
    1. 특정 고장 시간에 각 개인의 누적 발생률이 있는 데이터 프레임을 가져옵니다.
      > cif36 <- data.frame(cif36)#Take 36 번째 월을 예로 들 수 있습니다.
      > colnames(cif36.36_o)<-c("36m")
    2. 추정된 누적 발생률에 따라 코호트를 5개의 부분군으로 나누고 각 부분군의 평균 예측 누적 발생률을 계산합니다.
      > group36 <- 컷(cif36$'36m',
      분위수(CIF36$'36M', Seq(0, 1, 0.2)),
      include.lowest = TRUE, 레이블 = 1:5)
      > 평균36 <- as.vector(by(cif36 $'36m', group36, mean))
    3. cuminc 함수를 사용하여 관측된 누적 발생률, 즉 실제 누적 발생률을 계산한 다음, 특정 고장 시간에서 95% 신뢰 구간으로 관측된 누적 발생률을 구합니다.
      > cum36 <- cuminc(Dataset$Survivalmonths,Dataset$fstatus,group36)
      > obs36 <- 시점(cum36,Dataset$Survivalmonths)$est[c(1:5),36]
      > obs36var <- 시점(cum36,Dataset$Survivalmonths)$var[c(1:5),36]
      > df <- data.frame(mean36, obs36, obs36var)
    4. 함수 ggplot을 사용하여 예측된 누적 발생률을 x축으로 하고 관찰된 누적 발생률을 y축으로 하여 검량선을 플로팅합니다.
      > ggplot(df)+ geom_point(aes(x=mean36,y=obs36),col="red")+
      geom_point(AES(x=mean36,y=obs36),col="빨간색",pch=4)+
      geom_line(col="빨간색",AES(x=mean36,y=obs36))+
      geom_errorbar(col="빨간색",aes(x=mean36,y=obs36+1.96
      *sqrt(obs36var)),
      YMIN =OBS36-1.96*SQRT(OBS36var), Ymax = OBS36+1.96
      *SQRT(OBS36VAR))
      geom_abline(lty=3,lwd=2,col=c(rgb(0,118,192,
      maxColorValue=255)))
  2. 경쟁 위험 모델의 위험 점수가 있는 보정 곡선
    1. 모든 변수의 각 수준을 평가하고 총 RS를 구합니다.
      > 데이터 세트$factor1[데이터 세트$factor1==1] <- factor1.scale["Factor1_level1"]
      >
      ... #For 예, Dataset$histology[Dataset$histology==1]<-histology.scale["Histology1"]
      > 데이터 세트$rs <- 데이터 세트$factor1+데이터 세트$factor2+데이터 세트$factor3+...
      참고: 각 변수의 점수를 합산하여 각 환자의 총 RS를 구합니다.
    2. 빈도를 계산하고 서로 다른 총 위험 점수의 관찰된 누적 발생률을 계산합니다.
      > rs.freq <- as.data.frame(table(Dataset$rs))
      > obs.36 <- 벡터(모드="숫자", 길이=nrow(rs.freq))
      > for (i in 1: nrow(rs.freq)) {
      데이터 집합 <- 하위 집합(데이터 집합,데이터 세트$rs== rs.freq [i,1])
      cif.dataset <- cuminc(dataset$Survivalmonths,dataset$death3)
      cif36.dataset <- 시점(cif.dataset,36)
      obs.36[i] <- cif36.dataset$est[1]}
    3. x축의 범위를 설정하고 총 위험 점수의 예측 누적 발생률을 계산합니다.
      > RS < 범위(nom$total.points)
      > x.36 <- seq(최소(RS),최대(RS),0.01)
      > pre.36 <- 1-(1-cif.min36)^exp(x.36*maxbeta/100)
    4. 위험 점수로 보정 곡선을 플로팅합니다.
      > 플롯(x.36, pre.36, type='l'...)
      > par(new=TRUE)
      > 플롯(as.vector(rs.freq[,1]), obs.36...)

5. 경쟁 위험 모델의 의사 결정 곡선 분석

  1. stdca 함수를 소싱하여 결정 곡선 분석을 수행합니다.
    > source("stdca. R")
  2. 노모그램에서 다항식 방정식을 추출하여 생존 확률을 계산합니다.
    > 노모그램Ex(nomo = nom)
    > 데이터 세트$예측 변수 <- A * (데이터 세트$rs ^3) + B * (데이터 세트$rs ^2) + C * 데이터 세트$rs + D
    #predictors는 확립된 노모그램에 의해 계산된 암 특이적 사망의 예측 확률입니다.
  3. 결정 곡선 분석을 수행합니다.
    > stdca(데이터 = 데이터 세트, 결과 = "상태", ttoutcome = "생존 월", 시점 = 36,
    예측자 = "예측변수", cmprsk = TRUE, 평활 = 거짓, 확률 = 거짓)

    참고: 경쟁 위험이 있는 경우 결과를 평가하려면 cmprsk에 대해 TRUE를 선택해야 합니다.

6. 부트스트랩 방법을 사용한 내부 검증

  1. 부트스트랩 방법을 사용하여 예측된 평균 누적 발생률을 구합니다.
    1. 원래 데이터 세트(Dataset)를 replace 로 리샘플링하여 부트스트랩 데이터 세트(Dataset_in)를 생성합니다. 부트스트랩 데이터 세트를 사용하여 경쟁 위험 모델(mod.in_crr)을 설정합니다. predict.crr 함수를 사용하여 mod.in_crr 예측하고 b번 반복하여 suvall.in 생성합니다.
      B=b
      suvall.in <- 목록()
      for(j in 1:B){
      Dataset_in <- 데이터 세트[샘플(c(1:nrow(데이터 세트)),nrow(데이터 세트),
      바꾸기 = TRUE),]
      부착(Dataset_ 입력)
      증권 시세 표시기. <에서 model.matrix(~factor1+ factor2+...) [,-1]
      모드. _crr <-crr(생존 월, fstatus, failcode=1, cov1=cov.in)
      detach(Dataset. 내부)
      SUV. <에서- predict.crr(mod. in _crr, cov)
      suvall.in[[j]] <- suv.in}
    2. 특정 월의 평균 예상 누적 발생률을 가져옵니다.
      cif36all입니다. 내부 <- 벡터(모드="숫자", 길이=nrow(데이터 세트))
      for (k in 1:B) {
      cif36all입니다. 내부<- CIF36ALL. 이너+ 수발. 내부[[k]][which(suvall. 내부[[k]][,1]==36),][-1]
      }
      cif36.in <- cif36all.in/B
  2. 함수 rcorr.cens와 함께 내부 교차 검증을 사용하여 C-지수를 계산합니다.
    RCORR입니다. 내부 <- rcorr.cens(1-cif36.in,Surv(Dataset$Survivalmonths,Dataset$tumordeath))
    cindex입니다. 내부 < - RCORR. 내부[1]
  3. 교차 내부 검증을 사용하여 교정합니다.
    참고: 내부 검증이 있는 경쟁 위험 모델의 보정 곡선 코드는 섹션 4의 코드와 유사하지만 suvsuv.in 로 대체되었습니다.

7. 경쟁 위험 모델의 외부 검증

  1. 외부 데이터를 사용하여 예측된 누적 발생률을 가져옵니다. 외부 데이터 변수 행렬(cov.ex)을 사용하여 예측된 누적 발생률을 가져옵니다.
    suv.ex < - predict.crr(mod_crr,cov.ex)
    cif36.ex <- suv.ex [which(suv.ex $time=="36"),][-1]
  2. 외부 검증을 사용하여 C-지수를 계산합니다.
    rcorr.ex <- rcorr.cens(1-cif36.ex,Surv(Dataset.ex$Survivalmonths,Dataset.ex$tumordeath))
    cindex.ex <- rcorr.ex[1]
  3. 외부 검증을 사용하여 보정합니다.
    참고: 내부 검증이 있는 경쟁 위험 모델의 보정 곡선 코드는 섹션 4의 코드와 유사하지만 suv는 suv.ex로 대체됩니다.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

이 연구에서는 SEER 데이터베이스에서 유방암 환자의 데이터를 검색하여 예제 데이터로 사용했습니다. SEER 데이터베이스는 미국 인구의 약 34.6%를 차지하는 암에 대한 데이터를 제공하며 데이터베이스 액세스 권한을 얻었습니다(참조 번호 12296-2018년 11월).

조직학적 유형, 분화 등급, T 단계 및 N 단계를 포함하는 두 개의 노모그램(그림 1)은 각각 직접 방법과 가중 방법을 사용하여 설정되었습니다. 각 변수 수준의 포인트와 총점에 해당하는 확률은 거의 동일했지만 약간의 차이가 관찰되었습니다. Zhang et al. 경쟁 위험 노모그램을 설정하기 위해 "가중치" 접근 방식을 도입했는데, 먼저 원본 데이터를 가중 데이터로 변환한 다음( 함수 crprep 사용), 가중 데이터로 Cox 회귀 모델을 구성하고(함수 coxph 사용), 마지막으로 Cox 회귀 모델(함수 노모그램 사용)과 경쟁 위험 노모그램을 설정했습니다.9. 대조적으로, 이 연구의 "직접" 접근 방식은 "가중치" 접근 방식과 완전히 다릅니다. 요컨대, 경쟁 위험 모델(함수 crr 사용)에서 생성된 매개변수는 Cox 회귀 모델( 함수 coxph 사용)의 매개변수를 대체했으며, 이는 최종적으로 경쟁 위험 노모그램(함수 노모그램 사용)을 설정하는 데 사용되었습니다. "가중치"방법과 "직접"방법으로 설정된 노모 그램을 비교하면 두 노모 그램은 일반적으로 유사하지만 약간의 차이가 관찰 될 수 있습니다. 이 연구의 "직접" 방법은 노모그램을 직접 구성하기 위한 매개변수를 얻기 때문에 더 정확합니다(섹션 2의 "score=log(log((1-real.3y),(1-cif.min36))))/(maxbeta/100)" 공식을 사용합니다.

rcorr.cens(X, Surv)에서 X는 임의의 시점에서의 누적 발생률을 갖는 숫자형 예측 변수이고, Surv는 생존 월수와 상태를 포함하는 생존 객체입니다. Surv가 경합 사건을 경험하는 환자를 중도절단 중인 환자로 정의한 다음 생명표를 생성하면 평가 가능한 순서 쌍은 동일합니다. 검증이 없는 경쟁 위험 모델의 C-지수는 0.7978(95% CI = 0.7650-0.8305)로, 이 모델이 중간 정도의 식별 능력을 가지고 있음을 나타냅니다. 부트스트랩 분석을 500회 반복한 다음 500개의 결과를 평균하여 C-지수를 계산하기 위한 단일 추정치를 생성했습니다. 내부 검증의 C-지수는 0.7978(95% CI = 0.7651-0.8305)로, 원래 데이터 세트의 C-지수와 유사했다. 외부 데이터 세트를 경쟁 위험 모델에 맞추었고 외부 검증의 C-지수는 0.5071(95% CI = 0.4637-0.5505)이었다. 경쟁 위험 모델의 AUC는 연구의 원래 데이터 세트에서 계산되었습니다. 36개월 AUC는 0.8461(95% CI = 0.8232-0.8691)로 모델의 식별 능력을 보여줍니다.

그림 2A에서 볼 수 있듯이 검량선의 점은 당량선에 가까웠고 관찰된 빈도의 95% CI는 각 그룹의 당량선에 속하여 모델의 정확한 검량능을 나타냅니다. 내부 및 외부 검증을 사용한 교정 곡선은 각각 그림 2B 및 그림 2C에 나와 있으며, 이는 구성된 모델이 내부 검증에서는 우수한 교정 능력을 가졌지만 외부 검증에서는 불량한 교정 능력을 가졌음을 나타냅니다.

보충 그림 1에 나타난 바와 같이, 관찰된 누적 발생률을 나타내는 점들은 예측된 누적 발생률을 나타내는 선 주위에 분포되어 있으며, 관찰된 발생률과 예측된 발생률 사이에 유의한 차이가 관찰되지 않았다. 의사결정 곡선 분석의 결과는 그림 3에 나와 있으며, 이는 임계값 확률이 증가함에 따라 순이익의 변화를 나타냅니다.

Figure 1
그림 1: 두 가지 방법으로 경쟁 위험 노모그램 설정. (A) 직접 방법을 사용하여 설정된 노모 그램. (B) 가중치 방법을 사용하여 설정된 노모그램. 조직학: 1, 침윤성 유관 암종; 2, 침윤성 소엽 암종; 3, 침윤성 유관 암종 + 침윤성 소엽 암종. 학년 : 1, 잘 차별화 된; 2, 적당히 차별화; 3, 잘 구별되지 않습니다. T 단계: 1, T1 단계; 2, T2 단계; 3, T3 단계; 4, T4 단계. N 단계: 0, N0 단계; 1, N1 단계; 2, N2 단계; 3, N3 단계. 약어: CSD = 암 관련 사망. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 2
그림 2: 경쟁 위험 노모그램의 보정 곡선. (A) 확립된 경쟁 위험 모델의 신뢰 구간을 갖는 교정 곡선. (B) 내부 검증에서 경쟁 위험 모델의 보정 곡선. (C) 외부 검증에서 경쟁 위험 모델의 보정 곡선. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Figure 3
그림 3: 경쟁 위험 노모그램의 결정 곡선 분석. 순 이익은 임계값 확률에 대해 표시됩니다. "all" 라인은 암 특이적 사망을 겪은 모든 환자를 고려한 순 편익을 나타내고, "없음" 라인은 암 특이적 사망을 겪지 않은 모든 환자를 고려한 순 편익을 나타냅니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

보충 파일 1: 유방암 데이터. 제목 정의: grademodify, differentiated grade; 조직학, 조직 학적 유형; 스테이지T, 종양 T 스테이지; 스테이지N, 종양 N 스테이지; 생존 개월, 치료일로부터 원인이나 검열로 인한 사망일까지의 시간; 사망, 사망(암 특이적 사망 및 비암 특이적 사망 포함) 또는 검열; 사망3, 암 특이성 사망, 비암 특이적 사망 또는 검열. 이 파일을 다운로드하려면 여기를 클릭하십시오.

보충 그림 1: 확립된 경쟁 위험 모델의 위험 점수가 있는 보정 곡선. 관찰된 누적 발생률을 나타내는 점들은 예측된 누적 발생률을 나타내는 선 주위에 분포되었다. 이 파일을 다운로드하려면 여기를 클릭하십시오.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

이 연구는 두 가지 별개의 방법으로 확립된 경쟁 위험 노모그램을 비교하고 확립된 노모그램에 대한 평가 및 검증을 수행했습니다. 구체적으로, 본 연구에서는 직접적인 방법을 기반으로 노모그램을 설정하고 C-index를 계산하고 검량선을 플로팅하기 위한 단계별 튜토리얼을 제공했습니다.

R 소프트웨어의 rms 패키지는 Cox 비례 위험 모델의 구성 및 평가에 널리 사용되지만 경쟁 위험 모델에는 적용되지 않습니다. 여러 결과가 있는 모델의 경우 Zhang et al. AUC 및 Brier 점수를 계산하여 식별 능력을 평가하고 보정 능력을 검증하기 위해 보정 곡선을 플롯하는 R 소프트웨어의 riskRegression 패키지를 사용하여 경쟁 위험 모델의 검증을 보고했습니다 9,10.

그러나 riskRegression 패키지에는 C-지수 계산 실패와 같은 몇 가지 단점이 있습니다. C-index는 모든 평가 가능한 순서 쌍에서 일치 평가 가능한 순서 쌍의 비율입니다(C-Index = 일치 평가 가능한 순서 쌍/모든 평가 가능한 순서 쌍)3,11. 전통적인 2 상태 결과 생존 분석에서 두 환자가 모두 사망한 쌍(Di = 1, Dj = 1) 또는 사망한 환자가 실패한 환자보다 생존 기간이 짧은 쌍만이 평가 가능한 순서 쌍(Di = 1, Dj = 0, Ti < Tj)(i = 환자 i, j = 환자 j, T = 시간, D = 상태, 1 = 사망, 0 = 실패). 경쟁 위험의 맥락에서, 경쟁 위험에서 실패한 환자는 경쟁 사건을 경험하는 환자가 관찰 된 것보다 생존 기간이 더 길다는 것을 추론 할 수 있기 때문에 여전히 위험 세트에 남아 있습니다. 또한 두 환자가 모두 사망하거나(Di = 1, Dj = 1) 사망한 환자가 경쟁 이벤트에 실패하거나 경험한 환자보다 생존 기간이 짧은 쌍만이 평가 가능한 순서 쌍이 될 수 있습니다(Di = 1, Dj = 0|2, Ti < Tj)(i = 환자 i, j = 환자 j, T = 시간, D = 상태, 2 = 경쟁 이벤트, 1 = 사망, 0 = 실패). 따라서 이 연구에서는 rcorr.cens 함수를 사용하여 C-지수를 계산했습니다.

경쟁 위험 모델의 내부 검증에서 본 연구는 부트스트랩 방법을 적용하여 구성된 모델12의 우수한 성능을 입증하였다. 학습 및 테스트 데이터 세트로 무작위로 분할하는 것은 테스트 데이터 세트가 예측하기 특히 쉬울 수 있기 때문에 문제가 될 수 있습니다13. K-폴드 방법은 교차 검증에도 사용할 수 있지만 모델 검증 5,14에서는 덜 자주 적용되었습니다. 이 연구는 또한 경쟁 위험 모델에 대한 외부 검증을 수행했지만 외부 맥락에서는 잘 수행되지 않았습니다. 이는 외부 검증에 사용된 데이터가 원본 데이터의 리샘플링에 불과했기 때문일 수 있습니다.

그러나 이 연구에는 몇 가지 제한 사항이 있습니다. 첫째, 우리의 방법론은 R 소프트웨어를 기반으로합니다. 따라서 사용자는 특정 프로그래밍 지식이 필요하므로 대상 고객을 제한할 수 있습니다. 또한 수백 줄의 코드가 있으며 일부 코드는 다른 데이터에 대해 변경이 필요합니다. 향후 연구에서 모든 종류의 데이터에 적용할 수 있는 "올인원" R 패키지를 개발하기를 희망합니다. 본 연구는 외부 검증을 수행할 다른 유방암 데이터가 없고 원본 데이터에서 다시 샘플링할 수밖에 없었지만 외부 검증을 위한 방법과 코드는 동일합니다. 가장 중요한 것은 연구에서 가정한 공변량과 결과 간의 선형성이 실제 연구에서 사실이 아닐 수 있으며, 앙상블 모델링이 도움이 될 수 있는 상호작용 및 비선형성을 고려해야 한다는 것입니다15.

결론적으로, 본 연구는 경쟁 리스크 노모그램을 '직접적' 방법으로 확립하고 원본, 내부, 외부 데이터셋에서 차별 및 보정 능력을 평가하였다. 경쟁 위험 노모그램이 R의 riskRegression 패키지를 보완하고 임상 경쟁 위험 이벤트를 처리하는 데 도움이 되기를 바랍니다.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

저자는 경쟁 이익이 없다고 선언합니다.

Acknowledgments

이 연구는 절강성 의료과학기술계획사업(보조금 번호 2013KYA212), 저장성 자연과학재단 일반 프로그램(보조금 번호 Y19H160126), 진화시 과학기술국의 핵심 프로그램(보조금 번호 2016-3-005, 2018-3-001d, 2019-3-013)의 보조금으로 지원되었다.

Materials

Name Company Catalog Number Comments
R software None Not Applicable Version 3.6.2 or higher 
Computer system Microsoft  Windows 10  Windows 10 or higher

DOWNLOAD MATERIALS LIST

References

  1. Andersen, P. K., Gill, R. D. Cox's regression model for counting processes: A large sample study. The Annals of Statistics. 10 (4), 1100-1120 (1982).
  2. Lubsen, J., Pool, J., vander Does, E. A practical device for the application of a diagnostic or prognostic function. Methods of Information in Medicine. 17 (2), 127-129 (1978).
  3. Harrell, F. E., Lee, K. L., Mark, D. B. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics In Medicine. 15 (4), 361-387 (1996).
  4. Hung, H., Chiang, C. -T. Estimation methods for time-dependent AUC models with survival data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique. 38 (1), 8-26 (2010).
  5. Moons, K. G. M., et al. Risk prediction models: I. Development, internal validation, and assessing the incremental value of a new (bio)marker. Heart. 98 (9), 683-690 (2012).
  6. Fu, J., et al. Real-world impact of non-breast cancer-specific death on overall survival in resectable breast cancer. Cancer. 123 (13), 2432-2443 (2017).
  7. Fine, J. P., Gray, R. J. A proportional hazards model for the subdistribution of a competing risk. Journal of the American Statistical Association. 94 (446), 496-509 (1999).
  8. Wu, L., et al. Establishing a competing risk regression nomogram model for survival data. Journal of Visualized Experiments. (164), e60684 (2020).
  9. Zhang, Z., Geskus, R. B., Kattan, M. W., Zhang, H., Liu, T. Nomogram for survival analysis in the presence of competing risks. Annals of Translational Medicine. 5 (20), 403 (2017).
  10. Zhang, Z. H., et al. Overview of model validation for survival regression model with competing risks using melanoma study data. Annals Of Translational Medicine. 6 (16), 325 (2018).
  11. Newson, R. Confidence intervals for rank statistics: Somers' D and extensions. Stata Journal. 6 (3), 309-334 (2006).
  12. Davison, A. C., Hinkley, D. V., Schechtman, E. Efficient bootstrap simulation. Biometrika. 73 (3), 555-566 (1986).
  13. Roecker, E. B. Prediction error and its estimation for subset-selected models. Technometrics. 33 (4), 459-468 (1991).
  14. Steyerberg, E. W., Harrell, F. E. Prediction models need appropriate internal, internal-external, and external validation. Journal of Clinical Epidemiology. 69, 245-247 (2016).
  15. Zhang, Z., Chen, L., Xu, P., Hong, Y. Predictive analytics with ensemble modeling in laparoscopic surgery: A technical note. Laparoscopic, Endoscopic and Robotic Surgery. 5 (1), 25-34 (2022).

Tags

Cancer Research 경쟁 위험 모델 노모 그램 차별 보정 모델 검증
경쟁 위험 모델의 R 기반 조경 유효성 검사An R-based landscape validation of a competing risk model
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Lin, H., Zheng, H., Ge, C., Ling,More

Lin, H., Zheng, H., Ge, C., Ling, L., Yin, R., Wang, Q., Zhang, X., Zhou, S., Jin, X., Xu, X., Fu, J. An R-Based Landscape Validation of a Competing Risk Model. J. Vis. Exp. (187), e64018, doi:10.3791/64018 (2022).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter