Summary

使用军事卫生系统数据存储库和国家死亡指数进行治疗加权的反向概率(概率评分)

Published: January 08, 2020
doi:

Summary

当随机对照试验不可行时,像军事卫生系统数据存储库这样的综合卫生保健数据源为回顾性分析提供了有吸引力的替代方案。纳入国家死亡指数的死亡率数据,并使用倾向权重平衡群体之间的差异,有助于减少追溯设计中固有的偏见。

Abstract

当随机对照试验不可行时,使用大数据的回顾性研究提供了一种高效且经济高效的替代方案,尽管它们存在治疗选择偏差的风险。当治疗选择基于也与结果相关的预治疗特征时,治疗选择偏差发生在非随机研究中。这些治疗前特征,或混淆,可以影响评估治疗对结果的影响。倾向分数通过平衡治疗组之间的已知混淆,将这种偏差降至最低。执行倾向性分数分析的方法有几种方法,包括倾向评分、倾向匹配和治疗权重的反向概率 (IPTW) 分层。此处介绍的是使用 IPTW 来平衡美国军事卫生系统数据存储库 (MDR) 中一组患者的基线合并症。MDR 是一个相对最佳的数据源,因为它提供了一个包含的队列,其中向符合条件的受益人提供几乎完整的住院和门诊服务信息。下文概述了使用《孕产妇死亡率报告》补充国家死亡指数信息,以提供可靠的死亡率数据。还提供了使用管理数据的建议。最后,该协议共享一个SAS代码,用于使用IPTW来平衡已知的混淆,并绘制感兴趣的结果的累积入射函数。

Introduction

随机的安慰剂对照试验是最有力的研究设计,以量化治疗的有效性,但由于成本和时间要求或治疗组1之间缺乏装备,它们并不总是可行的。在这些情况下,使用大规模管理数据(”大数据”)的回顾性队列设计通常提供高效且经济高效的替代方案,但缺乏随机化引入了治疗选择偏差2。当治疗决定依赖于与感兴趣的结果相关的预治疗特征时,治疗选择偏差发生在非随机研究中。这些特征被称为混杂因素。

由于倾向分数通过平衡治疗组之间的已知混淆来最小化这种偏见,它们变得越来越受欢迎倾向分数被用来比较手术方法4和医疗方案5。最近,我们使用美国军事卫生系统数据存储库(MDR)的数据倾向分析,根据冠状动脉钙6的存在和严重程度,评估他汀类药物在心血管结果初级预防方面的影响。

MDR 的使用频率低于医疗保险和 VA 数据集用于研究目的,包含从为现役军人、退休人员和其他国防部 (DoD) 医疗保健受益人及其家属提供的住院和门诊服务中提供的综合行政和医疗索赔信息。该数据库包括在美国军事治疗设施或向国防部收费的民用设施向全世界提供的服务。该数据库包括自 2001 年 10 月 1 日以来的完整药房数据。实验室数据可从2009年提供,但仅限于军事治疗设施。在MDR中,队列被定义的方法包括使用诊断代码(例如,糖尿病7)或程序代码(例如,关节镜手术8)。或者,外部定义的合格受益人群体(如登记处)可以与 MDR 进行匹配,以获得基线和后续数据9。与医疗保险不同,MDR 包括所有年龄段的患者。它比VA数据库对男性的偏见要小,因为它包括受抚养者。但是,对 MDR 的访问有限。通常,只有作为军事卫生系统成员的调查员才能请求访问,类似于使用 VA 数据库的要求。寻求获取军事卫生系统数据的非政府研究人员必须通过在政府赞助者的监督下通过数据共享协议进行访问。

使用任何管理数据集时,请务必牢记管理编码的局限性和优点。代码的灵敏度和特异性可能因相关诊断而异,无论是初级诊断还是二级诊断,还是住院或门诊档案。急性心肌梗死的住院代码一般准确报告,预测值超过90%,但烟草使用往往被编码为11。这种编码可能对研究结果产生有意义的影响,也可能没有影响。此外,给定条件的几个代码可能存在与问题13中的疾病有不同程度的相关性。调查小组应对《国际疾病分类》、《第九次修订本》、《临床修改(ICD-9-CM)》和/或ICD-10-CM编码手册进行全面的文献检索和审查,以确保研究包括适当的编码。

可采用多种方法提高诊断代码的灵敏度和准确性,以定义合并条件。应列入适当的”回顾”期,以确定基线合并症。回诊期包括入学前提供的住院和门诊服务。一年的周期可能是最佳的14年。此外,需要两个单独的声明,而不是一个单一的索赔可以增加特异性,而补充编码数据与药物数据可以提高灵敏度15。选择对部分数据的手动图表审核可用于验证编码策略的准确性。

一旦为相关人群定义和评估合并症,就可以使用倾向评分来平衡治疗组之间协变量的差异。倾向评分来自患者被分配到基于已知协变量的治疗的概率。考虑这种倾向治疗可以减少协变量对治疗分配的影响,并有助于对治疗结果产生更真实的估计。虽然倾向分数不一定能为多变量模型提供卓越的结果,但它们确实允许评估经过处理和未经处理的群体在应用倾向分数3后是否具有可比性。研究研究者可以分析在倾向匹配或治疗权重(IPTW)的逆概率前后协变量的绝对标准化差异,以确保已知的混杂物在组之间得到平衡。重要的是,未知的混淆可能不平衡,人们应该意识到剩余混淆的可能性。

然而,当正确执行时,倾向分数是一个强大的工具,可以预测和复制随机对照试验的结果16。在现有的倾向评分技术中,匹配和IPTW通常首选17。在IPTW内,患者按其治疗倾向或概率加权。稳定重量通常建议超过原始重量,而修剪重量也可以被认为是18,19,20,21。

一旦研究组是平衡的,他们可能会跟随,直到感兴趣的结果。利用行政数据进行的研究可能对重新接纳率和事件时间分析等结果感兴趣。在有关死亡率的研究中,军事卫生系统数据库包括一个生命状态领域,可以使用国家死亡指数(NDI)22、23进一步扩展。NDI 是一个集中的数据库,由疾病控制中心管理,由州办事处提供死亡记录信息。调查人员可以根据死亡证明要求基本的生命状态和/或具体死因。

以下协议详细介绍了使用 MDR 进行管理数据库研究的过程,该研究增加了来自 NDI 的死亡率信息。它详细介绍了 IPTW 的使用以平衡两个治疗组之间的基线差异,包括 SAS 代码和示例输出。

Protocol

以下议定书遵循我们机构人类伦理委员会的指导方针。 1. 定义队列 使用 1) 注册表或 2) 数据点确定并明确定义计划队列的包含和排除标准,这些数据点可以从 MDR 中提取,例如诊断或程序的管理代码(即,所有患者超过两个心房颤动的门诊诊断或住院诊断)。 如果使用注册表,请包括两个或多个患者标识符,以便与军事卫生系统数据存储库进行精确匹配,例?…

Representative Results

完成 IPTW 后,可以使用 stddiff 宏代码或 asdplot 宏代码分别生成绝对标准化差异的表或图。图 1显示了使用 asdplot 宏在 10,000 名参与者中适当平衡的示例。应用倾向分数后,绝对标准化差异显著缩小。用于绝对标准化差值的截止点有些任意,尽管经常使用 0.1,表示两个组之间的差异可以忽略不计。在小群体中,适当的平衡更难实现。图…

Discussion

当随机对照试验不可行时,使用大型管理数据集的回顾性分析提供了一种高效且经济高效的替代方法。适当的数据集将取决于感兴趣的人口和变量,但 MDR 是一个有吸引力的选项,没有在医疗保险数据中看到的年龄限制。对于任何数据集,熟悉其布局和数据字典非常重要。在此过程中,应小心谨慎,确保捕获完整的数据,并准确匹配和合并数据。

诊断代码应使用现有文献定义…

Disclosures

The authors have nothing to disclose.

Acknowledgements

本出版物中报告的研究得到了国家卫生研究院国家促进转化科学中心的支持,奖励编号为UL1 TR002345。内容完全由作者负责,不一定代表国家卫生研究院的官方观点。

免责声明:此外,本文中表达的观点仅是作者的观点,不应被解释为以任何方式代表美国政府、美国国防部或美国国防部的观点。军队。特定产品或科学仪器的识别被视为科学努力的组成部分,并不构成作者、国防部或任何组成部分机构的认可或默示认可。

Materials

CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

References

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J., et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -. C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. . 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , (2015).
  25. Buck, C. J. . 2018 ICD-10-CM for Hospitals, Professional Edition. , (2018).
  26. Guo, S., Fraser, W. M. . Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Play Video

Cite This Article
Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

View Video