Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index

Joshua  D. Mitchell; Brian  F. Gage; Nicole Fergestrom; Eric Novak; Todd  C. Villines

doi:10.3791/59825

JoVE Journal > Medicine

Please note that all translations are automatically generated. Click here for the English version.

Medicina

Probabilité inverse de pondération du traitement (score de propension) à l'aide du référentiel de données du système de santé militaire et de l'indice national de décès

Published: January 08, 2020

doi:

10.3791/59825

Joshua D. Mitchell, Brian F. Gage, Nicole Fergestrom, Eric Novak, Todd C. Villines

¹Cardiovascular Division,Washington University School of Medicine, ²General Medical Sciences,Washington University School of Medicine, ³Center for Advancing Population Science,Medical College of Wisconsin, ⁴Cardiology Service, Department of Medicine,Walter Reed National Military Medical Center

Summary

Lorsque des essais contrôlés randomisés ne sont pas réalisables, une source complète de données sur les soins de santé comme le Dépôt de données du système de santé militaire constitue une solution de rechange intéressante pour les analyses rétrospectives. L’intégration des données sur la mortalité de l’indice national de mortalité et l’équilibre entre les groupes utilisant la pondération de la propension aident à réduire les biais inhérents aux conceptions rétrospectives.

Abstract

Lorsque des essais contrôlés randomisés ne sont pas réalisables, les études rétrospectives utilisant des données volumineuses constituent une solution de rechange efficace et rentable, bien qu’elles soient à risque de biais de sélection du traitement. Le biais de sélection de traitement se produit dans une étude non randomisée quand la sélection de traitement est basée sur des caractéristiques de pré-traitement qui sont également associées aux résultats. Ces caractéristiques de pré-traitement, ou les confusions, peuvent influencer l’évaluation de l’effet d’un traitement sur les résultats. Les scores de propension minimisent ce biais en équilibrant les confusions connues entre les groupes de traitement. Il existe quelques approches pour effectuer des analyses de score de propension, y compris la stratification par le score de propension, l’appariement de la propension et la probabilité inverse de pondération du traitement (IPTW). Décrit ici est l’utilisation de l’IPTW pour équilibrer les comorbidités de base dans une cohorte de patients au sein du dépôt de données du système de santé militaire des États-Unis (MDR). Le MDR est une source de données relativement optimale, car il fournit une cohorte contenue dans laquelle des renseignements presque complets sur les services aux patients hospitalisés et externes sont disponibles pour les bénéficiaires admissibles. L’utilisation du MDR, complétée par des renseignements tirés de l’indice national de mortalité, est décrite ci-dessous. Sont également fournies des suggestions pour l’utilisation des données administratives. Enfin, le protocole partage un code SAS pour l’utilisation de l’IPTW pour équilibrer les facteurs de confusion connus et tracer la fonction d’incidence cumulative pour le résultat de l’intérêt.

Introduction

Les essais randomisés et contrôlés par placebo sont la conception la plus solide de l’étude pour quantifier l’efficacité du traitement, mais ils ne sont pas toujours réalisables en raison des coûts et des délais ou d’un manque d’équipemententre les groupes de traitement¹. Dans ces cas, une conception de cohorte rétrospective utilisant des données administratives à grande échelle (« big data ») offre souvent une solution de rechange efficace et rentable, bien que l’absence de randomisation introduise un biais de sélection de traitement². Le biais de sélection de traitement se produit dans les études non randomisées quand la décision de traitement dépend des caractéristiques de pré-traitement qui sont associées aux résultats de l’intérêt. Ces caractéristiques sont connues sous le nom de facteurs de confusion.

Parce que les scores de propension minimisent ce biais en équilibrant les confusions connues entre les groupes de traitement, ils sont devenus de plus en plus populaires³. Les scores de propension ont été utilisés pour comparer les approches chirurgicales⁴ et les régimes médicaux⁵. Récemment, nous avons utilisé une analyse de propension des données du dépôt de données du système de santé militaire des États-Unis (MDR) pour évaluer l’effet des statines dans la prévention primaire des résultats cardio-vasculaires basé sur la présence et la sévérité du calcium d’artère coronaire^6.

Le MDR, utilisé moins fréquemment que les ensembles de données Medicare et VA à des fins de recherche, contient des informations complètes sur les réclamations administratives et médicales des services hospitaliers et ambulatoires fournis pour les militaires en service actif, les retraités, et d’autres bénéficiaires du ministère de la Défense (DoD) de soins de santé et leurs personnes à charge. La base de données comprend des services fournis dans le monde entier dans des installations de traitement militaire des États-Unis ou dans des installations civiles facturées au ministère de la Justice. La base de données comprend des données complètes sur les pharmacies depuis le 1er octobre 2001. Les données de laboratoire sont disponibles à partir de 2009, mais ne sont limitées qu’aux installations de traitement militaire. Au sein du MDR, les cohortes ont été définies avec des méthodes, y compris l’utilisation de codes de diagnostic (p. ex., diabète sucré⁷) ou de codes de procédure (p. ex., chirurgie arthroscopique⁸). Alternativement, une cohorte externe de bénéficiaires admissibles, comme un registre, peut être jumelée au MDR pour obtenir des données de base et de suivi⁹. Contrairement à l’assurance-maladie, le MDR comprend les patients de tous âges. Il est également moins biaisé envers les hommes que la base de données VA car il comprend les personnes à charge. L’accès au MDR est toutefois limité. En général, seuls les enquêteurs qui sont membres du Système de santé militaire peuvent demander l’accès, ce qui est analogue aux exigences d’utilisation de la base de données de l’AV. Les chercheurs non gouvernementaux qui cherchent à accéder aux données des systèmes de santé militaires doivent le faire dans le cadre d’une entente de partage de données sous la supervision d’un parrain gouvernemental.

Lors de l’utilisation d’un ensemble de données administratives, il est important de garder à l’esprit les limites ainsi que les forces du codage administratif. La sensibilité et la spécificité du code peuvent varier en fonction du diagnostic connexe, qu’il s’agisse d’un diagnostic primaire ou secondaire, ou qu’il s’agisse d’un dossier d’hospitalisation ou de consultation externe. Les codes d’hospitalisation pour l’infarctus aigu du myocarde sont généralement rapportés avec précision avec des valeurs prédictives positives de plus de 90 %^10,mais l’usage du tabac est souvent sous-codé¹¹. Un tel sous-codage peut ou non avoir un effet significatif sur les résultats d’une étude¹². En outre, plusieurs codes pour une condition donnée peuvent exister avec des niveaux variables de corrélation à la maladie dans la question¹³. Une équipe d’enquête devrait effectuer une recherche et un examen complets de la classification internationale des maladies, de la neuvième révision, de la modification clinique (ICD-9-CM) et/ou des manuels de codage de la CIM-10-CM pour s’assurer que les codes appropriés sont inclus dans l’étude.

Plusieurs méthodes peuvent être employées pour améliorer la sensibilité et l’exactitude des codes diagnostiques pour définir les conditions comorbides. Une période appropriée de « retour en arrière » devrait être incluse pour établir les comorbidités de base. La période de retour comprend les services d’hospitalisation et de consultation externe fournis avant l’entrée à l’étude. Une période d’un an peut être optimale¹⁴. En outre, exiger deux revendications distinctes au lieu d’une seule revendication peut augmenter la spécificité, tandis que la complétance des données de codage avec des données pharmaceutiques peut améliorer la sensibilité¹⁵. Sélectionnez des audits manuels sur une partie des données peuvent être utilisés pour vérifier l’exactitude de la stratégie de codage.

Une fois que les comorbidités ont été définies et évaluées pour la cohorte en question, un score de propension peut être utilisé pour équilibrer les différences dans les covariates entre les groupes de traitement. Le score de propension est dérivé de la probabilité qu’un patient soit affecté à un traitement basé sur des covariables connues. La comptabilisation de ce traitement de propension réduit l’effet que les covariates ont sur l’affectation de traitement et aide à générer une estimation plus vraie de l’effet de traitement sur les résultats. Bien que les scores de propension ne donnent pas nécessairement des résultats supérieurs aux modèles multivariés, ils permettent d’évaluer si les groupes traités et non traités sont comparables après l’application du score de propension³. Les chercheurs de l’étude peuvent analyser les différences standardisées absolues dans les covariates avant et après l’appariement de la propension ou la probabilité inverse de pondération du traitement (IPTW) pour s’assurer que les confusions connues ont été équilibrées entre les groupes. Fait important, les confusions inconnues peuvent ne pas être équilibrées, et il faut être conscient du potentiel de confusion résiduelle.

Lorsqu’ils sont exécutés correctement, cependant, les scores de propension sont un outil puissant qui peut prédire et reproduire les résultats des essais contrôlés randomisés¹⁶. Parmi les techniques de score de propension disponibles, l’appariement et l’IPTW sont généralement préférés¹⁷. Au sein de l’IPTW, les patients sont pondérés en fonction de leur propension ou de leur probabilité de traitement. Les poids stabilisateurs sont généralement recommandés sur les poids bruts, tandis que l’élagage des poids peut également être considéré comme¹⁸^,¹⁹^,²⁰^,²¹.

Une fois que les groupes d’étude sont équilibrés, ils peuvent être suivis jusqu’au résultat de l’intérêt. Les études utilisant des données administratives peuvent être intéressées par des résultats tels que les taux de réadmission et les analyses de temps à événement. Dans les études portant sur la mortalité, le Dépôt de données du système de santé militaire comprend un champ pour l’état vital qui peut être encore augmenté en utilisant l’indice national de mortalité (NDI)²²^,²³. Le NDI est une base de données centralisée des informations sur les dossiers de décès des bureaux de l’État qui est gérée par le Center for Disease Control. Les enquêteurs peuvent demander l’état vital de base et/ou la cause précise du décès en se fondant sur le certificat de décès.

Le protocole suivant détaille le processus de réalisation d’une étude de base de données administrative à l’aide du MDR, complété par des informations sur la mortalité de l’IND. Il détaille l’utilisation de l’IPTW pour équilibrer les différences de base entre deux groupes de traitement, y compris le code SAS et la sortie de l’exemple.

Protocol

Le protocole suivant suit les lignes directrices de nos comités institutionnels d’éthique humaine. 1. Définir la cohorte Déterminer et définir clairement les critères d’inclusion et d’exclusion de la cohorte prévue à l’aide d’un registre ou de 2) points de données qui peuvent être extraits du MDR, comme les codes administratifs pour les diagnostics ou les procédures (c.-à-d. tous les patients ayant plus de deux diagnostics ambulatoires ou un diagnostic de fibrillation aur…

Representative Results

À la fin de l’IPTW, des tableaux ou des parcelles des différences standardisées absolues peuvent être générés à l’aide du code macro stddiff ou du code macro asdplot, respectivement. La figure 1 montre un exemple d’équilibrage approprié dans une grande cohorte de 10 000 participants utilisant la macro asdplot. Après l’application du score de propension, les différences standardisées absolues ont été réduites de manière significative. Le seuil…

Discussion

Les analyses rétrospectives à l’aide de grands ensembles de données administratives offrent une solution de rechange efficace et rentable lorsque des essais contrôlés randomisés ne sont pas réalisables. L’ensemble de données approprié dépendra de la population et des variables d’intérêt, mais le MDR est une option attrayante qui n’a pas les restrictions d’âge vu avec les données de l’assurance-maladie. Avec n’importe quel ensemble de données, il est important d’être intimement familier avec sa mise en pag…

Declarações

The authors have nothing to disclose.

Acknowledgements

La recherche rapportée dans cette publication a été soutenue par le National Center for Advancing Translational Sciences des National Institutes of Health sous le numéro de prix UL1 TR002345. Le contenu est uniquement de la responsabilité des auteurs et ne représente pas nécessairement les vues officielles des National Institutes of Health.

Avertissement: En outre, les opinions exprimées dans cet article sont celles de l’auteur seulement et ne doivent pas être interprétées comme représentant en aucune façon celles du gouvernement des États-Unis, du Département de la Défense des États-Unis (DoD) ou du Département des États-Unis du Armée. L’identification de produits spécifiques ou d’instruments scientifiques est considérée comme faisant partie intégrante de l’effort scientifique et ne constitue pas une approbation ou une approbation implicite de la part de l’auteur, du DoD, ou d’un organisme constituant.

Materials

CD Burner (for NDI Request)
Computer
Putty.exe	Putty.org
SAS 9.4	SAS Institute Cary, NC
WinSCP or other FTP software	https://winscp.net/eng/index.php

Referências

Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
Williams, R. J., et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
Huo, J., Yang, M., Tina Shih, Y. -. C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , (2017).
Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
Buck, C. J. . 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , (2015).
Buck, C. J. . 2018 ICD-10-CM for Hospitals, Professional Edition. , (2018).
Guo, S., Fraser, W. M. . Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , (2015).
Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Play Video

PDF

DOI

DOWNLOAD MATERIALS LIST

Citar este artigo

Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

Probabilité inverse de pondération du traitement (score de propension) à l'aide du référentiel de données du système de santé militaire et de l'indice national de décès

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Declarações

Acknowledgements

Materials

Referências

Tags

Play Video

Citar este artigo

View Video

Probabilité inverse de pondération du traitement (score de propension) à l'aide du référentiel de données du système de santé militaire et de l'indice national de décès

Summary

Abstract

Introduction

Protocol

Representative Results

Discussion

Declarações

Acknowledgements

Materials

Referências

Tags

Play Video

Citar este artigo

View Video

✖

To prove you're not a robot, please enter the text in the image below