Summary

Probabilità inversa di ponderazione del trattamento (Punteggio di propensione) utilizzando l'archivio dati del sistema sanitario militare e l'indice nazionale di morte

Published: January 08, 2020
doi:

Summary

Quando gli studi controllati randomizzati non sono fattibili, una fonte completa di dati sanitari come il Military Health System Data Repository fornisce un’alternativa interessante per le analisi retrospettive. L’incorporazione dei dati sulla mortalità derivanti dall’indice nazionale di mortalità e il bilanciamento delle differenze tra i gruppi che utilizzano la ponderazione della propensione aiuta a ridurre i pregiudizi inerenti ai progetti retrospettivi.

Abstract

Quando gli studi controllati randomizzati non sono fattibili, gli studi retrospettivi che utilizzano i big data forniscono un’alternativa efficiente ed economica, anche se sono a rischio di distorsione della selezione del trattamento. La distorsione della selezione del trattamento si verifica in uno studio non randomizzato quando la selezione del trattamento si basa su caratteristiche pre-trattamento che sono associate anche al risultato. Queste caratteristiche di pre-trattamento, o confondenti, possono influenzare la valutazione dell’effetto di un trattamento sul risultato. I punteggi di propensione riducono al minimo questa distorsione bilanciando i confondenti noti tra i gruppi di trattamento. Esistono alcuni approcci per eseguire analisi del punteggio di propensione, tra cui la stratificazione in base al punteggio di propensione, alla corrispondenza della propensione e alla probabilità inversa di ponderazione del trattamento (IPTW). Descritto qui è l’uso di IPTW per bilanciare le comorbilità di base in una coorte di pazienti all’interno del repository di dati del sistema sanitario militare degli Stati Uniti (MDR). L’MDR è una fonte di dati relativamente ottimale, in quanto fornisce una coorte contenuta in cui sono disponibili informazioni quasi complete sui servizi ospedalieri e ambulatoriali per i beneficiari idonei. Di seguito è descritto l’uso della MDR integrato con le informazioni dell’indice nazionale di mortalità per fornire dati solidi sulla mortalità. Sono inoltre forniti suggerimenti per l’utilizzo di dati amministrativi. Infine, il protocollo condivide un codice SAS per l’utilizzo di IPTW per bilanciare i confondenti noti e tracciare la funzione di incidenza cumulativa per il risultato dell’interesse.

Introduction

Randomizzati, studi controllati con placebo sono il più forte disegno di studio per quantificare l’efficacia del trattamento, ma non sono sempre fattibili a causa di requisiti di costi e tempi o una mancanza di equipoise tra i gruppi di trattamento1. In questi casi, un progetto di coorte retrospettivo che utilizza dati amministrativi su larga scala (“big data”) spesso fornisce un’alternativa efficiente ed economica, anche se la mancanza di randomizzazione introduce la distorsione della selezione del trattamento2. La distorsione della selezione del trattamento si verifica negli studi non randomizzati quando la decisione di trattamento dipende dalle caratteristiche pre-trattamento associate all’esito di interesse. Queste caratteristiche sono note come fattori di confusione.

Poiché i punteggi di propensione riducono al minimo questa distorsione bilanciando i confondenti noti tra i gruppi di trattamento, sono diventati sempre più popolari3. I punteggi di propensione sono stati utilizzati per confrontare gli approcci chirurgici4 e regimi medici5. Recentemente, abbiamo utilizzato un’analisi della propensione dei dati dal Repository dati del sistema sanitario militare degli Stati Uniti (MDR) per valutare l’effetto delle statine nella prevenzione primaria degli esiti cardiovascolari in base alla presenza e alla gravità del calcio coronario6.

L’MDR, utilizzato meno frequentemente dei set di dati Medicare e VA a scopo di ricerca, contiene informazioni complete sulle indicazioni amministrative e mediche dei servizi ospedalieri e ambulatoriali forniti per i beneficiari sanitari del Dipartimento della Difesa (DoD) in servizio attivo e i loro familiari a carico. Il database include servizi forniti in tutto il mondo presso strutture militari statunitensi o presso strutture civili fatturate al DoD. Il database include i dati completi della farmacia dal 1 ottobre 2001. I dati di laboratorio sono disponibili a partire dal 2009, ma sono limitati solo alle strutture di trattamento militare. All’interno della MDR, le coorti sono state definite con metodi come l’uso di codici diagnostici (ad esempio, diabete mellito7) o codici di procedura (ad esempio, chirurgia artroscopica8). In alternativa, una coorte definita esternamente di beneficiari idonei, ad esempio un registro, può essere abbinata all’MDR per ottenere dati di base e di follow-up9. A differenza di Medicare, l’MDR include pazienti di tutte le età. È anche meno di parte nei confronti dei maschi rispetto al database VA poiché include i dipendenti. L’accesso all’MDR è tuttavia limitato. In generale, solo gli investigatori che sono membri del sistema sanitario militare possono richiedere l’accesso, analogamente ai requisiti per l’uso del database VA. I ricercatori non governativi che chiedono l’accesso ai dati dei sistemi sanitari militari devono farlo attraverso un accordo di condivisione dei dati sotto la supervisione di uno sponsor governativo.

Quando si utilizza un set di dati amministrativi, è importante tenere a mente le limitazioni e i punti di forza della codifica amministrativa. La sensibilità e la specificità del codice possono variare in base alla diagnosi correlata, sia che si tratti di una diagnosi primaria o secondaria, o se si tratta di un file ospedaliero o ambulatoriale. I codici ospedalieri per l’infarto miocardico acuto sono generalmente riportati con precisione con valori predittivi positivi superiori al 90%10, ma l’uso del tabacco è spesso sottocodificato11. Tale sottocodifica può o non può avere un effetto significativo sui risultati di uno studio12. Inoltre, possono esistere diversi codici per una determinata condizione con diversi livelli di correlazione alla malattia nella domanda13. Un team investigativo deve eseguire una ricerca e una revisione completa della letteratura completa della classificazione internazionale della malattia, della nona revisione, della modifica clinica (ICD-9-CM) e/o dei manuali di codifica ICD-10-CM per garantire che i codici appropriati siano inclusi nello studio.

Diversi metodi possono essere impiegati per migliorare la sensibilità e l’accuratezza dei codici diagnostici per definire le condizioni comorbid. Occorre includere un periodo adeguato di “look-back” per stabilire le comorbilità di base. Il periodo di riflessione comprende i servizi ospedalieri e ambulatoriali forniti prima dell’ingresso nello studio. Un periodo di un anno può essere ottimale14. Inoltre, che richiedono due rivendicazioni separate invece di una singola affermazione può aumentare la specificità, mentre il completamento dei dati di codifica con dati farmaceutici può migliorare la sensibilità15. Selezionare i controlli grafici manuali su una parte dei dati può essere utilizzato per verificare l’accuratezza della strategia di codifica.

Una volta definite e valutate le comorbilità per la coorte in questione, può essere utilizzato un punteggio di propensione per bilanciare le differenze nelle covarie tra i gruppi di trattamento. Il punteggio di propensione deriva dalla probabilità che un paziente sia assegnato a un trattamento basato su covari noti. La contabilità di questo trattamento di propensione riduce l’effetto che i covariati hanno sull’assegnazione del trattamento e aiuta a generare una stima più fedele dell’effetto del trattamento sul risultato. Sebbene i punteggi di propensione non forniscano necessariamente risultati superiori ai modelli multivariati, consentono di valutare se i gruppi trattati e non trattati sono comparabili dopo aver applicato il punteggio di propensione3. I ricercatori di studio possono analizzare le differenze standardizzate assolute nei covariati prima e dopo la corrispondenza della propensione o della probabilità inversa di ponderazione del trattamento (IPTW) per garantire che i confondenti noti siano stati bilanciati tra i gruppi. È importante sottolineare che i confondenti sconosciuti potrebbero non essere bilanciati e si dovrebbe essere consapevoli del potenziale conforto residuo.

Se eseguiti correttamente, però, i punteggi di propensione sono un potente strumento in grado di prevedere e replicare i risultati di prove controllate randomizzate16. Delle tecniche di propensione-punteggio disponibili, corrispondenza e IPTW sono generalmente preferiti17. All’interno di IPTW, i pazienti sono ponderati in base alla loro propensione o probabilità di trattamento. I pesi stabilizzanti sono generalmente raccomandati rispetto ai pesi grezzi, mentre il taglio dei pesi può anche essere considerato18,19,20,21.

Una volta che i gruppi di studio sono equilibrati, possono essere seguiti fino all’esito di interesse. Gli studi che utilizzano dati amministrativi possono essere interessati a risultati quali tassi di riammissione e analisi del time-to-event. Negli studi interessati alla mortalità, il Military Health System Data Repository include un campo per lo status vitale che può essere ulteriormente aumentato utilizzando l’indice nazionale di mortalità (NDI)22,23. L’NDI è un database centralizzato di informazioni di record di morte dagli uffici statali gestito dal Center for Disease Control. Gli investigatori possono richiedere lo status vitale di base e/o la causa specifica del decesso in base al certificato di morte.

Il protocollo seguente descrive in dettaglio il processo di conduzione di uno studio amministrativo sul database utilizzando l’MDR aumentata con informazioni sulla mortalità da parte dell’NDI. Descrive in dettaglio l’uso di IPTW per bilanciare le differenze di base tra due gruppi di trattamento, tra cui il codice SAS e l’output di esempio.

Protocol

Il seguente protocollo segue le linee guida dei nostri comitati istituzionali per l’etica umana. 1. Definizione della coorte Determinare e definire chiaramente i criteri di inclusione ed esclusione della coorte pianificata utilizzando 1) un registro o 2) punti dati che possono essere estratti dall’MDR, come i codici amministrativi per le diagnosi o le procedure (cioè tutti i pazienti con più di due diagnosi ambulatoriali o una diagnosi ambulatoriale di fibrillazione atriale). <…

Representative Results

Al termine di IPTW, tabelle o grafici delle differenze standardizzate assolute possono essere generate utilizzando rispettivamente il codice macro stddiff o il codice macro asdplot. Nella figura 1 viene illustrato un esempio di bilanciamento appropriato in una coorte di grandi dimensioni composta da 10.000 partecipanti che utilizzano la macro asdplot. Dopo l’applicazione del punteggio di propensione, le differenze standardizzate assolute sono state ridotte in…

Discussion

Le analisi retrospettive che utilizzano set di dati amministrativi di grandi dimensioni forniscono un’alternativa efficiente ed economica quando le sperimentazioni controllate randomizzate non sono fattibili. Il set di dati appropriato dipenderà dalla popolazione e dalle variabili di interesse, ma l’MDR è un’opzione interessante che non prevede le restrizioni di età osservate con i dati Medicare. Con qualsiasi set di dati, è importante avere una profonda familiarità con il layout e il dizionario dei dati. È necessa…

Divulgations

The authors have nothing to disclose.

Acknowledgements

La ricerca riportata in questa pubblicazione è stata supportata dal National Center for Advancing Translational Sciences dei National Institutes of Health sotto il Award Number UL1 TR002345. Il contenuto è di esclusiva responsabilità degli autori e non rappresenta necessariamente le opinioni ufficiali dei National Institutes of Health.

Disclaimer: Inoltre, le opinioni espresse in questo articolo sono quelle solo dell’autore e non devono essere interpretate per rappresentare in alcun modo quelle del governo degli Stati Uniti, del Dipartimento della Difesa degli Stati Uniti (DoD), o del Dipartimento degli Stati Uniti del Esercito. L’identificazione di prodotti specifici o strumentazione scientifica è considerata parte integrante dello sforzo scientifico e non costituisce l’approvazione o l’approvazione implicita da parte dell’autore, del Dad o di qualsiasi agenzia di componenti.

Materials

CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

References

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J., et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -. C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. . 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , (2015).
  25. Buck, C. J. . 2018 ICD-10-CM for Hospitals, Professional Edition. , (2018).
  26. Guo, S., Fraser, W. M. . Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Play Video

Citer Cet Article
Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

View Video