Summary

Inverse waarschijnlijkheid van weging van de behandeling (propensity Score) met behulp van de militaire gezondheid systeem data repository en National Death index

Published: January 08, 2020
doi:

Summary

Wanneer gerandomiseerde gecontroleerde proeven niet haalbaar zijn, een uitgebreide gezondheidszorg gegevensbron zoals de militaire gezondheid systeem data repository biedt een aantrekkelijk alternatief voor retrospectieve analyses. Het opnemen van sterfte gegevens uit de nationale overlijdens index en het balanceren van verschillen tussen groepen die gebruik maken van de neiging om de vooroordelen te verminderen, inherent aan retrospectieve ontwerpen.

Abstract

Wanneer gerandomiseerde gecontroleerde proeven zijn niet haalbaar, retrospectieve studies met behulp van Big data bieden een efficiënt en kosteneffectief alternatief, hoewel ze in gevaar voor behandeling selectie bias. Behandeling selectie bias treedt op in een niet-gerandomiseerde studie wanneer de behandeling selectie is gebaseerd op voor behandeling kenmerken die ook worden geassocieerd met de uitkomst. Deze voorbehandelings kenmerken, of medeoprichters, kunnen de evaluatie van het effect van een behandeling op de uitkomst beïnvloeden. Propensity scores minimaliseren deze bias door het balanceren van de bekende medeoprichters tussen behandelingsgroepen. Er zijn een aantal benaderingen voor het uitvoeren van neiging score analyses, met inbegrip van stratificatie door de neiging score, neiging matching, en inverse waarschijnlijkheid van behandeling weging (iptw). Hier beschreven is het gebruik van IPTW voor het balanceren van Baseline comorbiditeiten in een cohort van patiënten binnen de Amerikaanse militaire gezondheidszorgsysteem data repository (MDR). De MDR is een relatief optimale gegevensbron, omdat het een ingesloten cohort biedt waarin bijna volledige informatie over zieken-en poliklinische diensten beschikbaar is voor in aanmerking komende begunstigden. Hieronder wordt het gebruik van de MDR aangevuld met informatie uit de National Death index om robuuste sterftecijfers te verstrekken. Ook zijn er suggesties voor het gebruik van administratieve gegevens. Ten slotte deelt het protocol een SAS-code voor het gebruik van IPTW om bekende medeoprichters in evenwicht te brengen en de cumulatieve incidentie functie voor het resultaat van de rente te tekenen.

Introduction

Gerandomiseerde, placebo-gecontroleerde proeven zijn de sterkste studie ontwerp te kwantificeren werkzaamheid van de behandeling, maar ze zijn niet altijd haalbaar als gevolg van kosten en tijd eisen of een gebrek aan Equipoise tussen behandelingsgroepen1. In deze gevallen biedt een retrospectief cohort ontwerp met grootschalige administratieve gegevens (“Big Data”) vaak een efficiënt en kosteneffectief alternatief, hoewel het gebrek aan randomisatie de behandelings selectie bias2introduceert. Behandeling selectie bias treedt op in niet-gerandomiseerde studies wanneer het behandelings besluit afhankelijk is van voor behandeling kenmerken die zijn gekoppeld aan de uitkomst van de rente. Deze kenmerken staan bekend als verstorende factoren.

Omdat neiging scores deze bias minimaliseren door het balanceren van de bekende medeoprichters tussen behandelingsgroepen, zijn ze steeds populairder geworden3. Propensity scores zijn gebruikt om te vergelijken chirurgische benaderingen4 en medische regimes5. Onlangs hebben we een neiging analyse van gegevens van de Verenigde Staten militaire Health System data repository (MDR) gebruikt om het effect van statines in primaire preventie van cardiovasculaire uitkomsten te beoordelen op basis van de aanwezigheid en ernst van coronaire arteriële calcium6.

De MDR, minder frequent gebruikt dan de datasets van Medicare en VA voor onderzoeksdoeleinden, bevat uitgebreide administratieve en medische claims informatie van zieken-en ambulante diensten die worden aangeboden voor actieve militaire, gepensioneerden en andere ministerie van defensie (DoD) zorg begunstigden en hun afhankelijke personen. De database omvat diensten die wereldwijd worden geleverd bij Amerikaanse militaire behandelingsinstallaties of bij civiele faciliteiten die aan het DoD worden gefactureerd. De database bevat volledige apotheek gegevens sinds 1 oktober 2001. Laboratoriumgegevens zijn beschikbaar vanaf 2009, maar zijn slechts beperkt tot militaire behandelingsfaciliteiten. Binnen de MDR zijn cohorten gedefinieerd met methoden zoals het gebruik van diagnosecodes (bijv. diabetes mellitus7) of procedure codes (bijv. arthroscopische chirurgie8). Als alternatief kan een extern gedefinieerd cohort van in aanmerking komende begunstigden, zoals een register, worden gekoppeld aan de MDR om basis-en opvolgings gegevens te verkrijgen9. In tegenstelling tot Medicare omvat de MDR patiënten van alle leeftijden. Het is ook minder bevooroordeeld ten opzichte van mannetjes dan de VA-database, omdat het afhankelijke personen bevat. De toegang tot de MDR is echter beperkt. Over het algemeen kunnen alleen onderzoekers die lid zijn van het militaire gezondheidszorgstelsel toegang vragen, analoog aan de vereisten voor het gebruik van de VA-database. Niet-overheids onderzoekers die toegang willen tot de gegevens van de militaire gezondheidsstelsels moeten dit doen via een overeenkomst voor het delen van gegevens onder toezicht van een regerings sponsor.

Wanneer u een administratieve gegevensset gebruikt, is het belangrijk om rekening te houden met de beperkingen en sterke punten van de administratieve codering. De gevoeligheid en specificiteit van de code kan variëren op basis van de gerelateerde diagnose, of het nu een primaire of secundaire diagnose is, of of het een intramurale of poliklinisch bestand is. Inpatient codes voor acuut myocardinfarct worden over het algemeen nauwkeurig gerapporteerd met positieve voorspellende waarden van meer dan 90%10, maar het gebruik van tabak is vaak ondergecodeerd11. Dergelijke undercoding kan al dan niet een zinvol effect hebben op de resultaten van een studie12. Bovendien kunnen verschillende codes voor een bepaalde aandoening bestaan met verschillende correlatie niveaus met de ziekte in kwestie13. Een onderzoeksteam moet een uitgebreid onderzoek naar de literatuur en een overzicht van de internationale classificatie van ziekte, negende revisie, klinische modificatie (ICD-9-CM) en/of ICD-10-CM Codeer handleidingen uitvoeren om ervoor te zorgen dat de juiste codes in het onderzoek worden opgenomen.

Verschillende methoden kunnen worden gebruikt om de gevoeligheid en nauwkeurigheid van de diagnostische codes voor het definiëren van comorbide voorwaarden te verbeteren. Er moet een passende “Terugblik” periode worden opgenomen om de comorbiditeiten op baseline vast te stellen. De terugblik periode omvat de klinische en ambulante diensten die voorafgaand aan de studie binnenkomen. Een periode van één jaar kan een optimale14zijn. Bovendien, vereisen twee afzonderlijke claims in plaats van een enkele claim kan de specificiteit te verhogen, terwijl het aanvullen van codering gegevens met farmaceutische gegevens gevoeligheid kan verbeteren15. Selecteer Handmatige grafiek audits op een deel van de gegevens kunnen worden gebruikt om de nauwkeurigheid van de coderings strategie te controleren.

Zodra de comorbiditeiten zijn gedefinieerd en beoordeeld voor de betrokken cohort, kan een neiging tot het beoordelen van de verschillen in covariaten tussen behandelingsgroepen worden gebruikt. De neiging score is afgeleid van de waarschijnlijkheid dat een patiënt wordt toegewezen aan een behandeling op basis van bekende covariaten. De administratieve verwerking van deze neiging vermindert het effect dat de covarianten hebben op de behandeling toewijzing en helpt bij het genereren van een waarheidsgetrouwe schatting van het behandelingseffect op de uitkomst. Hoewel neiging scores niet noodzakelijkerwijs superieure resultaten bieden aan multivariate modellen, kunnen ze wel beoordelen of de behandelde en onbehandelde groepen vergelijkbaar zijn na het aanbrengen van de neiging score3. Onderzoeksonderzoekers kunnen de absolute gestandaardiseerde verschillen in covariaten voor en na de aanpassing van de neiging of de inverse waarschijnlijkheid van behandelings weging (iptw) analyseren om ervoor te zorgen dat bekende medeoprichters evenwichtig zijn verdeeld tussen groepen. Belangrijk is dat onbekende medeoprichters niet in evenwicht zijn, en men moet zich bewust zijn van het potentieel voor residuele verstoring.

Wanneer goed uitgevoerd, hoewel, neiging scores zijn een krachtig hulpmiddel dat kan voorspellen en repliceren resultaten van gerandomiseerde gecontroleerde proeven16. Van de beschikbare propensity-Score technieken, matching en IPTW hebben over het algemeen de voorkeur17. Binnen IPTW worden patiënten gewogen aan de hand van hun neiging of waarschijnlijkheid van behandeling. Stabiliserende gewichten worden over het algemeen aanbevolen over ruwe gewichten, terwijl het trimmen van de gewichten ook kan worden beschouwd als18,19,20,21.

Zodra studiegroepen evenwichtig zijn, kunnen ze worden gevolgd tot het resultaat van de interesse. Studies met administratieve gegevens kunnen geïnteresseerd zijn in uitkomsten zoals overname percentages en time-to-Event analyses. In studies die geïnteresseerd zijn in het sterfelijk leven bevat de data repository van het militaire gezondheidszorgsysteem een veld voor vitale status dat verder kan worden aangevuld met behulp van de National Death index (NDI)22,23. De NDI is een gecentraliseerde database van Death recordinformatie van staats kantoren die wordt beheerd door het centrum voor Ziektecontrole. Onderzoekers kunnen de fundamentele vitale status en/of specifieke doodsoorzaak opvragen op basis van het overlijdensattest.

In het volgende protocol wordt het proces van het uitvoeren van een administratieve database-studie met de MDR aangevuld met mortaliteits informatie van de NDI. Het maakt gebruik van IPTW voor het balanceren van basislijn verschillen tussen twee behandelgroepen, waaronder SAS-code en voorbeelduitvoer.

Protocol

Het volgende protocol volgt de richtsnoeren van onze institutionele commissies voor menselijke ethiek. 1. het definiëren van de cohort Bepaal de inclusie-en uitsluitingscriteria van het geplande cohort met behulp van 1) een register of 2) gegevenspunten die kunnen worden geëxtraheerd uit de MDR, zoals administratieve codes voor diagnoses of procedures (d.w.z. alle patiënten met meer dan twee patiënt diagnoses of een intramurale diagnose van boezemfibrilleren). Als u een r…

Representative Results

Na voltooiing van IPTW kunnen tabellen of plots van de absolute gestandaardiseerde verschillen worden gegenereerd met respectievelijk de macrocode stddiff of de macrocode asdplot. Afbeelding 1 toont een voorbeeld van een passende afweging in een grote cohort van 10.000 deelnemers die de macro asdplot gebruiken. Na toepassing van de neiging score werden de absolute gestandaardiseerde verschillen significant verlaagd. De cutoff gebruikt voor het absolute gestan…

Discussion

Retrospectieve analyses met behulp van grote administratieve gegevenssets bieden een efficiënt en kosteneffectief alternatief wanneer gerandomiseerde gecontroleerde proeven niet haalbaar zijn. De juiste gegevensset is afhankelijk van de populatie en de variabelen die van belang zijn, maar de MDR is een aantrekkelijke optie die niet de leeftijdsbeperkingen heeft die worden gezien met Medicare-gegevens. Met elke gegevensset is het belangrijk om nauw vertrouwd te zijn met de lay-out en data dictionary. Zorg moet worden gen…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Het onderzoek dat in deze uitgave werd gerapporteerd, werd gesteund door het nationaal centrum voor de bevordering van translationele Wetenschappen van de National Institutes of Health onder het Awardnummer UL1 TR002345. De inhoud is uitsluitend de verantwoordelijkheid van de auteurs en vertegenwoordigt niet noodzakelijkerwijs de officiële standpunten van de National Institutes of Health.

Disclaimer: Bovendien zijn de in dit artikel uitgedrukte standpunten alleen die van de auteur en mogen deze niet worden opgevat als representeren op enigerlei wijze die van de regering van de Verenigde Staten, het ministerie van defensie van de Verenigde Staten (DoD) of het Amerikaanse ministerie van de Leger. De identificatie van specifieke producten of wetenschappelijke instrumenten wordt beschouwd als een integraal onderdeel van het wetenschappelijk streven en vormt geen goedkeuring of impliciete goedkeuring van de auteur, het DoD of een andere componentinstantie.

Materials

CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

References

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J., et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -. C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. . 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , (2015).
  25. Buck, C. J. . 2018 ICD-10-CM for Hospitals, Professional Edition. , (2018).
  26. Guo, S., Fraser, W. M. . Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Play Video

Cite This Article
Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

View Video