Summary

Inverse Wahrscheinlichkeit der Behandlungsgewichtung (Propensity Score) mit dem Military Health System Data Repository und dem National Death Index

Published: January 08, 2020
doi:

Summary

Wenn randomisierte kontrollierte Studien nicht möglich sind, bietet eine umfassende Datenquelle im Gesundheitswesen wie das Military Health System Data Repository eine attraktive Alternative für retrospektive Analysen. Die Einbeziehung der Sterblichkeitsdaten aus dem nationalen Sterbeindex und das Ausbalancieren von Unterschieden zwischen Gruppen, die die Neigungsgewichtung verwenden, trägt dazu bei, die Vorurteile, die retrospektiven Entwürfen innewohnen, zu verringern.

Abstract

Wenn randomisierte kontrollierte Studien nicht durchführbar sind, bieten retrospektive Studien mit Big Data eine effiziente und kostengünstige Alternative, obwohl sie für die Behandlungsauswahl gefährdet sind. Die Voreingenommenheit bei der Behandlungsauswahl tritt in einer nicht randomisierten Studie auf, wenn die Behandlungsauswahl auf Vorbehandlungsmerkmalen basiert, die ebenfalls mit dem Ergebnis verbunden sind. Diese Vorbehandlungsmerkmale oder Störfaktoren können die Bewertung der Wirkung einer Behandlung auf das Ergebnis beeinflussen. Propensity-Scores minimieren diese Verzerrung, indem sie die bekannten Störfaktoren zwischen den Behandlungsgruppen ausgleichen. Es gibt einige Ansätze für die Durchführung von Neigungs-Score-Analysen, einschließlich der Schichtung nach der Neigungsnote, dem Neigungsabgleich und der umgekehrten Wahrscheinlichkeit der Behandlungsgewichtung (IPTW). Hier wird die Verwendung von IPTW beschrieben, um basisbezogene Komorbiditäten in einer Kohorte von Patienten innerhalb des US Military Health System Data Repository (MDR) auszugleichen. Der MDR ist eine relativ optimale Datenquelle, da er eine enthaltene Kohorte bietet, in der für förderfähige Begünstigte nahezu vollständige Informationen über stationäre und ambulante Leistungen zur Verfügung stehen. Im Folgenden wird die Verwendung des MDR, ergänzt durch Informationen aus dem nationalen Sterbeindex, um robuste Mortalitätsdaten liefern. Außerdem werden Vorschläge für die Verwendung von Verwaltungsdaten bereitgestellt. Schließlich teilt das Protokoll einen SAS-Code für die Verwendung von IPTW, um bekannte Störfaktoren auszugleichen und die kumulative Inzidenzfunktion für das Ergebnis von Interesse darzustellen.

Introduction

Randomisierte, Placebo-kontrollierte Studien sind das stärkste Studiendesign, um die Wirksamkeit der Behandlung zu quantifizieren, aber sie sind nicht immer möglich, aufgrund von Kosten- und Zeitanforderungen oder einem Mangel an Ausrüstung zwischen den Behandlungsgruppen1. In diesen Fällen bietet ein retrospektives Kohortendesign, bei dem umfangreiche Verwaltungsdaten (“Big Data”) verwendet werden, häufig eine effiziente und kostengünstige Alternative, obwohl der Mangel an Randomisierung dieVerzerrungder Behandlungsauswahl 2 einführt. Die Voreingenommenheit bei der Behandlungsauswahl tritt in nicht randomisierten Studien auf, wenn die Behandlungsentscheidung von Vorbehandlungsmerkmalen abhängt, die mit dem Ergebnis von Interesse verbunden sind. Diese Eigenschaften werden als verwirrende Faktoren bezeichnet.

Da Neigungswerte diese Verzerrung minimieren, indem sie die bekannten Störfaktoren zwischen den Behandlungsgruppen ausbalancieren, sind sie immer beliebtergeworden 3. Propensity Scores wurden verwendet, um chirurgische Ansätze4 und medizinische Therapien5zu vergleichen. Kürzlich haben wir eine Neigungsanalyse von Daten aus dem United States Military Health System Data Repository (MDR) verwendet, um die Wirkung von Statinen bei der primären Prävention kardiovaskulärer Ergebnisse basierend auf dem Vorhandensein und der Schwere des koronaren Kalziums6zu bewerten.

Der MDR, der weniger häufig als die Medicare- und VA-Datensätze für Forschungszwecke genutzt wird, enthält umfassende administrative und medizinische Schadeninformationen von stationären und ambulanten Diensten, die für aktive Militärs, Rentner und andere Begünstigte des Verteidigungsministeriums (DoD) und deren Angehörige bereitgestellt werden. Die Datenbank umfasst Dienstleistungen, die weltweit in US-Militärbehandlungseinrichtungen oder in zivilen Einrichtungen erbracht werden, die dem DoD in Rechnung gestellt werden. Die Datenbank enthält vollständige Apothekendaten seit dem 1. Oktober 2001. Labordaten liegen ab 2009 vor, sind aber nur auf militärische Behandlungseinrichtungen beschränkt. Innerhalb des MDR wurden Kohorten mit Methoden definiert, einschließlich der Verwendung von Diagnosecodes (z.B. Diabetes mellitus7) oder Verfahrenscodes (z.B. arthroskopische Chirurgie8). Alternativ kann eine extern definierte Kohorte förderfähiger Begünstigter, z. B. ein Register, mit dem MDR abgeglichen werden, um Basis- und Folgedaten zu erhalten9. Im Gegensatz zu Medicare umfasst der MDR Patienten jeden Alters. Es ist auch weniger voreingenommen gegenüber Männern als die VA-Datenbank, da es abhängige enthält. Der Zugang zum MDR ist jedoch begrenzt. Im Allgemeinen können nur Ermittler, die Mitglieder des Militärischen Gesundheitssystems sind, Den Zugriff anfordern, analog zu den Anforderungen für die Nutzung der VA-Datenbank. Nichtstaatliche Forscher, die Zugang zu den Daten von Military Health Systems suchen, müssen dies durch eine Vereinbarung über den Datenaustausch unter der Aufsicht eines staatlichen Sponsors tun.

Bei der Verwendung von administrativen Datensätzen ist es wichtig, die Einschränkungen und Stärken der administrativen Codierung zu berücksichtigen. Die Empfindlichkeit und Spezifität des Codes kann je nach der zugehörigen Diagnose variieren, ob es sich um eine primäre oder sekundäre Diagnose handelt oder ob es sich um eine stationäre oder ambulante Datei handelt. Stationäre Codes für akuten Myokardinfarkt werden in der Regel genau mit positiven Vorhersagewerten über 90%10gemeldet, aber Tabakkonsum ist oft untercodiert11. Eine solche Unterkodierung kann eine sinnvolle Wirkung auf die Ergebnisse einer Studie haben12. Darüber hinaus können mehrere Codes für eine bestimmte Bedingung mit unterschiedlichen Korrelationen mit der Krankheit in Frage13existieren. Ein Untersuchungsteam sollte eine umfassende Literaturrecherche und Überprüfung der Internationalen Klassifikation von Krankheiten, der neunten Revision, der klinischen Modifikation (ICD-9-CM) und/oder icD-10-CM-Codierungshandbücher durchführen, um sicherzustellen, dass die entsprechenden Codes in die Studie einbezogen werden.

Es können mehrere Methoden eingesetzt werden, um die Empfindlichkeit und Genauigkeit der Diagnosecodes zu verbessern, um komorbide Bedingungen zu definieren. Es sollte ein geeigneter “Look-back”-Zeitraum aufgenommen werden, um die Basiskomorbiditäten festzulegen. Die Rücklaufzeit umfasst die stationären und ambulanten Leistungen, die vor Studieneintritt erbracht werden. Ein Zeitraum von einem Jahr kann optimalsein 14. Darüber hinaus kann die Anforderung von zwei separaten Ansprüchen anstelle eines einzelnen Anspruchs die Spezifität erhöhen, während die Ergänzung von Codierungsdaten mit pharmazeutischen Daten die Empfindlichkeit verbessern kann15. Wählen Sie manuelle Diagramm-Audits für einen Teil der Daten kann verwendet werden, um die Genauigkeit der Codierungsstrategie zu überprüfen.

Sobald Komorbiditäten für die betreffende Kohorte definiert und bewertet wurden, kann ein Neigungswert verwendet werden, um Unterschiede in den Kovariaten zwischen den Behandlungsgruppen auszugleichen. Der Neigungswert ergibt sich aus der Wahrscheinlichkeit, dass ein Patient einer Behandlung auf der Grundlage bekannter Kovariaten zugeordnet wird. Die Bilanzierung dieser Neigungsbehandlung reduziert die Auswirkungen der Kovariaten auf die Behandlungszuweisung und trägt dazu bei, eine wahrere Schätzung des Behandlungseffekts auf das Ergebnis zu generieren. Während Neigungswerte nicht unbedingt überlegene Ergebnisse zu multivariaten Modellen liefern, ermöglichen sie die Beurteilung, ob die behandelten und unbehandelten Gruppen nach Anwendung des Neigungswerts3vergleichbar sind. Studienforscher können die absoluten standardisierten Unterschiede in Kovariaten vor und nach der Neigungsübereinstimmung oder der umgekehrten Wahrscheinlichkeit der Behandlungsgewichtung (IPTW) analysieren, um sicherzustellen, dass bekannte Störfaktoren zwischen Gruppen ausgeglichen wurden. Wichtig ist, dass unbekannte Störfaktoren nicht ausgeglichen werden können, und man sollte sich des Potenzials für Restverwechssungen bewusst sein.

Wenn sie richtig ausgeführt werden, sind Neigungswerte jedoch ein leistungsstarkes Werkzeug, das Ergebnisse randomisierter kontrollierter Studien vorhersagen und replizieren kann16. Von den verfügbaren Neigungs-Score-Techniken werden Matching und IPTW in der Regelbevorzugt 17. Innerhalb von IPTW werden die Patienten nach ihrer Neigung oder Wahrscheinlichkeit für eine Behandlung gewichtet. Stabilisierende Gewichte werden in der Regel über Rohgewichte empfohlen, während Das Trimmen der Gewichte kann auch als18,19,20,21betrachtet werden.

Sobald die Studiengruppen ausgewogen sind, können sie bis zum Ergebnis des Interesses verfolgt werden. Studien, die administrative Daten verwenden, könnten an Ergebnissen wie Rückübernahmequoten und Zeit-zu-Ereignis-Analysen interessiert sein. In Studien, die sich für die Sterblichkeit interessieren, enthält das Military Health System Data Repository ein Gebiet für den Vitalstatus, das mit Hilfe des nationalen Todesindex (NDI)22,23weiter erweitert werden kann. Die NDI ist eine zentrale Datenbank mit Todesdaten von staatlichen Ämtern, die vom Center for Disease Control verwaltet wird. Die Ermittler können auf der Grundlage der Sterbeurkunde den grundlegenden Vitalstatus und/oder die genaue Todesursache anfordern.

Das folgende Protokoll beschreibt den Prozess der Durchführung einer administrativen Datenbankstudie unter Verwendung des MDR, der mit Mortalitätsinformationen aus dem NDI ergänzt wurde. Es wird die Verwendung von IPTW zum Ausgleich von Basisdifferenzen zwischen zwei Behandlungsgruppen, einschließlich SAS-Code und Beispielausgabe, erläutert.

Protocol

Das folgende Protokoll folgt den Leitlinien unserer institutionellen Humanethikkommissionen. 1. Definition der Kohorte Bestimmen und klar definieren Sie die Aufnahme- und Ausschlusskriterien der geplanten Kohorte anhand von 1) einem Register oder 2) Datenpunkten, die dem MDR entnommen werden können, wie z. B. Verwaltungscodes für Diagnosen oder Verfahren (d. h. alle Patienten mit mehr als zwei ambulante Diagnosen oder eine stationäre Diagnose von Vorhofflimmern). Wenn Sie …

Representative Results

Nach Abschluss von IPTW können Tabellen oder Plots der absoluten standardisierten Unterschiede mit dem stddiff-Makrocode bzw. dem asdplot-Makrocode generiert werden. Abbildung 1 zeigt ein Beispiel für das geeignete Ausbalancieren in einer großen Kohorte von 10.000 Teilnehmern mithilfe des asdplot-Makros. Nach Anwendung des Neigungswerts wurden die absoluten standardisierten Unterschiede deutlich reduziert. Der für die absolute standardisierte Differenz ve…

Discussion

Retrospektive Analysen mit großen administrativen Datensätzen bieten eine effiziente und kostengünstige Alternative, wenn randomisierte kontrollierte Versuche nicht möglich sind. Der entsprechende Datensatz hängt von der Bevölkerung und den Variablen ab, die von Interesse sind, aber der MDR ist eine attraktive Option, die nicht die Altersbeschränkungen hat, die bei Medicare-Daten gesehen werden. Bei jedem Datensatz ist es wichtig, mit seinem Layout und Datenwörterbuch vertraut zu sein. Dabei sollte darauf geachte…

Disclosures

The authors have nothing to disclose.

Acknowledgements

Die in dieser Publikation berichteten Forschungsergebnisse wurden vom National Center for Advancing Translational Sciences der National Institutes of Health unter der Award-Nummer UL1 TR002345 unterstützt. Der Inhalt liegt allein in der Verantwortung der Autoren und stellt nicht unbedingt die offizielle Meinung der National Institutes of Health dar.

Haftungsausschluss: Darüber hinaus sind die in diesem Artikel zum Ausdruck gebrachten Ansichten nur die des Autors und sollten nicht so ausgelegt werden, dass sie in irgendeiner Weise die ansichten der Regierung der Vereinigten Staaten, des US-Verteidigungsministeriums (DoD) oder des US-Außenministeriums darstellen. Armee. Die Identifizierung bestimmter Produkte oder wissenschaftlicher Instrumente wird als integraler Bestandteil des wissenschaftlichen Unterfangens betrachtet und stellt keine Billigung oder stillschweigende Billigung seitens des Autors, des DoD oder einer Komponentenagentur dar.

Materials

CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

References

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J., et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -. C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. . 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , (2015).
  25. Buck, C. J. . 2018 ICD-10-CM for Hospitals, Professional Edition. , (2018).
  26. Guo, S., Fraser, W. M. . Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).

Play Video

Cite This Article
Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

View Video