Summary

Probabilidad Inversa de Ponderación del Tratamiento (Puntuación de Propensidad) usando el Repositorio de Datos del Sistema de Salud Militar y el Índice Nacional de Muerte

Published: January 08, 2020
doi:

Summary

Cuando los ensayos controlados aleatorios no son factibles, una fuente de datos integral de atención médica como el Repositorio de Datos del Sistema de Salud Militar proporciona una alternativa atractiva para los análisis retrospectivos. La incorporación de datos de mortalidad del índice nacional de mortalidad y el equilibrio entre los grupos que utilizan la ponderación de la propensión ayuda a reducir los sesgos inherentes a los diseños retrospectivos.

Abstract

Cuando los ensayos controlados aleatorios no son factibles, los estudios retrospectivos que utilizan big data proporcionan una alternativa eficiente y rentable, aunque están en riesgo de sesgo de selección de tratamiento. El sesgo de selección del tratamiento se produce en un estudio no aleatorio cuando la selección del tratamiento se basa en características previas al tratamiento que también están asociadas con el resultado. Estas características previas al tratamiento, o los fundadores, pueden influir en la evaluación del efecto de un tratamiento en el resultado. Las puntuaciones de propensión minimizan este sesgo equilibrando a los confundistas conocidos entre los grupos de tratamiento. Existen algunos enfoques para realizar análisis de puntuación de propensión, incluida la estratificación por la puntuación de propensión, la coincidencia de propensión y la probabilidad inversa de ponderación del tratamiento (IPTW). Aquí se describe el uso de IPTW para equilibrar las comorbilidades basales en una cohorte de pacientes dentro del Repositorio de Datos del Sistema de Salud Militar de los Estados Unidos (MDR). El MDR es una fuente de datos relativamente óptima, ya que proporciona una cohorte contenida en la que se dispone de información casi completa sobre los servicios de hospitalización y ambulatorios para los beneficiarios elegibles. A continuación se describe el uso del MDR complementado con información del índice nacional de mortalidad para proporcionar datos sólidos sobre mortalidad. También se proporcionan sugerencias para el uso de datos administrativos. Por último, el protocolo comparte un código SAS para utilizar IPTW para equilibrar a los fundadores conocidos y trazar la función de incidencia acumulativa para el resultado de interés.

Introduction

Los ensayos aleatorios controlados con placebo son el diseño de estudio más fuerte para cuantificar la eficacia del tratamiento, pero no siempre son factibles debido a los requisitos de costo y tiempo o la falta de equipoise entre los grupos de tratamiento1. En estos casos, un diseño de cohorte retrospectiva utilizando datos administrativos a gran escala (“big data”) a menudo proporciona una alternativa eficiente y rentable, aunque la falta de aleatorización introduce el sesgo de selección de tratamiento2. El sesgo de selección del tratamiento se produce en estudios no aleatorios cuando la decisión del tratamiento depende de las características previas al tratamiento asociadas con el resultado de interés. Estas características se conocen como factores de confunción.

Debido a que las puntuaciones de propensión minimizan este sesgo equilibrando a los cofundadores conocidos entre los grupos de tratamiento, se han vuelto cada vez más populares3. Las puntuaciones de propensión se han utilizado para comparar los enfoques quirúrgicos4 y los regímenes médicos5. Recientemente, hemos utilizado un análisis de propensión de datos del Repositorio de Datos del Sistema de Salud Militar de los Estados Unidos (MDR) para evaluar el efecto de las estatinas en la prevención primaria de los resultados cardiovasculares basados en la presencia y gravedad del calcio de la arteria coronaria6.

El MDR, utilizado con menos frecuencia que los conjuntos de datos de Medicare y VA con fines de investigación, contiene información completa de reclamos administrativos y médicos de los servicios hospitalarios y ambulatorios proporcionados para militares en servicio activo, jubilados y otros beneficiarios de atención médica del Departamento de Defensa (DoD) y sus dependientes. La base de datos incluye servicios prestados en todo el mundo en instalaciones de tratamiento militar de Los Estados Unidos o en instalaciones civiles facturadas al DoD. La base de datos incluye datos completos de farmacia desde el 1 de octubre de 2001. Los datos de laboratorio están disponibles a partir de 2009, pero sólo se limitan a las instalaciones de tratamiento militar. Dentro del MDR, las cohortes se han definido con métodos que incluyen el uso de códigos de diagnóstico (por ejemplo, diabetes mellitus7) o códigos de procedimiento (por ejemplo, cirugía artroscópica8). Alternativamente, una cohorte de beneficiarios definidos externamente, como un registro, puede ser emparejado con el MDR para obtener datos de línea de base y seguimiento9. A diferencia de Medicare, el MDR incluye pacientes de todas las edades. También es menos sesgado hacia los hombres que la base de datos VA ya que incluye dependientes. Sin embargo, el acceso al MDR es limitado. Generalmente, sólo los investigadores que son miembros del Sistema de Salud Militar pueden solicitar acceso, análogo a los requisitos para el uso de la base de datos del VA. Los investigadores no gubernamentales que deseen acceder a los datos de los sistemas de salud militar deben hacerlo a través de un acuerdo de intercambio de datos bajo la supervisión de un patrocinador gubernamental.

Al utilizar cualquier conjunto de datos administrativos, es importante tener en cuenta las limitaciones, así como las fortalezas de la codificación administrativa. La sensibilidad y especificidad del código puede variar en función del diagnóstico relacionado, si se trata de un diagnóstico primario o secundario, o si se trata de un archivo de hospitalización o ambulatorio. Los códigos de hospitalización para el infarto agudo de miocardio generalmente se notifican con precisión con valores predictivos positivos superiores al 90%10,pero el consumo de tabaco a menudo está subcodificado11. Dicha subcodificación puede o no tener un efecto significativo en los resultados de un estudio12. Además, pueden existir varios códigos para una condición determinada con diferentes niveles de correlación con la enfermedad en la pregunta13. Un equipo de investigación debe realizar una búsqueda y revisión exhaustiva de la clasificación de la enfermedad, la novena revisión, la modificación clínica (ICD-9-CM) y/o los manuales de codificación ICD-10-CM para garantizar que los códigos apropiados se incluyan en el estudio.

Se pueden emplear varios métodos para mejorar la sensibilidad y precisión de los códigos de diagnóstico para definir condiciones comorbilidades. Debería incluirse un período adecuado de “revisión” para establecer comorbilidades basales. El período de búsqueda incluye los servicios de hospitalización y ambulatorio según los servicios para pacientes hospitalizados y ambulatorios proporcionados antes de la entrada al estudio. Un período de un año puede ser óptimo14. Además, requerir dos notificaciones separadas en lugar de una sola reclamación puede aumentar la especificidad, mientras que la suplementación de datos de codificación con datos farmacéuticos puede mejorar la sensibilidad15. Las auditorías de gráficos manuales seleccionados en una parte de los datos se pueden utilizar para verificar la precisión de la estrategia de codificación.

Una vez definidas y evaluadas las comorbilidades para la cohorte en cuestión, se puede utilizar una puntuación de propensión para equilibrar las diferencias en las covariables entre los grupos de tratamiento. La puntuación de propensión se deriva de la probabilidad de que un paciente sea asignado a un tratamiento basado en covariables conocidas. La contabilidad de este tratamiento de propensión reduce el efecto que las covariables tienen en la asignación del tratamiento y ayuda a generar una estimación más verdadera del efecto del tratamiento en el resultado. Si bien las puntuaciones de propensión no proporcionan necesariamente resultados superiores a los modelos multivariantes, sí permiten evaluar si los grupos tratados y no tratados son comparables después de aplicar la puntuación de propensión3. Los investigadores del estudio pueden analizar las diferencias estandarizadas absolutas en las covariables antes y después de la coincidencia de la propensión o la probabilidad inversa de ponderación del tratamiento (IPTW) para garantizar que los fundadores conocidos se hayan equilibrado entre grupos. Es importante destacar que los confundistas desconocidos pueden no estar equilibrados, y uno debe ser consciente del potencial de confunción residual.

Cuando se ejecuta correctamente, sin embargo, las puntuaciones de propensión son una poderosa herramienta que puede predecir y replicar los resultados de ensayos controlados aleatorios16. De las técnicas de puntuación de propensión disponibles, el emparejamiento y el IPTW son generalmente preferidos17. Dentro de IPTW, los pacientes se ponderan por su propensión o probabilidad de tratamiento. Los pesos estabilizadores se recomiendan generalmente sobre los pesos brutos, mientras que el recorte de los pesos también se puede considerar18,19,20,21.

Una vez equilibrados los grupos de estudio, se pueden seguir hasta el resultado de interés. Los estudios que utilizan datos administrativos pueden estar interesados en resultados tales como tasas de readmisión y análisis de tiempo a evento. En estudios interesados en la mortalidad, el Repositorio de Datos del Sistema De Salud Militar incluye un campo para el estatus vital que se puede aumentar aún más utilizando el índice nacional de mortalidad (NDI)22,23. El NDI es una base de datos centralizada de información de registros de defunción de las oficinas estatales que es administrada por el Centro para el Control de Enfermedades. Los investigadores pueden solicitar el estado vital básico y/o la causa específica de la muerte basado en el certificado de defunción.

El siguiente protocolo detalla el proceso de realizar un estudio administrativo de la base de datos utilizando el MDR aumentado con información de mortalidad del NDI. Detalla el uso de IPTW para equilibrar las diferencias de línea de base entre dos grupos de tratamiento, incluido el código SAS y la salida de ejemplo.

Protocol

El siguiente protocolo sigue las directrices de nuestros comités institucionales de ética humana. 1. Definición de la cohorte Determinar y definir claramente los criterios de inclusión y exclusión de la cohorte planificada utilizando 1) un registro o 2) puntos de datos que se pueden extraer del MDR, como códigos administrativos para diagnósticos o procedimientos (es decir, todos los pacientes con más de dos diagnósticos ambulatorios o un diagnóstico hospitalario de fibrilac…

Representative Results

Al finalizar IPTW, se pueden generar tablas o gráficas de las diferencias estandarizadas absolutas utilizando el código de macro stddiff o el código de macro asdplot, respectivamente. La Figura 1 muestra un ejemplo de equilibrio adecuado en una gran cohorte de 10.000 participantes que utilizan la macro asdplot. Después de la aplicación de la puntuación de propensión, las diferencias estandarizadas absolutas se redujeron significativamente. El límite u…

Discussion

Los análisis retrospectivos que utilizan grandes conjuntos de datos administrativos proporcionan una alternativa eficiente y rentable cuando los ensayos controlados aleatorios no son factibles. El conjunto de datos adecuado dependerá de la población y las variables de interés, pero el MDR es una opción atractiva que no tiene las restricciones de edad vistas con los datos de Medicare. Con cualquier conjunto de datos, es importante estar íntimamente familiarizado con su diseño y diccionario de datos. Se debe tener c…

Divulgaciones

The authors have nothing to disclose.

Acknowledgements

La investigación reportada en esta publicación fue apoyada por el Centro Nacional para el Avance de las Ciencias Traslacionales de los Institutos Nacionales de Salud bajo el Premio Número UL1 TR002345. El contenido es responsabilidad exclusiva de los autores y no representa necesariamente los puntos de vista oficiales de los Institutos Nacionales de Salud.

Descargo de responsabilidad: Además, las opiniones expresadas en este artículo son las del autor solamente y no deben interpretarse como representar de ninguna manera las del Gobierno de los Estados Unidos, el Departamento de Defensa de los Estados Unidos (DoD), o el Departamento de los Estados Unidos de la Ejército. La identificación de productos específicos o instrumentación científica se considera una parte integral del esfuerzo científico y no constituye un respaldo o respaldo implícito por parte del autor, Departamento de Identidad o cualquier agencia de componentes.

Materials

CD Burner (for NDI Request)
Computer
Putty.exe Putty.org
SAS 9.4 SAS Institute Cary, NC
WinSCP or other FTP software https://winscp.net/eng/index.php

Referencias

  1. Concato, J., Shah, N., Horwitz, R. I. Randomized, controlled trials, observational studies, and the hierarchy of research designs. New England Journal of Medicine. 342 (25), 1887-1892 (2000).
  2. Austin, P. C., Platt, R. W. Survivor treatment bias, treatment selection bias, and propensity scores in observational research. Journal of Clinical Epidemiology. 63 (2), 136-138 (2010).
  3. Sturmer, T., Wyss, R., Glynn, R. J., Brookhart, M. A. Propensity scores for confounder adjustment when assessing the effects of medical interventions using nonexperimental study designs. Journal of Internal Medicine. 275 (6), 570-580 (2014).
  4. Schermerhorn, M. L., et al. Long-Term Outcomes of Abdominal Aortic Aneurysm in the Medicare Population. New England Journal of Medicine. 373 (4), 328-338 (2015).
  5. Williams, R. J., et al. A Propensity-Matched Analysis Between Standard Versus Tapered Oral Vancomycin Courses for the Management of Recurrent Clostridium difficile Infection. Open Forum Infectious Diseases. 4 (4), (2017).
  6. Mitchell, J. D., et al. Impact of Statins on Cardiovascular Outcomes Following Coronary Artery Calcium Scoring. Journal of the American College of Cardiology. 72 (25), 3233-3242 (2018).
  7. Rush, T., McGeary, M., Sicignano, N., Buryk, M. A. A plateau in new onset type 1 diabetes: Incidence of pediatric diabetes in the United States Military Health System. Pediatric Diabetes. 19 (5), 917-922 (2018).
  8. Rhon, D. I., Greenlee, T. A., Marchant, B. G., Sissel, C. D., Cook, C. E. Comorbidities in the first 2 years after arthroscopic hip surgery: substantial increases in mental health disorders, chronic pain, substance abuse and cardiometabolic conditions. British Journal of Sports Medicine. , (2018).
  9. Mitchell, J., Paisley, R., Moon, P., Novak, E., Villines, T. Coronary Artery Calcium Score and Long-term Risk of Death, Myocardial Infarction and Stroke: The Walter Reed Cohort Study. Journal of the American College of Cardiology: Cardiovascular Imaging. , (2017).
  10. McCormick, N., Lacaille, D., Bhole, V., Avina-Zubieta, J. A. Validity of myocardial infarction diagnoses in administrative databases: a systematic review. PLoS ONE. 9 (3), e92286 (2014).
  11. Huo, J., Yang, M., Tina Shih, Y. -. C. Sensitivity of Claims-Based Algorithms to Ascertain Smoking Status More Than Doubled with Meaningful Use. Value in Health. , (2017).
  12. Nayan, M., et al. The value of complementing administrative data with abstracted information on smoking and obesity: A study in kidney cancer. Canadian Urological Association Journal. 11 (6), 167-171 (2017).
  13. Birman-Deych, E., et al. Accuracy of ICD-9-CM codes for identifying cardiovascular and stroke risk factors. Medical Care. 43 (5), 480-485 (2005).
  14. Preen, D. B., Holman, C. D., Spilsbury, K., Semmens, J. B., Brameld, K. J. Length of comorbidity lookback period affected regression model performance of administrative health data. Journal of Clinical Epidemiology. 59 (9), 940-946 (2006).
  15. Rector, T. S., et al. Specificity and sensitivity of claims-based algorithms for identifying members of Medicare+Choice health plans that have chronic medical conditions. Health Services Research. 39 (6 Pt 1), 1839-1857 (2004).
  16. Hernán, M. A., et al. Observational studies analyzed like randomized experiments: an application to postmenopausal hormone therapy and coronary heart disease. Epidemiology (Cambridge, Mass.). 19 (6), 766-779 (2008).
  17. Austin, P. C. The relative ability of different propensity score methods to balance measured covariates between treated and untreated subjects in observational studies. Medical Decision Making. 29 (6), 661-677 (2009).
  18. Robins, J. M., Hernan, M. A., Brumback, B. Marginal structural models and causal inference in epidemiology. Epidemiology. 11 (5), 550-560 (2000).
  19. Robins, J. Marginal structural models. 1997 Proceedings of the American Statistical Association, section on Bayesian statistical science. , 1-10 (1998).
  20. Thoemmes, F., Ong, A. D. A Primer on Inverse Probability of Treatment Weighting and Marginal Structural Models. Emerging Adulthood. 4 (1), 40-59 (2016).
  21. Xu, S., et al. Use of stabilized inverse propensity scores as weights to directly estimate relative risk and its confidence intervals. Value in Health: the Journal of the International Society for Pharmacoeconomics and Outcomes Research. 13 (2), 273-277 (2010).
  22. Cowper, D. C., Kubal, J. D., Maynard, C., Hynes, D. M. A primer and comparative review of major US mortality databases. Annals of Epidemiology. 12 (7), 462-468 (2002).
  23. Skopp, N. A., et al. Evaluation of a methodology to validate National Death Index retrieval results among a cohort of U.S. service members. Annals of epidemiology. 27 (6), 397-400 (2017).
  24. Buck, C. J. . 2015 ICD-9-CM for Hospitals, Volumes 1, 2, & 3, Professional Edition. , (2015).
  25. Buck, C. J. . 2018 ICD-10-CM for Hospitals, Professional Edition. , (2018).
  26. Guo, S., Fraser, W. M. . Propensity Score Analysis: Statistical Methods and Applications, Second Edition. , (2015).
  27. Elixhauser, A., Steiner, C., Harris, D. R., Coffey, R. M. Comorbidity measures for use with administrative data. Medical Care. 36 (1), 8-27 (1998).
  28. Charlson, M. E., Pompei, P., Ales, K. L., MacKenzie, C. R. A new method of classifying prognostic comorbidity in longitudinal studies: development and validation. Journal of Chronic Diseases. 40 (5), 373-383 (1987).
  29. Deyo, R. A., Cherkin, D. C., Ciol, M. A. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. Journal of Clinical Epidemiology. 45 (6), 613-619 (1992).
  30. Austin, P. C., Stuart, E. A. The performance of inverse probability of treatment weighting and full matching on the propensity score in the presence of model misspecification when estimating the effect of treatment on survival outcomes. Statistical Methods in Medical Research. 26 (4), 1654-1670 (2017).
  31. Austin, P. C. Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Statistics in Medicine. 28 (25), 3083-3107 (2009).
check_url/es/59825?article_type=t

Play Video

Citar este artículo
Mitchell, J. D., Gage, B. F., Fergestrom, N., Novak, E., Villines, T. C. Inverse Probability of Treatment Weighting (Propensity Score) using the Military Health System Data Repository and National Death Index. J. Vis. Exp. (155), e59825, doi:10.3791/59825 (2020).

View Video