Cuando los ensayos controlados aleatorios no son factibles, una fuente de datos integral de atención médica como el Repositorio de Datos del Sistema de Salud Militar proporciona una alternativa atractiva para los análisis retrospectivos. La incorporación de datos de mortalidad del índice nacional de mortalidad y el equilibrio entre los grupos que utilizan la ponderación de la propensión ayuda a reducir los sesgos inherentes a los diseños retrospectivos.
Cuando los ensayos controlados aleatorios no son factibles, los estudios retrospectivos que utilizan big data proporcionan una alternativa eficiente y rentable, aunque están en riesgo de sesgo de selección de tratamiento. El sesgo de selección del tratamiento se produce en un estudio no aleatorio cuando la selección del tratamiento se basa en características previas al tratamiento que también están asociadas con el resultado. Estas características previas al tratamiento, o los fundadores, pueden influir en la evaluación del efecto de un tratamiento en el resultado. Las puntuaciones de propensión minimizan este sesgo equilibrando a los confundistas conocidos entre los grupos de tratamiento. Existen algunos enfoques para realizar análisis de puntuación de propensión, incluida la estratificación por la puntuación de propensión, la coincidencia de propensión y la probabilidad inversa de ponderación del tratamiento (IPTW). Aquí se describe el uso de IPTW para equilibrar las comorbilidades basales en una cohorte de pacientes dentro del Repositorio de Datos del Sistema de Salud Militar de los Estados Unidos (MDR). El MDR es una fuente de datos relativamente óptima, ya que proporciona una cohorte contenida en la que se dispone de información casi completa sobre los servicios de hospitalización y ambulatorios para los beneficiarios elegibles. A continuación se describe el uso del MDR complementado con información del índice nacional de mortalidad para proporcionar datos sólidos sobre mortalidad. También se proporcionan sugerencias para el uso de datos administrativos. Por último, el protocolo comparte un código SAS para utilizar IPTW para equilibrar a los fundadores conocidos y trazar la función de incidencia acumulativa para el resultado de interés.
Los ensayos aleatorios controlados con placebo son el diseño de estudio más fuerte para cuantificar la eficacia del tratamiento, pero no siempre son factibles debido a los requisitos de costo y tiempo o la falta de equipoise entre los grupos de tratamiento1. En estos casos, un diseño de cohorte retrospectiva utilizando datos administrativos a gran escala (“big data”) a menudo proporciona una alternativa eficiente y rentable, aunque la falta de aleatorización introduce el sesgo de selección de tratamiento2. El sesgo de selección del tratamiento se produce en estudios no aleatorios cuando la decisión del tratamiento depende de las características previas al tratamiento asociadas con el resultado de interés. Estas características se conocen como factores de confunción.
Debido a que las puntuaciones de propensión minimizan este sesgo equilibrando a los cofundadores conocidos entre los grupos de tratamiento, se han vuelto cada vez más populares3. Las puntuaciones de propensión se han utilizado para comparar los enfoques quirúrgicos4 y los regímenes médicos5. Recientemente, hemos utilizado un análisis de propensión de datos del Repositorio de Datos del Sistema de Salud Militar de los Estados Unidos (MDR) para evaluar el efecto de las estatinas en la prevención primaria de los resultados cardiovasculares basados en la presencia y gravedad del calcio de la arteria coronaria6.
El MDR, utilizado con menos frecuencia que los conjuntos de datos de Medicare y VA con fines de investigación, contiene información completa de reclamos administrativos y médicos de los servicios hospitalarios y ambulatorios proporcionados para militares en servicio activo, jubilados y otros beneficiarios de atención médica del Departamento de Defensa (DoD) y sus dependientes. La base de datos incluye servicios prestados en todo el mundo en instalaciones de tratamiento militar de Los Estados Unidos o en instalaciones civiles facturadas al DoD. La base de datos incluye datos completos de farmacia desde el 1 de octubre de 2001. Los datos de laboratorio están disponibles a partir de 2009, pero sólo se limitan a las instalaciones de tratamiento militar. Dentro del MDR, las cohortes se han definido con métodos que incluyen el uso de códigos de diagnóstico (por ejemplo, diabetes mellitus7) o códigos de procedimiento (por ejemplo, cirugía artroscópica8). Alternativamente, una cohorte de beneficiarios definidos externamente, como un registro, puede ser emparejado con el MDR para obtener datos de línea de base y seguimiento9. A diferencia de Medicare, el MDR incluye pacientes de todas las edades. También es menos sesgado hacia los hombres que la base de datos VA ya que incluye dependientes. Sin embargo, el acceso al MDR es limitado. Generalmente, sólo los investigadores que son miembros del Sistema de Salud Militar pueden solicitar acceso, análogo a los requisitos para el uso de la base de datos del VA. Los investigadores no gubernamentales que deseen acceder a los datos de los sistemas de salud militar deben hacerlo a través de un acuerdo de intercambio de datos bajo la supervisión de un patrocinador gubernamental.
Al utilizar cualquier conjunto de datos administrativos, es importante tener en cuenta las limitaciones, así como las fortalezas de la codificación administrativa. La sensibilidad y especificidad del código puede variar en función del diagnóstico relacionado, si se trata de un diagnóstico primario o secundario, o si se trata de un archivo de hospitalización o ambulatorio. Los códigos de hospitalización para el infarto agudo de miocardio generalmente se notifican con precisión con valores predictivos positivos superiores al 90%10,pero el consumo de tabaco a menudo está subcodificado11. Dicha subcodificación puede o no tener un efecto significativo en los resultados de un estudio12. Además, pueden existir varios códigos para una condición determinada con diferentes niveles de correlación con la enfermedad en la pregunta13. Un equipo de investigación debe realizar una búsqueda y revisión exhaustiva de la clasificación de la enfermedad, la novena revisión, la modificación clínica (ICD-9-CM) y/o los manuales de codificación ICD-10-CM para garantizar que los códigos apropiados se incluyan en el estudio.
Se pueden emplear varios métodos para mejorar la sensibilidad y precisión de los códigos de diagnóstico para definir condiciones comorbilidades. Debería incluirse un período adecuado de “revisión” para establecer comorbilidades basales. El período de búsqueda incluye los servicios de hospitalización y ambulatorio según los servicios para pacientes hospitalizados y ambulatorios proporcionados antes de la entrada al estudio. Un período de un año puede ser óptimo14. Además, requerir dos notificaciones separadas en lugar de una sola reclamación puede aumentar la especificidad, mientras que la suplementación de datos de codificación con datos farmacéuticos puede mejorar la sensibilidad15. Las auditorías de gráficos manuales seleccionados en una parte de los datos se pueden utilizar para verificar la precisión de la estrategia de codificación.
Una vez definidas y evaluadas las comorbilidades para la cohorte en cuestión, se puede utilizar una puntuación de propensión para equilibrar las diferencias en las covariables entre los grupos de tratamiento. La puntuación de propensión se deriva de la probabilidad de que un paciente sea asignado a un tratamiento basado en covariables conocidas. La contabilidad de este tratamiento de propensión reduce el efecto que las covariables tienen en la asignación del tratamiento y ayuda a generar una estimación más verdadera del efecto del tratamiento en el resultado. Si bien las puntuaciones de propensión no proporcionan necesariamente resultados superiores a los modelos multivariantes, sí permiten evaluar si los grupos tratados y no tratados son comparables después de aplicar la puntuación de propensión3. Los investigadores del estudio pueden analizar las diferencias estandarizadas absolutas en las covariables antes y después de la coincidencia de la propensión o la probabilidad inversa de ponderación del tratamiento (IPTW) para garantizar que los fundadores conocidos se hayan equilibrado entre grupos. Es importante destacar que los confundistas desconocidos pueden no estar equilibrados, y uno debe ser consciente del potencial de confunción residual.
Cuando se ejecuta correctamente, sin embargo, las puntuaciones de propensión son una poderosa herramienta que puede predecir y replicar los resultados de ensayos controlados aleatorios16. De las técnicas de puntuación de propensión disponibles, el emparejamiento y el IPTW son generalmente preferidos17. Dentro de IPTW, los pacientes se ponderan por su propensión o probabilidad de tratamiento. Los pesos estabilizadores se recomiendan generalmente sobre los pesos brutos, mientras que el recorte de los pesos también se puede considerar18,19,20,21.
Una vez equilibrados los grupos de estudio, se pueden seguir hasta el resultado de interés. Los estudios que utilizan datos administrativos pueden estar interesados en resultados tales como tasas de readmisión y análisis de tiempo a evento. En estudios interesados en la mortalidad, el Repositorio de Datos del Sistema De Salud Militar incluye un campo para el estatus vital que se puede aumentar aún más utilizando el índice nacional de mortalidad (NDI)22,23. El NDI es una base de datos centralizada de información de registros de defunción de las oficinas estatales que es administrada por el Centro para el Control de Enfermedades. Los investigadores pueden solicitar el estado vital básico y/o la causa específica de la muerte basado en el certificado de defunción.
El siguiente protocolo detalla el proceso de realizar un estudio administrativo de la base de datos utilizando el MDR aumentado con información de mortalidad del NDI. Detalla el uso de IPTW para equilibrar las diferencias de línea de base entre dos grupos de tratamiento, incluido el código SAS y la salida de ejemplo.
Los análisis retrospectivos que utilizan grandes conjuntos de datos administrativos proporcionan una alternativa eficiente y rentable cuando los ensayos controlados aleatorios no son factibles. El conjunto de datos adecuado dependerá de la población y las variables de interés, pero el MDR es una opción atractiva que no tiene las restricciones de edad vistas con los datos de Medicare. Con cualquier conjunto de datos, es importante estar íntimamente familiarizado con su diseño y diccionario de datos. Se debe tener c…
The authors have nothing to disclose.
La investigación reportada en esta publicación fue apoyada por el Centro Nacional para el Avance de las Ciencias Traslacionales de los Institutos Nacionales de Salud bajo el Premio Número UL1 TR002345. El contenido es responsabilidad exclusiva de los autores y no representa necesariamente los puntos de vista oficiales de los Institutos Nacionales de Salud.
Descargo de responsabilidad: Además, las opiniones expresadas en este artículo son las del autor solamente y no deben interpretarse como representar de ninguna manera las del Gobierno de los Estados Unidos, el Departamento de Defensa de los Estados Unidos (DoD), o el Departamento de los Estados Unidos de la Ejército. La identificación de productos específicos o instrumentación científica se considera una parte integral del esfuerzo científico y no constituye un respaldo o respaldo implícito por parte del autor, Departamento de Identidad o cualquier agencia de componentes.
CD Burner (for NDI Request) | |||
Computer | |||
Putty.exe | Putty.org | ||
SAS 9.4 | SAS Institute Cary, NC | ||
WinSCP or other FTP software | https://winscp.net/eng/index.php |