Lorsque des essais contrôlés randomisés ne sont pas réalisables, une source complète de données sur les soins de santé comme le Dépôt de données du système de santé militaire constitue une solution de rechange intéressante pour les analyses rétrospectives. L’intégration des données sur la mortalité de l’indice national de mortalité et l’équilibre entre les groupes utilisant la pondération de la propension aident à réduire les biais inhérents aux conceptions rétrospectives.
Lorsque des essais contrôlés randomisés ne sont pas réalisables, les études rétrospectives utilisant des données volumineuses constituent une solution de rechange efficace et rentable, bien qu’elles soient à risque de biais de sélection du traitement. Le biais de sélection de traitement se produit dans une étude non randomisée quand la sélection de traitement est basée sur des caractéristiques de pré-traitement qui sont également associées aux résultats. Ces caractéristiques de pré-traitement, ou les confusions, peuvent influencer l’évaluation de l’effet d’un traitement sur les résultats. Les scores de propension minimisent ce biais en équilibrant les confusions connues entre les groupes de traitement. Il existe quelques approches pour effectuer des analyses de score de propension, y compris la stratification par le score de propension, l’appariement de la propension et la probabilité inverse de pondération du traitement (IPTW). Décrit ici est l’utilisation de l’IPTW pour équilibrer les comorbidités de base dans une cohorte de patients au sein du dépôt de données du système de santé militaire des États-Unis (MDR). Le MDR est une source de données relativement optimale, car il fournit une cohorte contenue dans laquelle des renseignements presque complets sur les services aux patients hospitalisés et externes sont disponibles pour les bénéficiaires admissibles. L’utilisation du MDR, complétée par des renseignements tirés de l’indice national de mortalité, est décrite ci-dessous. Sont également fournies des suggestions pour l’utilisation des données administratives. Enfin, le protocole partage un code SAS pour l’utilisation de l’IPTW pour équilibrer les facteurs de confusion connus et tracer la fonction d’incidence cumulative pour le résultat de l’intérêt.
Les essais randomisés et contrôlés par placebo sont la conception la plus solide de l’étude pour quantifier l’efficacité du traitement, mais ils ne sont pas toujours réalisables en raison des coûts et des délais ou d’un manque d’équipemententre les groupes de traitement1. Dans ces cas, une conception de cohorte rétrospective utilisant des données administratives à grande échelle (« big data ») offre souvent une solution de rechange efficace et rentable, bien que l’absence de randomisation introduise un biais de sélection de traitement2. Le biais de sélection de traitement se produit dans les études non randomisées quand la décision de traitement dépend des caractéristiques de pré-traitement qui sont associées aux résultats de l’intérêt. Ces caractéristiques sont connues sous le nom de facteurs de confusion.
Parce que les scores de propension minimisent ce biais en équilibrant les confusions connues entre les groupes de traitement, ils sont devenus de plus en plus populaires3. Les scores de propension ont été utilisés pour comparer les approches chirurgicales4 et les régimes médicaux5. Récemment, nous avons utilisé une analyse de propension des données du dépôt de données du système de santé militaire des États-Unis (MDR) pour évaluer l’effet des statines dans la prévention primaire des résultats cardio-vasculaires basé sur la présence et la sévérité du calcium d’artère coronaire6.
Le MDR, utilisé moins fréquemment que les ensembles de données Medicare et VA à des fins de recherche, contient des informations complètes sur les réclamations administratives et médicales des services hospitaliers et ambulatoires fournis pour les militaires en service actif, les retraités, et d’autres bénéficiaires du ministère de la Défense (DoD) de soins de santé et leurs personnes à charge. La base de données comprend des services fournis dans le monde entier dans des installations de traitement militaire des États-Unis ou dans des installations civiles facturées au ministère de la Justice. La base de données comprend des données complètes sur les pharmacies depuis le 1er octobre 2001. Les données de laboratoire sont disponibles à partir de 2009, mais ne sont limitées qu’aux installations de traitement militaire. Au sein du MDR, les cohortes ont été définies avec des méthodes, y compris l’utilisation de codes de diagnostic (p. ex., diabète sucré7) ou de codes de procédure (p. ex., chirurgie arthroscopique8). Alternativement, une cohorte externe de bénéficiaires admissibles, comme un registre, peut être jumelée au MDR pour obtenir des données de base et de suivi9. Contrairement à l’assurance-maladie, le MDR comprend les patients de tous âges. Il est également moins biaisé envers les hommes que la base de données VA car il comprend les personnes à charge. L’accès au MDR est toutefois limité. En général, seuls les enquêteurs qui sont membres du Système de santé militaire peuvent demander l’accès, ce qui est analogue aux exigences d’utilisation de la base de données de l’AV. Les chercheurs non gouvernementaux qui cherchent à accéder aux données des systèmes de santé militaires doivent le faire dans le cadre d’une entente de partage de données sous la supervision d’un parrain gouvernemental.
Lors de l’utilisation d’un ensemble de données administratives, il est important de garder à l’esprit les limites ainsi que les forces du codage administratif. La sensibilité et la spécificité du code peuvent varier en fonction du diagnostic connexe, qu’il s’agisse d’un diagnostic primaire ou secondaire, ou qu’il s’agisse d’un dossier d’hospitalisation ou de consultation externe. Les codes d’hospitalisation pour l’infarctus aigu du myocarde sont généralement rapportés avec précision avec des valeurs prédictives positives de plus de 90 %10,mais l’usage du tabac est souvent sous-codé11. Un tel sous-codage peut ou non avoir un effet significatif sur les résultats d’une étude12. En outre, plusieurs codes pour une condition donnée peuvent exister avec des niveaux variables de corrélation à la maladie dans la question13. Une équipe d’enquête devrait effectuer une recherche et un examen complets de la classification internationale des maladies, de la neuvième révision, de la modification clinique (ICD-9-CM) et/ou des manuels de codage de la CIM-10-CM pour s’assurer que les codes appropriés sont inclus dans l’étude.
Plusieurs méthodes peuvent être employées pour améliorer la sensibilité et l’exactitude des codes diagnostiques pour définir les conditions comorbides. Une période appropriée de « retour en arrière » devrait être incluse pour établir les comorbidités de base. La période de retour comprend les services d’hospitalisation et de consultation externe fournis avant l’entrée à l’étude. Une période d’un an peut être optimale14. En outre, exiger deux revendications distinctes au lieu d’une seule revendication peut augmenter la spécificité, tandis que la complétance des données de codage avec des données pharmaceutiques peut améliorer la sensibilité15. Sélectionnez des audits manuels sur une partie des données peuvent être utilisés pour vérifier l’exactitude de la stratégie de codage.
Une fois que les comorbidités ont été définies et évaluées pour la cohorte en question, un score de propension peut être utilisé pour équilibrer les différences dans les covariates entre les groupes de traitement. Le score de propension est dérivé de la probabilité qu’un patient soit affecté à un traitement basé sur des covariables connues. La comptabilisation de ce traitement de propension réduit l’effet que les covariates ont sur l’affectation de traitement et aide à générer une estimation plus vraie de l’effet de traitement sur les résultats. Bien que les scores de propension ne donnent pas nécessairement des résultats supérieurs aux modèles multivariés, ils permettent d’évaluer si les groupes traités et non traités sont comparables après l’application du score de propension3. Les chercheurs de l’étude peuvent analyser les différences standardisées absolues dans les covariates avant et après l’appariement de la propension ou la probabilité inverse de pondération du traitement (IPTW) pour s’assurer que les confusions connues ont été équilibrées entre les groupes. Fait important, les confusions inconnues peuvent ne pas être équilibrées, et il faut être conscient du potentiel de confusion résiduelle.
Lorsqu’ils sont exécutés correctement, cependant, les scores de propension sont un outil puissant qui peut prédire et reproduire les résultats des essais contrôlés randomisés16. Parmi les techniques de score de propension disponibles, l’appariement et l’IPTW sont généralement préférés17. Au sein de l’IPTW, les patients sont pondérés en fonction de leur propension ou de leur probabilité de traitement. Les poids stabilisateurs sont généralement recommandés sur les poids bruts, tandis que l’élagage des poids peut également être considéré comme18,19,20,21.
Une fois que les groupes d’étude sont équilibrés, ils peuvent être suivis jusqu’au résultat de l’intérêt. Les études utilisant des données administratives peuvent être intéressées par des résultats tels que les taux de réadmission et les analyses de temps à événement. Dans les études portant sur la mortalité, le Dépôt de données du système de santé militaire comprend un champ pour l’état vital qui peut être encore augmenté en utilisant l’indice national de mortalité (NDI)22,23. Le NDI est une base de données centralisée des informations sur les dossiers de décès des bureaux de l’État qui est gérée par le Center for Disease Control. Les enquêteurs peuvent demander l’état vital de base et/ou la cause précise du décès en se fondant sur le certificat de décès.
Le protocole suivant détaille le processus de réalisation d’une étude de base de données administrative à l’aide du MDR, complété par des informations sur la mortalité de l’IND. Il détaille l’utilisation de l’IPTW pour équilibrer les différences de base entre deux groupes de traitement, y compris le code SAS et la sortie de l’exemple.
Les analyses rétrospectives à l’aide de grands ensembles de données administratives offrent une solution de rechange efficace et rentable lorsque des essais contrôlés randomisés ne sont pas réalisables. L’ensemble de données approprié dépendra de la population et des variables d’intérêt, mais le MDR est une option attrayante qui n’a pas les restrictions d’âge vu avec les données de l’assurance-maladie. Avec n’importe quel ensemble de données, il est important d’être intimement familier avec sa mise en pag…
The authors have nothing to disclose.
La recherche rapportée dans cette publication a été soutenue par le National Center for Advancing Translational Sciences des National Institutes of Health sous le numéro de prix UL1 TR002345. Le contenu est uniquement de la responsabilité des auteurs et ne représente pas nécessairement les vues officielles des National Institutes of Health.
Avertissement: En outre, les opinions exprimées dans cet article sont celles de l’auteur seulement et ne doivent pas être interprétées comme représentant en aucune façon celles du gouvernement des États-Unis, du Département de la Défense des États-Unis (DoD) ou du Département des États-Unis du Armée. L’identification de produits spécifiques ou d’instruments scientifiques est considérée comme faisant partie intégrante de l’effort scientifique et ne constitue pas une approbation ou une approbation implicite de la part de l’auteur, du DoD, ou d’un organisme constituant.
CD Burner (for NDI Request) | |||
Computer | |||
Putty.exe | Putty.org | ||
SAS 9.4 | SAS Institute Cary, NC | ||
WinSCP or other FTP software | https://winscp.net/eng/index.php |