Quando gli studi controllati randomizzati non sono fattibili, una fonte completa di dati sanitari come il Military Health System Data Repository fornisce un’alternativa interessante per le analisi retrospettive. L’incorporazione dei dati sulla mortalità derivanti dall’indice nazionale di mortalità e il bilanciamento delle differenze tra i gruppi che utilizzano la ponderazione della propensione aiuta a ridurre i pregiudizi inerenti ai progetti retrospettivi.
Quando gli studi controllati randomizzati non sono fattibili, gli studi retrospettivi che utilizzano i big data forniscono un’alternativa efficiente ed economica, anche se sono a rischio di distorsione della selezione del trattamento. La distorsione della selezione del trattamento si verifica in uno studio non randomizzato quando la selezione del trattamento si basa su caratteristiche pre-trattamento che sono associate anche al risultato. Queste caratteristiche di pre-trattamento, o confondenti, possono influenzare la valutazione dell’effetto di un trattamento sul risultato. I punteggi di propensione riducono al minimo questa distorsione bilanciando i confondenti noti tra i gruppi di trattamento. Esistono alcuni approcci per eseguire analisi del punteggio di propensione, tra cui la stratificazione in base al punteggio di propensione, alla corrispondenza della propensione e alla probabilità inversa di ponderazione del trattamento (IPTW). Descritto qui è l’uso di IPTW per bilanciare le comorbilità di base in una coorte di pazienti all’interno del repository di dati del sistema sanitario militare degli Stati Uniti (MDR). L’MDR è una fonte di dati relativamente ottimale, in quanto fornisce una coorte contenuta in cui sono disponibili informazioni quasi complete sui servizi ospedalieri e ambulatoriali per i beneficiari idonei. Di seguito è descritto l’uso della MDR integrato con le informazioni dell’indice nazionale di mortalità per fornire dati solidi sulla mortalità. Sono inoltre forniti suggerimenti per l’utilizzo di dati amministrativi. Infine, il protocollo condivide un codice SAS per l’utilizzo di IPTW per bilanciare i confondenti noti e tracciare la funzione di incidenza cumulativa per il risultato dell’interesse.
Randomizzati, studi controllati con placebo sono il più forte disegno di studio per quantificare l’efficacia del trattamento, ma non sono sempre fattibili a causa di requisiti di costi e tempi o una mancanza di equipoise tra i gruppi di trattamento1. In questi casi, un progetto di coorte retrospettivo che utilizza dati amministrativi su larga scala (“big data”) spesso fornisce un’alternativa efficiente ed economica, anche se la mancanza di randomizzazione introduce la distorsione della selezione del trattamento2. La distorsione della selezione del trattamento si verifica negli studi non randomizzati quando la decisione di trattamento dipende dalle caratteristiche pre-trattamento associate all’esito di interesse. Queste caratteristiche sono note come fattori di confusione.
Poiché i punteggi di propensione riducono al minimo questa distorsione bilanciando i confondenti noti tra i gruppi di trattamento, sono diventati sempre più popolari3. I punteggi di propensione sono stati utilizzati per confrontare gli approcci chirurgici4 e regimi medici5. Recentemente, abbiamo utilizzato un’analisi della propensione dei dati dal Repository dati del sistema sanitario militare degli Stati Uniti (MDR) per valutare l’effetto delle statine nella prevenzione primaria degli esiti cardiovascolari in base alla presenza e alla gravità del calcio coronario6.
L’MDR, utilizzato meno frequentemente dei set di dati Medicare e VA a scopo di ricerca, contiene informazioni complete sulle indicazioni amministrative e mediche dei servizi ospedalieri e ambulatoriali forniti per i beneficiari sanitari del Dipartimento della Difesa (DoD) in servizio attivo e i loro familiari a carico. Il database include servizi forniti in tutto il mondo presso strutture militari statunitensi o presso strutture civili fatturate al DoD. Il database include i dati completi della farmacia dal 1 ottobre 2001. I dati di laboratorio sono disponibili a partire dal 2009, ma sono limitati solo alle strutture di trattamento militare. All’interno della MDR, le coorti sono state definite con metodi come l’uso di codici diagnostici (ad esempio, diabete mellito7) o codici di procedura (ad esempio, chirurgia artroscopica8). In alternativa, una coorte definita esternamente di beneficiari idonei, ad esempio un registro, può essere abbinata all’MDR per ottenere dati di base e di follow-up9. A differenza di Medicare, l’MDR include pazienti di tutte le età. È anche meno di parte nei confronti dei maschi rispetto al database VA poiché include i dipendenti. L’accesso all’MDR è tuttavia limitato. In generale, solo gli investigatori che sono membri del sistema sanitario militare possono richiedere l’accesso, analogamente ai requisiti per l’uso del database VA. I ricercatori non governativi che chiedono l’accesso ai dati dei sistemi sanitari militari devono farlo attraverso un accordo di condivisione dei dati sotto la supervisione di uno sponsor governativo.
Quando si utilizza un set di dati amministrativi, è importante tenere a mente le limitazioni e i punti di forza della codifica amministrativa. La sensibilità e la specificità del codice possono variare in base alla diagnosi correlata, sia che si tratti di una diagnosi primaria o secondaria, o se si tratta di un file ospedaliero o ambulatoriale. I codici ospedalieri per l’infarto miocardico acuto sono generalmente riportati con precisione con valori predittivi positivi superiori al 90%10, ma l’uso del tabacco è spesso sottocodificato11. Tale sottocodifica può o non può avere un effetto significativo sui risultati di uno studio12. Inoltre, possono esistere diversi codici per una determinata condizione con diversi livelli di correlazione alla malattia nella domanda13. Un team investigativo deve eseguire una ricerca e una revisione completa della letteratura completa della classificazione internazionale della malattia, della nona revisione, della modifica clinica (ICD-9-CM) e/o dei manuali di codifica ICD-10-CM per garantire che i codici appropriati siano inclusi nello studio.
Diversi metodi possono essere impiegati per migliorare la sensibilità e l’accuratezza dei codici diagnostici per definire le condizioni comorbid. Occorre includere un periodo adeguato di “look-back” per stabilire le comorbilità di base. Il periodo di riflessione comprende i servizi ospedalieri e ambulatoriali forniti prima dell’ingresso nello studio. Un periodo di un anno può essere ottimale14. Inoltre, che richiedono due rivendicazioni separate invece di una singola affermazione può aumentare la specificità, mentre il completamento dei dati di codifica con dati farmaceutici può migliorare la sensibilità15. Selezionare i controlli grafici manuali su una parte dei dati può essere utilizzato per verificare l’accuratezza della strategia di codifica.
Una volta definite e valutate le comorbilità per la coorte in questione, può essere utilizzato un punteggio di propensione per bilanciare le differenze nelle covarie tra i gruppi di trattamento. Il punteggio di propensione deriva dalla probabilità che un paziente sia assegnato a un trattamento basato su covari noti. La contabilità di questo trattamento di propensione riduce l’effetto che i covariati hanno sull’assegnazione del trattamento e aiuta a generare una stima più fedele dell’effetto del trattamento sul risultato. Sebbene i punteggi di propensione non forniscano necessariamente risultati superiori ai modelli multivariati, consentono di valutare se i gruppi trattati e non trattati sono comparabili dopo aver applicato il punteggio di propensione3. I ricercatori di studio possono analizzare le differenze standardizzate assolute nei covariati prima e dopo la corrispondenza della propensione o della probabilità inversa di ponderazione del trattamento (IPTW) per garantire che i confondenti noti siano stati bilanciati tra i gruppi. È importante sottolineare che i confondenti sconosciuti potrebbero non essere bilanciati e si dovrebbe essere consapevoli del potenziale conforto residuo.
Se eseguiti correttamente, però, i punteggi di propensione sono un potente strumento in grado di prevedere e replicare i risultati di prove controllate randomizzate16. Delle tecniche di propensione-punteggio disponibili, corrispondenza e IPTW sono generalmente preferiti17. All’interno di IPTW, i pazienti sono ponderati in base alla loro propensione o probabilità di trattamento. I pesi stabilizzanti sono generalmente raccomandati rispetto ai pesi grezzi, mentre il taglio dei pesi può anche essere considerato18,19,20,21.
Una volta che i gruppi di studio sono equilibrati, possono essere seguiti fino all’esito di interesse. Gli studi che utilizzano dati amministrativi possono essere interessati a risultati quali tassi di riammissione e analisi del time-to-event. Negli studi interessati alla mortalità, il Military Health System Data Repository include un campo per lo status vitale che può essere ulteriormente aumentato utilizzando l’indice nazionale di mortalità (NDI)22,23. L’NDI è un database centralizzato di informazioni di record di morte dagli uffici statali gestito dal Center for Disease Control. Gli investigatori possono richiedere lo status vitale di base e/o la causa specifica del decesso in base al certificato di morte.
Il protocollo seguente descrive in dettaglio il processo di conduzione di uno studio amministrativo sul database utilizzando l’MDR aumentata con informazioni sulla mortalità da parte dell’NDI. Descrive in dettaglio l’uso di IPTW per bilanciare le differenze di base tra due gruppi di trattamento, tra cui il codice SAS e l’output di esempio.
Le analisi retrospettive che utilizzano set di dati amministrativi di grandi dimensioni forniscono un’alternativa efficiente ed economica quando le sperimentazioni controllate randomizzate non sono fattibili. Il set di dati appropriato dipenderà dalla popolazione e dalle variabili di interesse, ma l’MDR è un’opzione interessante che non prevede le restrizioni di età osservate con i dati Medicare. Con qualsiasi set di dati, è importante avere una profonda familiarità con il layout e il dizionario dei dati. È necessa…
The authors have nothing to disclose.
La ricerca riportata in questa pubblicazione è stata supportata dal National Center for Advancing Translational Sciences dei National Institutes of Health sotto il Award Number UL1 TR002345. Il contenuto è di esclusiva responsabilità degli autori e non rappresenta necessariamente le opinioni ufficiali dei National Institutes of Health.
Disclaimer: Inoltre, le opinioni espresse in questo articolo sono quelle solo dell’autore e non devono essere interpretate per rappresentare in alcun modo quelle del governo degli Stati Uniti, del Dipartimento della Difesa degli Stati Uniti (DoD), o del Dipartimento degli Stati Uniti del Esercito. L’identificazione di prodotti specifici o strumentazione scientifica è considerata parte integrante dello sforzo scientifico e non costituisce l’approvazione o l’approvazione implicita da parte dell’autore, del Dad o di qualsiasi agenzia di componenti.
CD Burner (for NDI Request) | |||
Computer | |||
Putty.exe | Putty.org | ||
SAS 9.4 | SAS Institute Cary, NC | ||
WinSCP or other FTP software | https://winscp.net/eng/index.php |