Vi visar hur man distribuerar ett realtid psykos riskberäkning och varningssystem baserat på CogStack, en informationshämtning och extrahering plattform för elektroniska patientjournaler.
Nyligen genomförda studier har visat att en automatiserad, livslängd-inclusive, transdiagnostiska, och kliniskt baserade, individualiserade risk kalkylator ger ett kraftfullt system för att stödja tidig upptäckt av individer i riskzonen för psykos i stor skala, genom att utnyttja elektroniska patientjournaler (EHRs). Denna riskkalkylator har validerats externt två gånger och genomgår genomförbarhetstester för klinisk implementering. Integreringen av denna riskkalkylator i klinisk rutin bör underlättas av prospektiva genomförbarhetsstudier, som krävs för att ta itu med pragmatiska utmaningar, såsom saknade data, och användbarheten av denna riskkalkylator i en verklig och rutinmässig klinisk miljö. Här presenterar vi en metod för en framtida implementering av en realtid psykos riskdetektering och varning tjänst i en verklig EHR-system. Den här metoden utnyttjar CogStack-plattformen, som är ett system med öppen källkod, lätt och distribuerad informationshämtning och textextrahering. CogStack-plattformen innehåller en uppsättning tjänster som möjliggör fulltextsökning av kliniska data, lifespan-inclusive, realtidsberäkning av psykosrisk, tidig riskvarning till kliniker och visuell övervakning av patienter över tiden. Vår metod omfattar: 1) intag och synkronisering av data från flera källor till CogStack-plattformen, 2) implementering av en riskkalkylator, vars algoritm tidigare har utvecklats och validerats, för snabb beräkning av en patients risk för psykos, 3) skapande av interaktiva visualiseringar och instrumentpaneler för att övervaka patienternas hälsotillstånd över tid, och 4) bygga automatiserade varningssystem för att säkerställa att kliniker meddelas om patienter i riskzonen , så att lämpliga åtgärder kan vidtas. Detta är den första studien någonsin som har utvecklat och implementerat ett liknande detektions- och varningssystem i klinisk rutin för tidig upptäckt av psykos.
Psykotiska störningar är allvarliga psykiska sjukdomar som leder till svårigheter att skilja mellan den interna erfarenheten av sinnet och den yttre verkligheten i miljön1, samt en högre än genomsnittlig risk för självskadebeteende och självmord2. Inom ramen för standardvården leder dessa sjukdomar till stora effekter på folkhälsan med en betydande hälso- och ekonomisk börda för individer, familjer och samhällen över hela världen3. Tidiga ingrepp i psykos kan förbättra resultaten av denna psykiska störning4. I synnerhet ger detektion, prognostisk bedömning och förebyggande behandling av individer som löper klinisk hög risk att utveckla psykos (CHR-P)5 en unik potential att förändra sjukdomsförloppet och därigenom förbättra livskvaliteten för många människor och deras familjer3,,6. CHR-P individer är hjälpsökande ungdomar presenterar med försvagade symtom och funktionsnedsättning7: deras risk att utveckla psykos är 20% vid 2-år8 men det är högre i vissa specifika undergrupper9,10. Trots vissa betydande framsteg, effekterna av förebyggande metoder i rutinmässig klinisk praxis begränsas av förmågan att upptäcka de flesta individer som är i riskzonen11. Aktuella detektionsmetoder bygger på hjälpsökande beteenden och remisser på misstanke om psykosrisk; dessa metoder är mycket ineffektiva i hanteringen av ett stort antal prover11. Således är skalbarheten av nuvarande detektionsmetoder för den stora majoriteten av den utsatta befolkningen ganska begränsad12. Faktum är att endast 5% (fristående specialiserade tjänster för tidig upptäckt) till 12% (ungdom mental hälsovård) av individer i riskzonen för att utveckla en första psykotisk störning kan upptäckas vid tidpunkten för deras riskstadium av den nuvarande upptäckten strategier6.
För att utöka de kliniska fördelarna med förebyggande metoder hos ett större antal riskpersoner utvecklade vi en automatiserad, livslängdskon heldomsorg (dvs. i alla åldrar), transdiagnostik (dvs. över olika diagnoser)13, kliniskt baserad individualiserad riskkalkylator, som kan upptäcka individer i riskzonen för psykos i sekundär mental vård i stor skala, utöver de som uppfyller CHR-P-kriterierna14. Denna riskkalkylator använde en Cox proportionell riskmodell för att förutsäga risken för att utveckla en psykotisk störning under sex år från fem rutinmässigt insamlade kliniska variabler som valts ut på förhand, i linje med metodologiska riktlinjer15: ålder, kön, etnicitet, ålder för kön och primär indexdiagnos. Dessa kliniska variabler valdes ut på grundval av a priori kunskap från metaanalyser16,,17,i enlighet med de state-of-the-art metodologiska riktlinjerna15. Antalet prediktorer är begränsat för att bevara förhållandet Händelse per variabel och minimera övermontering av fördomar. inklusive för många variabler utan a priori-filter leder till övermonteringsproblem och dålig prognostisk noggrannhet18. Den metod som används för att utveckla denna modell ger liknande prognostisk noggrannhet till automatiska maskininlärningsmetoder18. Parametrar för Cox-modellen uppskattades baserat på en retrospektiv avidentifierad kohort från södra London och Maudsley National Health Service Foundation Trust (SLaM)19. SLaM är en National Health Service (NHS) psykisk hälsa förtroende som ger sekundär psykisk hälsovård till en befolkning på 1,36 miljoner individer i södra London (Lambeth, Southwark, Lewisham och Croydon stadsdelar), och har en av de högsta registrerade andelen psykos i världen20. Alla data som används i modellutvecklingen extraherades från plattformen Clinical Record Interactive Search (CRIS), ett digitalt ärenderegistersystem, som ger forskare retroaktiv åtkomst och analys av anonymiserade kliniska register19. Den kliniska informationen i CRIS extraheras från ett skräddarsytt elektroniskt patientjournalsystem (EHR) på SLaM, kallat electronic patient journey system (ePJS). SLaM är pappersfritt och ePJS representerar standardplattformen för datainsamling för klinisk rutin. Således utnyttjar den transdiagnostiska riskkalkylatorn EHRs och har potential att automatiskt screena stora EHRs av patienter som får tillgång till sekundär mental vård, för att upptäcka dem som kan vara i riskzonen för psykos. Algoritmen för denna transdiagnostiska riskkalkylator har publicerats tidigare6,14,21. Den transdiagnostiska riskkalkylatorn har externt validerats i två NHS Foundation Trusts14,,21 och optimerade22, vilket visar dess adekvata prognostiska prestanda och generaliserbarhet mellan olika populationer.
Enligt metodologiska riktlinjer för utveckling av en riskprediktionsmodell15,23, är nästa steg efter modellutveckling och validering att implementera förutsägelsemodellen i rutinmässig klinisk praxis. Genomförandestudier föregås vanligtvis av pilot- eller genomförbarhetsstudier som behandlar potentiella pragmatiska begränsningar i samband med användning av riskalgoritmer i klinisk praxis. Obligatoriska data för att köra en kalkylator, till exempel ålder, kön och etnicitet, kanske inte är tillgängliga vid diagnosdatum eller uppdateras senare. Effektiva metoder för att hantera data som saknas och synkronisera frekventa uppdateringar i dataströmmar i realtid bör övervägas för att få de mest tillförlitliga förutsägelseresultaten i en implementering. Eftersom den inledande utvecklingen av riskkalkylatorn baserades på retrospektiva kohortdata är det inte heller känt om det kan användas i en dataström i realtid som är typisk för en verklig klinisk miljö. En annan utmaning är att se till att berörda kliniker får de rekommendationer som genereras av riskkalkylatorn inom en lämplig tidsram och inom en gemensam och accepterad kommunikationsväg.
För att övervinna dessa begränsningar har vi slutfört en genomförbarhetsstudie med den individualiserade transdiagnostiska riskkalkylatorn. Studien omfattade två faser: en in vitro-fas som genomfördes med hjälp av data från den lokala EHR, utan att kontakta kliniker eller patienter, och en in vivo fas, som innebar direkt kontakt med kliniker. In vitro-fasen hade två olika mål: i) att ta itu med genomförandehinder enligt den konsoliderade ramen för genomförandeforskning (CFIR)27 och ii) att integrera den transdiagnostiska riskkalkylatorn i den lokala EHR. Implementeringshinder inkluderade kommunikation av riskutfall till kliniker. I SLaM uppmanas alla patienter att registrera sig för Samtycke för kontakt (C4C), vilket indikerar att de är villiga att kontaktas för forskning, utan att påverka kvaliteten på vården. Detta minskar de etiska frågor som rör att kontakta patienter. Utöver detta hjälpte arbetsgrupper med kliniker till att skräddarsy hur denna information kommunicerades. Under in vivo-fasen (14 maj 2018 till 29 april 2019) var alla individer (i) äldre än 14 år (ii) som hade tillgång till någon SLaM-tjänst (lambeths stadsdelar, Southwark, Lewisham, Croydon), (iii) får en första ICD-10 index primär diagnos av någon icke-organisk, icke-psykotisk psykisk störning (med undantag för akuta och övergående psykotiska störningar; ATPD) eller en beteckning för chr-p och iv) med befintliga kontaktuppgifter ansågs vara stödberättigande. Under in vivo-fasen kontrollerades automatiskt nya patienter som fick tillgång till SLaM varje vecka för sin psykosrisk, och de som hade en risk som är större än en viss tröskel upptäcktes. Forskargruppen kontaktade sedan patienternas ansvariga kliniker för att diskutera ytterligare rekommendationer och så småningom föreslå en ytterligare ansikte mot ansikte bedömning6. Om de som bedömdes skulle uppfylla chr-p-kriterierna hänvisades de till specialiserade CHR-P-tjänster, såsom Uppsökande verksamhet och stöd i södra London (OASIS)28. Detta skulle resultera i förbättrad upptäckt av individer före uppkomsten av en psykotisk störning och ge en betydande möjlighet att ändra sjukdomsförloppet. Avgörande, denna genomförbarhetsstudie innebar fullständig integration av räknaren i det lokala EHR-systemet, vilket är ämnet för den aktuella artikeln. Det fullständiga protokollet för denna genomförbarhetsstudie, inklusive en översikt över planen för utvärdering av den föreslagna forskningen, detaljer om hantering av datasäkerhet och etiska frågor, har presenterats i vårt tidigare arbete6. Den aktuella artikeln, som en del av genomförbarhetsstudien6, fokuserar selektivt på att presentera det tekniska genomförandet av en realtid psykos riskdetektering och varningssystem baserat på den lokala EHR data. Mer specifikt är syftet med denna studie att undersöka den tekniska genomförbarheten av denna riskkalkylator i tid upptäcka riskpatienter så snart de får tillgång till en sekundär mental vård. De fullständiga resultaten av genomförbarhetsstudien, när det gäller klinikernas efterlevnad av rekommendationerna från riskkalkylatorn, kommer att presenteras separat. En omfattande utvärdering av effektiviteten i den föreslagna forskningen, som kräver randomiserade mönster, ligger utanför ramen för det nuvarande forskningsprogrammet. Så vitt vi vet är detta den första metoden som beskriver genomförandet av en riskkalkylator baserad på levande EHR-data för tidig upptäckt av psykos.
Vår inställning till psykos riskdetektering och varningar utnyttjar CogStack-plattformen. CogStack-plattformen är en lätt, distribuerad och feltolerant informationshämtning och textextraheringsplattform24. Den här plattformen består av tre nyckelkomponenter: 1) CogStack-pipelinen som använder Java Spring Batch-ramverket för att inta och synkronisera data från en fördefinierad datakälla (både strukturerade och ostrukturerade EHR-data i flera format som Word, PDF-filer och bilder) till en fördefinierad datamottagare i realtid. 2) Elasticsearch, en sökmotor som möjliggör lagring och frågor av den fullständiga texten till EHR-data, samt ger olika gränssnitt programprogrammering (API: er) för att bädda in avancerad analys i motorn; och 3) Kibana, ett interaktivt, webbaserat användargränssnitt som tillåter användare att fråga data i Elasticsearch, bygga visualiseringsinstrumentpaneler och ställa in aviseringar om avvikelser eller andra mönster av intresse från data. Dessutom innehåller CogStack möjligheten att varna kliniker för potentiella problem via e-post och SMS (text), vilket gör det möjligt för kliniker att få meddelanden i rätt tid om riskpatienter som rapporterats av riskkalkylatorn.
Vi presenterar en modell av psykos riskdetektering och varningar baserat på ePJS på SLaM, utnyttja CogStack plattformen. Jämfört med CRIS-plattformen som ger en mekanism för retrospektiv tillgång till avidentifierade patientjournaler från ePJS på veckobasis19,möjliggör CogStack-plattformen på SLaM tillgång till en identifierbar EHR i realtid, vilket för att varna närmare vårdpunkten och riskprognosen i en prospektiv design, även om både CRIS- och CogStack-plattformarna använder data som kommer från ePJS i SLaM. I det avsnitt som följer ger vi information om de viktigaste stegen i vår metod, inklusive att förbereda källdata från EHR, inta källdata i CogStack-plattformen för att möjliggöra fulltextsökning via Elasticsearch, köra psykosriskkalkylatorn med hjälp av en Python-demontråd och ställa in interaktiva visualiseringar och riskvarningar i realtid via Kibana-användargränssnittet. Alla forskare som har som mål att bygga ett system för riskdetektering och varning i realtid baserat på EHR-data kan följa metoden och dess referensimplementering. Som vi nedan ska utarbeta utnyttjar den föreslagna metoden lätta tekniker med öppen källkod med hög flexibilitet och bärbarhet. Detta gör det möjligt att köra riskkalkylatorn på olika platser och visar en hög tillämplighet på andra riskuppskattningsalgoritmer. Dessutom fungerar metoden som ett enkelt tillvägagångssätt för att förbättra riskdetekterings- och varningsfunktionerna hos en EHR inbäddad i ett allmänt hälso- och sjukvårdssystem.
Vi har visat den första EHR genomförandet av en realtid psykos riskdetektering och varningssystem baserat på CogStack, en öppen källkod information hämtning och extraktion plattform. Efter detta tillvägagångssätt kan man omvandla och inta en stor uppsättning kliniska data i olika format, inklusive strukturerad och ostrukturerad information, till en CogStack-instans, för att möjliggöra fulltextsökning, interaktiva analyser och visualisering av data, samt realtidsbelysning till kliniker hos patienter som löper risk för psykos. Även om den ursprungliga psykos riskkalkylatorn har validerats i pilotstudier över flera NHS Trusts, om än med retrospektiva patientjournaler6,14,21, ger denna experimentella design den första evidensbasen att denna riskkalkylator kan replikeras och distribueras för användning i realtid. Detta tillvägagångssätt möjliggör automatisk leverans av prognostiska resultat till kliniker genom befintliga kliniska anmälan kanaler, såsom e-post, i realtid. Detta visar tydligt den tekniska genomförbarheten för att genomföra en storskalig effektivitetsstudie för att utvärdera den slutliga kliniska nyttan av denna riskkalkylator i den verkliga världen.
Detta protokoll är empiriskt innovativt, eftersom det inte finns ett liknande riskdetekterings- och varningssystem för psykos. Dessutom har detta protokoll hög generaliserbarhet i klinisk användning, särskilt på grund av de unika styrkorna i vår strategi. Ur ett teoretiskt perspektiv använde vi en riskprediktionsmodell som utvecklades baserat på en stor retrospektiv avidentifierad kohort från SLaM NHS Trust. SLaM ger sekundär mental vård till en befolkning på 1,36 miljoner individer i södra London och har en av de högsta registrerade andelen psykos i världen. Denna stora kohort, som har hög mångfald i sociodemografiska och diagnostiska egenskaper, gör det möjligt för oss att utveckla en riskprediktionsmodell som sannolikt inte är partisk mot en population med specifika egenskaper. Detta stöds av bevis för att den prognostiska noggrannheten hos denna riskkalkylator redan har replikerats två gånger i två olika databaser14,21, inklusive en utanför SLaM. En annan teoretisk styrka i denna riskmodell är att grundläggande demografisk och klinisk diagnosinformation användes som prediktorer. Sådan information är allestädes närvarande i elektroniska kliniska data och i själva verket saknas data för dessa prediktorer har visat sig vara relativt sällsynta i våra tidigare studier14,21. Den höga tillgången på information för byggnadsprediktorer gör det möjligt att köra riskkalkylatorn över ett stort antal patientprover inom olika sekundära mentalvårdssektorer. Dessutom är riskkalkylatorn en generell algoritm som är lämplig för alla individer som löper risk att utveckla psykos i sekundär mental vård, oavsett individers ålder. Det vill säga, denna kalkylator är inte bara lämplig för 15-35 åldersgrupp av topp psykos risk16, men också för dem utanför detta intervall, visar en hög grad av generaliserbarhet.
Ur ett praktiskt perspektiv är både riskkalkylatorn och CogStack-plattformen lätta och öppen källkod som inte involverar resurstunga tekniker eller kostsam infrastruktur. En sådan låg kostnad och lätt att använda plattform kan minska hindren för dess antagande i verkliga kliniska inställningar. Dessutom övervinner vår lösning huvudimplementeringsbarriären: riskuppskattningssystem ger föga värde om de inte används av kliniker i den dagliga praktiken25. Specifikt, vår strategi får tillgång till data från EHR, utför analyser oberoende av ett elektroniskt journalsystem och kan skicka analysresultat tillbaka till kliniker genom befintliga anmälan kanaler. Den här metoden kräver inte att affärslogiken i befintliga system ändras och kan fungera som en fristående tjänst för att stödja och utöka befintliga kliniska beslutsstödsystem. Således har protokollet hög kompatibilitet med redan existerande kliniska system och kan enkelt integreras i rutinmässig klinisk praxis. Dessutom ger protokollet användarvänliga gränssnitt för sökning, analys och visualisering av kliniska data, vilket gör det enkelt för kliniker att tolka och utforska riskresultaten.
Detta protokoll har också sina begränsningar. För det första har effektiviteten av detta protokoll inte utvärderats i rutinmässig klinisk praxis. Denna studie fokuserade på tekniska genomförbarhetstester för att implementera ett system för riskdetektering och varning i realtid i en lokal EHR. För att ytterligare utvärdera effektiviteten av detta system i rutinmässig klinisk praxis, framtida storskaliga randomiserade kontrollerade studier behövs6. En andra begränsning är att förutsägelserna om riskpoäng i det här protokollet gjordes baserat på de första primära diagnoserna, som är statiska data som samlas in vid en enda ögonblicksbild. Chr-P-symptomen utvecklas dock i sig över tiden. En dynamisk version av psykos riskkalkylator, där förutsägelse modeller kan uppdateras dynamiskt för att återspegla förändringarna, har utvecklats nyligen26. Framtida arbete kommer att inriktas på att integrera denna dynamiska kalkylator i det nuvarande protokollet.
Det mest kritiska steget i den här metoden var att identifiera EHR-data som användes för extrakt prediktorer i riskkalkylatorn. Detta kan också innebära att skapa dataelementmappningar, när ett EHR-system använde en annan datamodell än den som används i det här protokollet, till exempel distinkta kodningssystem för patienternas etniska grupper. Vi har öppen källkod alla kod och kartläggning definitioner på nätet(https://github.com/cogstack-slam/psychosis). Baserat på dessa material skulle man kunna replikera distributionen eller justera räknaren beroende på sin egen omständighet. Ett annat viktigt steg var att skapa en databasvy för datainmatning i CogStack. Eftersom relationskopplingsåtgärder (dvs. kombinera kolumner från en eller flera databastabeller) i Elasticsearch kan leda till höga beräkningskostnader, genomförde vi dessa kopplingsåtgärder i EHR-databasen genom att skapa en databasvy. Den här vyn kombinerade all information som behövdes för att extrahera prediktorer i riskkalkylatorn och två viktiga fält som användes av CogStack-pipelines för datapartitionering i datainmatning. Det första fältet är en unik primärnyckel för varje post i vyn (“patient_id” använde det här protokollet) och det andra är en tidsstämpel när en post senast ändrades. Om dessa två fält inte har angetts korrekt kanske CogStack inte synkroniserar datauppdateringar i en EHR-databas i tid. Detaljerade instruktioner för felsökning av problem med CogStack-datainmatning finns på https://cogstack.atlassian.net/wiki/spaces/COGDOC/overview och https://github.com/CogStack/CogStack-Pipeline.
Detta protokoll är mycket transportabelt och kan enkelt distribueras i NHS Trusts som har en CRIS- eller CogStack-plattform. Hittills cris-plattformen, inklusive förfarandena för samtycke, har beskrivits fullständigt på annat håll och är under expansion över 12 NHS Trusts i Storbritannien, utnyttja över 2 miljoner avidentifierade patientjournaler(https://crisnetwork.co/). På samma sätt har CogStack-plattformen distribuerats inte bara i SLaM, utan även andra NHS Trusts över hela Storbritannien som University College London Hospitals (UCLH), King’s College Hospital (KCH), Guy’s och St Thomas (GSTT) och Mersey Care NHS Trusts. Dessa truster utan såsom plattform kan använda en online-version av riskkalkylator (http://psychosis-risk.net), eller bygga detta protokoll från grunden baserat på detta manuskript och våra online-dokument. Även om detta protokoll är utvecklat för psykos riskdetektering, är den arkitektoniska utformningen av detta protokoll inte knuten till denna specifika användning fall. Protokollet är tillräckligt flexibelt för att möjliggöra omkonfigurering och återanvändning av realtidsövervaknings- och varningskomponenter för andra riskmätningsområden, såsom biverkningar, vilket gör det möjligt för kliniker att i tid vidta åtgärder för att förbättra patientvården, säkerheten och erfarenheten.
The authors have nothing to disclose.
Denna studie finansieras av och är en direkt produktion av King’s College London Confidence in Concept award från Medical Research Council (MRC) (MC_PC_16048) till PFP. RD och AR stöddes av: a) Maudsley Charity; b) National Institute for Health Research (NIHR) Biomedical Research Centre i södra London och Maudsley NHS Foundation Trust och King’s College London. c) Health Data Research UK, som finansieras av Uk Medical Research Council, Engineering and Physical Sciences Research Council, Economic and Social Research Council, Department of Health and Social Care (England), Chief Scientist Office of the Scottish Government Health and Social Care Directorates, Health and Social Care Research and Development Division (Welsh Government), Public Health Agency (Northern Ireland), British Heart Foundation och Wellcome Trust; d) Det BigData@Heart konsortiet, finansierat av det gemensamma företaget Innovative Medicines-2 enligt bidragsavtal nr 116074. Detta gemensamma företag får stöd från EU:s forsknings- och innovationsprogram Horisont 2020 och EFPIA. Det leds av DE Grobbee och SD Anker, som samarbetar med 20 akademiska partner och industripartner och ESK. och e) National Institute for Health Research University College London Hospitals Biomedical Research Centre. Dessa finansiärer hade ingen roll i utformningen av studien, insamlingen och analyserna. De åsikter som framförs är upphovsmannens och inte nödvändigtvis de som yttrar sig hos NHS, NIHR eller Hälsodepartementet.
CogStack-Pipeline | King's College London | Open source software | |
Elasticsearch | Elastic NV | Open Source Search & Analytics | |
Kibana | Elastic NV | Open source data visualization plugin for Elasticsearch | |
Python packages ("elasticsearch", "elasticsearch_dsl", "pandas" and "numpy") | Open source community | Open source packages |