Behavior

使用 CogStack 基于电子健康记录的实时精神病风险检测和警报系统的实施

Published: May 15, 2020 doi: 10.3791/60794

Tao Wang¹, Dominic Oliver², Yamiko Msosa¹, Craig Colling³, Giulia Spada², Łukasz Roguski⁴, Amos Folarin¹, Robert Stewart^3,5, Angus Roberts^1,3, Richard J. B. Dobson^1,3,4,6, Paolo Fusar-Poli^2,3,7,8

¹Department of Biostatistics and Health Informatics, Institute of Psychiatry, Psychology and Neuroscience, King's College London, ²Early Psychosis: Interventions and Clinical-detection (EPIC) lab, Department of Psychosis Studies, Institute of Psychiatry, Psychology & Neuroscience, King's College London, ³National Institute for Health Research, Maudsley Biomedical Research Centre, South London and Maudsley National Health Service (NHS) Foundation Trust, ⁴Institute of Health Informatics, University College London, ⁵Department of Psychological Medicine, Institute of Psychiatry, Psychology and Neuroscience, King's College London, ⁶Health Data Research UK London, University College London, ⁷OASIS service, South London and Maudsley National Health Service (NHS) Foundation Trust, ⁸Department of Brain and Behavioral Sciences, University of Pavia

Summary

我们演示如何部署基于 CogStack 的实时精神病风险计算和警报系统，这是一个用于电子健康记录的信息检索和提取平台。

Abstract

最近的研究表明，一个自动化的、包括寿命的、包括寿命的、可转诊断的、基于临床的个性化风险计算器提供了一个强大的系统，通过利用电子健康记录（ER），支持大规模早期发现处于精神病风险的个人。此风险计算器已经过两次外部验证，并正在进行临床实施的可行性测试。未来可行性研究应促进此风险计算器在临床例程中的集成，这些研究需要解决实际挑战，例如缺少数据，以及这种风险计算器在真实和常规临床环境中的可用性。在这里，我们提出了一种在真实 EHR 系统中可能实现实时精神病风险检测和警报服务的方法。此方法利用了 CogStack 平台，该平台是一个开源、轻量级和分布式信息检索和文本提取系统。CogStack 平台包含一组服务，允许对临床数据进行全文搜索、包含寿命、实时计算精神病风险、向临床医生早期风险警报以及随着时间的推移对患者进行视觉监控。我们的方法包括：1）将多个来源的数据引入和同步到 CogStack 平台，2）实施风险计算器（其算法以前开发和验证），以便及时计算患者的精神病风险;3）创建交互式可视化和仪表板，以监控患者的健康状况;4）建立自动警报系统，以确保临床医生获得风险患者的通知，以便采取适当的行动。这是首次在临床常规中开发和实施类似的检测和警报系统，用于早期发现精神病的研究。

Introduction

精神障碍是严重的心理健康疾病，导致难以区分心理的内在体验和环境的外部现实^1，以及高于平均水平的自我伤害和自杀风险^2。在标准护理下，这些疾病对公共卫生造成重大影响，给全世界的个人、家庭和社会带来重大的健康和经济负担^。早期干预精神病可以改善这种精神障碍^{的结果4。}特别是，对患有精神病的临床高危人群的检测、预后评估和预防治疗（CHR-P）5为改变疾病过程提供了独特的⁵潜力，从而提高了许多人及其家人^{的生活质量3、6。}^,⁶CHR-P个人是寻求帮助的年轻人，出现衰减症状和功能障碍^7：他们患精神病的风险是20%，在2年^8，但在一些特定的子组⁹^,^9，10。尽管取得了一些实质性的进步，但预防方法在常规临床实践中的影响受到检测大多数^{处于危险中的}个体的能力的限制。目前的检测方法基于寻求帮助的行为和转介的嫌疑精神病风险;这些方法在处理大量样品^时效率很低。因此，当前检测方法对绝大多数高危人群的可伸缩性相当有限^。事实上，只有5%（独立的专业早期检测服务）到12%（青少年心理健康服务）的个人，在发展第一个精神病的风险，可以检测到在其风险阶段时，目前的检测策略^6。

为了将预防方法的临床益处扩展到更多的高危人群，我们开发了一种自动化的、包括寿命（即跨所有年龄）、转诊断（即跨诊断^）13、基于临床的个性化风险计算器，可大规模检测处于二级精神卫生保健中精神病风险的个人，超出符合CHR-P标准¹⁴的人。此风险计算器使用 Cox 比例危险模型，根据方法指南^15：年龄、性别、种族、按性别年龄和主要指数诊断，从选择先验的五个常规收集的临床变量中预测六年内患精神病的风险。根据最先进的方法指南¹⁵的建议，这些临床变量是根据从元分析^16，17^,¹⁷获得先验知识选择的。预测变量的数量是有限的，以保持事件每个变量比，并尽量减少过度拟合偏差;包括太多变量没有先验滤波器会导致过度拟合问题和预测精度差^18。用于开发该模型的方法提供了与自动机器学习方法¹⁸类似的预后精度。考克斯模型的参数是根据来自南伦敦和莫兹利国家卫生服务基金会信托基金（SLaM）^的回顾性去识别的队列（SLaM）19年估算的。SLaM是一个国民健康服务（NHS）心理健康信托机构，为伦敦南部（兰贝斯、南华克、刘易斯汉姆和克罗伊登区）136万人口提供二级精神卫生保健，是世界上记录最高的精神病发病率之^一。模型开发中使用的所有数据均从临床记录交互搜索（CRIS）平台提取，该平台是一个数字病例登记系统，它为研究人员提供匿名临床记录的追溯访问和分析¹⁹。CRIS 中的临床信息从 SLaM 的定制电子健康记录（EHR）系统中提取，称为电子患者旅程系统（ePJS）。SLaM 是无纸化的，ePJS 代表了临床常规的标准数据收集平台。因此，转诊断风险计算器利用 ER，并有可能自动筛选获得继发性精神卫生保健的患者的大型 HR，以检测那些可能处于精神病风险的患者。该转诊断风险计算器的算法已经发布于^之前^,^{6，14，21。}^,²¹转诊断风险计算器已在两个NHS基金会信托^14，21^,²¹和优化²²外部验证，显示其足够的预后性能和可概括性在不同的人群。

根据^15、23^,²³号风险预测模型开发的方法指南，模型开发验证后的下一步是在常规临床实践中实施预测模型。实施研究之前通常先进行试点或可行性研究，以解决与在临床实践中使用风险算法相关的潜在实用限制。例如，运行计算器所需的数据（如年龄、性别和种族）可能在诊断日期不可用，或稍后更新。应考虑处理缺失数据和实时数据流中频繁更新的有效方法，以获得实现中最可靠的预测结果。此外，由于风险计算器的初始开发基于追溯性队列数据，因此不知道是否可以在实时数据流中使用，而实时数据流是真实临床环境的典型。另一个挑战是确保相关临床医生在适当的时间范围内，在共享和公认的通信途径内收到风险计算器生成的建议。

为了克服这些限制，我们完成了一项采用个性化转诊断风险计算器的可行性实施研究。该研究包括两个阶段：一个阶段是使用当地EHR的数据进行的体外阶段，无需联系临床医生或患者，另一个阶段是体内阶段，涉及与临床医生的直接接触。体外阶段有两个多目的：（一）根据《综合实施研究框架》^第27条解决执行障碍，（二）将转诊断风险计算器纳入当地经济人权。实施障碍包括向临床医生传达风险结果。在SLaM中，所有患者都被邀请注册联系同意（C4C），这表明他们愿意联系进行研究，而不会影响护理质量。这减少了与联系患者相关的道德问题。此外，与临床医生一起组成的工作组还协助对这些信息的传达方式进行定制。在体内阶段（2018年5月14日至2019年4月29日），所有14岁以上（ii）超过14岁的个人（二）获得任何SLaM服务（兰贝斯、南华克、刘易斯汉姆、克罗伊登等区），（iii）接受任何非有机、非精神障碍（急性和暂时性精神障碍除外）的第一个ICD-10指数初级诊断;ATPD），或CHR-P指定和（iv）与现有的联系方式被视为合格。在体内阶段，每周接触SLaM的新患者会自动接受精神病风险筛查，并检测出风险大于特定阈值的患者。研究小组随后联系了病人负责的临床医生，讨论进一步的建议，并最终建议进一步进行面对面的评估^。如果评估者被认为符合人权专员人权专员的P标准，则转介至专业人权委员会服务处，例如南伦敦的外联和支助服务（OASIS）^28。这将导致在精神病发作之前更好地发现个体，并为改变疾病过程提供重要机会。至关重要的是，这一可行性研究涉及将计算器完全集成到当地的EHR系统中，这是本文的主题。本可行性研究的完整方案，包括评估拟议研究计划概述、有关管理数据安全和道德问题的细节，已在我们以前的工作⁶中介绍。本文作为可行性研究^的一部分，有选择地介绍基于当地EHR数据的实时精神病风险检测和警报系统的技术实施情况。更具体地说，本研究的目的是调查此风险计算器的技术可行性，以便一旦患者获得二级精神保健服务，就会及时检测他们。可行性研究的全部结果，在临床医生遵守风险计算器的建议方面，将单独提出。对拟议研究的有效性进行全面评估，这需要随机设计，超出了当前研究计划的范围。据我们所知，这是第一种描述基于实时EHR数据的风险计算器实现的方法，用于早期发现精神病。

我们的心理精神病风险检测和警报方法利用了 CogStack 平台。CogStack 平台是一个轻量级、分布式且容错的信息检索和文本提取平台²⁴。该平台由三个关键组件组成：1）使用 Java Spring Batch 框架实时从预定义的数据源（结构化和非结构化 EHR 数据（如 Word、PDF 文件和图像）引入和同步数据到预定义数据接收器的 CogStack 管道;2）弹性搜索，一个搜索引擎，允许存储和查询EHR数据的完整文本，并提供各种应用程序编程接口（API），嵌入到引擎中的高级分析;和 3） Kibana，一个交互式的、基于 Web 的用户界面，允许用户在弹性搜索中查询数据，构建可视化仪表板，并设置对数据异常或其他感兴趣的模式的警报。此外，CogStack 还通过电子邮件和短信（文本）向临床医生发出警报，使临床医生能够及时收到风险计算器报告的高危患者通知。

我们利用 CogStack 平台，在 SLaM 基于 ePJS 提供基于 ePJS 的精神病风险检测和警报模型。与提供每周¹⁹日从 ePJS 上追溯访问非识别运行状况记录的机制的 CRIS 平台相比，SLaM 的 CogStack 平台能够实时访问可识别的 EHR，使警报更接近潜在设计的护理点和风险预测，尽管 CRIS 和 CogStack 平台都使用来自 SLaM 中的 ePJS 的数据。在以下部分中，我们提供了方法中关键步骤的详细信息，包括准备来自 EHR 的源数据、将源数据引入 CogStack 平台，以便通过弹性搜索实现全文搜索、使用 Python 守护进程线程运行精神病风险计算器，以及通过 Kibana 用户界面设置交互式可视化和实时风险警报。任何旨在构建基于 EHR 数据的实时风险检测和警报系统的研究人员都可以遵循该方法及其参考实现。如下所述，建议的方法利用了具有高灵活性和可移植性的开源、轻量级技术。这使得风险计算器能够在不同位置运行，并显示出对其他风险估计算法的高适用性。此外，该方法可作为增强嵌入在一般医疗保健系统中的 EHR 的风险检测和警报功能的简单方法。

Protocol

这项研究得到了英格兰东部的剑桥郡和赫特福德郡研究伦理委员会的批准（参考编号：18/EE/0066）。

注：我们基于 CogStack 平台和 Python 编程语言开发了此协议。此系统需要 Docker（更具体地说，Docker 积https://docs.docker.com/compose/）、阿纳康达 Python（https://www.anaconda.com/distribution/）和 Git（https://git-scm.com/downloads）预安装在设备上。此协议中提供的命令基于 Linux 环境。在下文中，我们提供了从 EHR 数据库准备源数据、将数据引入 CogStack 平台以及基于 CogStack 平台设置精神病的实时风险计算和警报系统的详细信息。此外，还开发了风险计算器的在线版本，以方便计算个人在http://www.psychosis-risk.net次精神保健中出现精神病的概率。

1. 源数据准备

注：在大多数用例中，CogStack 会从指定的数据库视图引入源数据，该视图可以合并来自一个或多个源数据库表的数据，其中视图是数据库中包含数据存储查询的结果集的可搜索对象。引入视图的设置由运行状况记录数据库系统的特定用例和部署设置定制。该协议是根据Fusar-Poli等人^14、21^,²¹日开发并经过外部验证的精神病风险计算器开发的，并作为试点实施可行性研究^的一部分。该协议基于与 Microsoft SQL Server 2014 一起部署的 EHR 数据库。

在现有的EHR数据库系统中创建一个视图对象（在该协议中称为"vwPsychosisBase"），以联接患者的必要信息，以便进行精神病风险计算和警报。确保这一观点包括所有接受非有机和非精神障碍初级诊断的患者（记录为《疾病和相关健康问题国际统计分类》，第十版[ICD-10]），如原始模型^14、21^,²¹所所定义。
确保该视图中的每一种记录都涉及三种类型的患者信息：1） EHR系统中患者的第一次初级诊断，包括ICD-10诊断指数（诊断集中在以下十个组：急性和暂时性精神病、焦虑障碍、双相情感障碍、儿童和青少年发病障碍、发育障碍、非双极性情绪障碍、智力迟钝、人格障碍、生理综合征、物质使用障碍）和诊断日期;2）患者的人口统计数据，包括性别、族裔和出生日期;3）患者护理团队的最新联系信息，例如普通科（GP）、顾问和护理协调员的详细信息。前两种信息对精神病风险计算器^14、21^,²¹至关重要，第三类信息是及时进行风险预警。
确保视图中的每个记录都有唯一标识符（例如，此协议中使用的"patient_id"。）。
选择与视图中记录相关的所有源信息的最后更新时间戳（例如，患者人口统计信息的最后更新时间和患者的第一个主诊断信息），并选择最新的时间戳作为视图中记录的最后更新日期和时间（在此协议中表示为"etl_updated_dttm"）。记录的最后更新日期和时间允许 CogStack 同步数据库中的更新，例如新记录和更新记录。

2. 数据引入

从 Github（https://github.com/cogstack-slam/psychosis）下载或克隆代码存储库，或在终端窗口中键入"git 克隆https://github.com/cogstack-slam/psychosis.git"。下载的文件夹包含用于部署 CogStack 实例的精神病风险计算和配置文件的代码。
转到"cogstack_deploy/cogstack/"目录并修改"精神病.属性"，以配置 CogStack 管道以进行数据引入。根据 EHR 数据库设置修改部分"SOURCE： DB 配置S"的设置，包括指定数据库服务器的 IP 地址、数据库名称、数据库用户名和密码。如有必要，修改视图名称（即"vwPsychoisBase"）和字段名称（例如，"patient_id"和"etl_updated_dttm"。）。在配置此文件时出错时，请按照https://cogstack.atlassian.net/wiki/spaces/COGDOC/pages/38043684/Quickstart中的说明操作。
转到"cogstack_deploy/公共/弹性搜索/配置/"目录，并修改"弹性搜索.yml"文件中的"xpack.通知.mail.帐户"部分，以配置用于发送警报的电子邮件地址。有关电子邮件配置的详细说明，请参阅https://www.elastic.co/guide/en/kibana/6.4/watcher-create-threshold-alert.html。
转到"cogstack_deploy/"目录并键入"docker-compose"以运行 CogStack 平台。使用根访问执行此命令。如果该过程成功完成，终端中将打印当前正在运行的服务的状态日志，包括 CogStack 管道、弹性搜索和 Kibana。因此，源数据库视图中的所有数据和更新都将及时引入到 CogStack 平台中称为"psychosis_base"的弹性搜索索引。
通过键入"http://localhost:5601/"（或将"本地主机"替换为运行 CogStack 平台的服务器的特定 IP 地址）打开 Web 浏览器并访问 Kibana 用户界面。首次访问 Kibana，请单击"管理"选项卡和索引模式选项卡，指定想要使用 Kinaba 访问的弹性搜索索引。在"索引模式"字段中键入"psychosis_base"，然后单击"下一步"。选择"时间筛选器"字段名称的"etl_updated_dttm"，然后单击"创建索引模式"为 Kinana 添加"psychosis_base"索引模式。
一旦 Kibana 连接到弹性搜索索引（即"psychosis_base"），通过"发现"页面以交互方式搜索和浏览源数据。Kibana 允许非技术用户同时搜索结构化元数据和免费文本。有关使用"发现"的详细说明，请访问https://www.elastic.co/guide/en/kibana/6.4/discover.html。

3. 风险计算

打开一个新的终端窗口，并转到"精神病/"目录。通过在终端中键入"conda 安装包名称"或"pip 安装包名称"，在风险计算器中安装所有必需的 Python 软件包（包括"弹性搜索"、"elasticsearch_dsl"、"熊猫"和"数字"）。
键入"蛇risk_calculator.py"运行精神病风险计算器。如果该过程成功完成，风险计算日志将打印在终端中，风险结果将存储在 CogStack 平台中称为"psychosis_risk"的新弹性搜索索引中。
使用 Kibana 接口检查风险结果。与步骤 2.5 和步骤 2.6 类似，添加新的索引模式"psychosis_risk"，将 Kinbana 与"psychosis_risk"索引连接起来，并通过"发现"页面探索风险结果。为了便于识别处于危险中的新患者，在构建"psychosis_risk"指标时，使用"first_primary_diagnosis_date"作为"时间过滤器"字段。在"发现"页中浏览数据时，请确保选择了索引模式"psychosis_risk"。

4. 数据可视化

除了通过 Kibana 中的"发现"页面搜索和访问个人级别的信息外，还可以构建可视化和仪表板，以全面了解高危患者的全体特征。为此，请单击 Kibana 的侧导航中的可视化。然后，单击"创建新可视化"按钮并选择可视化类型（例如，饼图和折线图）。选择"psychosis_risk"作为想要通过 Kibana 可视化的索引。默认情况下，可视化效果将在"psychosis_risk"索引中包含所有记录/患者。有关构建基巴纳可视化效果的详细说明，请访问https://www.elastic.co/guide/en/kibana/6.4/visualize.html。
要选择可视化数据的特定子集，请添加"筛选器"。例如，选择一个过滤器作为"h_2_year"，选择一个操作器作为"不在"和设置值从"0.0"到"0.05"将只包括患者的精神病风险在2年高于0.05。
生成单个可视化效果后，单击 Kibana 侧导航中的仪表板以创建一个仪表板，该仪表板一起显示一组相关可视化效果。单击"创建新仪表板"和"添加"按钮以创建新的仪表板面板。单击要在新仪表板面板中显示的可视化效果。单击"保存"并键入标题以保存面板。有关构建基巴纳仪表板的说明，请访问https://www.elastic.co/guide/en/kibana/6.4/dashboard.html。

5. 风险警报

单击 Kibana 侧导航中的管理，然后单击弹性搜索下的观察器，在患者有精神病风险时为临床医生创建警报。如果"观察程序"按钮不可见，请单击"许可证管理"并单击"开始试用版"或"更新许可证"。
单击"创建高级监视"以设置新的观察程序。键入"ID"和"名称"。删除"观看JSON"部分的内容，并将"观察者.json"目录中的内容复制到"观看JSON"部分。如果每 24 小时内有一个或多个患者的精神病风险高于 0.05（可行性测试的暂定阈值），此观察者将从"username@nhs.uk"（第 2.3 步中设置）向"clinician@nhs.uk"发送警报电子邮件（可以替换为要发送警报的电子邮件地址）。
在保存观察程序之前，单击"模拟"以测试观察程序执行。如果成功设置观察程序，则将看到打印模拟输出。如果设置中出现错误，请按照https://www.elastic.co/guide/en/elastic-stack-overview/6.4/watcher-getting-started.html上的说明操作。
要停止观察程序，请将其永久删除或暂时停用从观察程序的"状态"页。

Representative Results

在本节中，我们介绍实施结果，重点处理通过风险计算器阐述的实时临床数据流，并促进及时向临床医生交付预后结果。系统临床效用的评估，例如临床医生遵守风险计算器的建议，将在完成后提交单独的报告。

引入源数据
我们基于 SLaM 中 ePJS 的副本数据库部署了精神病风险计算和警报系统。此副本数据库每 10 分钟同步一次来自 ePJS 的实时数据。此副本数据库中构建了一个数据库视图，用于精神病风险计算的患者信息，其中每个记录包含患者的信息。此视图中的所有记录都实时引入 CogStack 平台（在具有 8 核 CPU 和 16GB RAM 的虚拟机中，每条记录约为 0.6 微秒）。直到2019年7月13日，当这份手稿编写时，202，289名患者的所有记录被引入CogStack进行精神病风险计算，存储在"psychosis_base"弹性搜索指数中。图 1显示了随着时间的推移引入 CogStack 的记录数，根据记录的最后一个更新日期按时间顺序排列。通过比较数据库中记录的数量和内容以及弹性搜索索引，没有发现缺失和遗漏的数据，从而证实了 CogStack 管道在数据引入和同步方面的可靠性。

风险结果的验证
为了验证本协议中精神病风险检测器的实现，我们将 CogStack 检测到的高危患者（称为"CogStack 版本"）与基于 CRIS 的原始风险计算器（称为"CRIS 版本"）检测到的风险患者进行了比较。由于没有为筛查高危病人^6、14、21¹⁴^,而制订⁶的门槛，我们在这里在两年内对精神病风险使用了5%的暂定阈值。²¹请注意，这个暂定阈值只是为了测试系统是否可以在 NHS 中实际工作，并且容易受到未来研究的变化的影响。在今后的大规模研究中，需要确定最佳检测风险个人的实际阈值。具体来说，我们首先检索到所有有精神病风险超过CRIS版本阈值的患者（患者N=169）。2018年5月14日至2019年4月29日，所有这些患者在SLaM接受了非有机和非精神障碍的第一次指数诊断。通过筛选在同一时间段内被诊断的患者，我们随后检索到的 N=170 患者在 2 年内患精神病的风险高于 CogStack 版本中的 0.05。最后，我们比较了两组患者之间的差异，其中两组唯一患者的总数为N=173。我们发现，161名患者（占173名患者中的93%）在这两个版本的得分相同。高度的一致证实了此基于 CogStack 的协议在生成风险评分方面的有效性。

在两个版本中有12名患者有不同的风险评分。通过检查患者的 ER，我们发现这种差异是因为在 CRIS 版本中计算风险分数后，这些患者的数据得到了更新。具体而言，虽然风险计算器中使用的预测变量（如出生日期、性别和自分配的族裔）是静态变量，但一些患者的健康记录在早期阶段对变量（例如未知族裔）有缺失或默认值，这些变量在稍后阶段输入或更新。这可能导致在两个不同阶段产生不同的风险分数。同样，根据这些诊断计算初始风险评分后，某些患者的第一个初级索引诊断无效。在这种情况下，风险计算器将查找此类患者的下一个有效主诊断，并重新计算风险评分。更新的风险分数也可能与初始风险分数不同。由于原始风险计算器基于 CRIS 中的回顾性数据进行研究使用，因此原始计算器管道没有同步 EHR 数据中的这些更新，并及时刷新风险分数。相反，如果更新了患者的任何源数据，患者的风险评分将在 CogStack 版本中重新计算，这使得此基于 CogStack 的计算器能够为患者提供最可靠和最新的风险评分。这些结果强烈强调了此协议中风险分数的可靠性。

结果可视化和风险警报
为了演示 CogStack 在数据可视化中的功能，我们构建了一个仪表板，用于获取有关精神病患者信息的信息。如前文用于可行性测试，我们选择那些两年内有精神病风险超过5%的患者为高危患者。图 2显示了精神病患者特征的可视化效果，包括患者的种族、性别、年龄和诊断类别。除了通过 Web 界面（例如 Kibana）可视化风险结果外，该协议还允许通过电子邮件等其他通知渠道向用户或临床医生发送风险警报。图 3显示了使用 Kibana 中的 Watch 组件设置风险警报服务的接口。成功配置此服务后，如果一个或多个患者在两年内出现精神病风险高于 5%，用户可以收到电子邮件通知。图 4显示了这些电子邮件通知的示例，该通知报告高危患者数量和这些患者区。由于需要做更多的工作来调整预测的精神病风险评分的传达方式，所以我们没有直接向临床医生发送风险通知。为了测试技术可行性，本研究中的所有通知都通过 SLaM 在安全网络中的电子邮件系统从技术研究人员（T.W.）发送给临床研究人员（D.O.）。通知中只包含患者信息的汇总统计信息;不包含任何个人身份信息。

图 1：引入 CogStack 的源数据。截至 2019 年 7 月 13 日，共有 202，289 条记录被引入"psychosis_base"弹性搜索索引，直方图显示随时间而引入的记录数量，按记录的最后更新数据时间排序。还可以查询结构化和非结构化信息，并获取与此页面中的查询匹配的搜索点击。请点击此处查看此图形的较大版本。

图2：精神病患者特征的仪表板（即，2年内精神病风险高于0.05）。（a）有风险病人的种族分布，其中外馅饼是内馅饼中种族类别的子类别。（b）病人性别分布、（c）每个诊断组病人年龄的分配及（d）每个诊断组的病人人数。请点击此处查看此图形的较大版本。

图 3：设置和模拟监视风险警报。请点击此处查看此图形的较大版本。

图 4：风险警报电子邮件的示例。每个临床委托组（CCG）中处于精神病风险的患者数量在括号中报告。请点击此处查看此图形的较大版本。

Discussion

我们展示了基于 CogStack（开源信息检索和提取平台）的实时精神病风险检测和警报系统的首次 EHR 实施。按照这种方法，可以将一组各种格式的临床数据（包括结构化和非结构化信息）转换为 CogStack 实例，从而实现全文搜索、交互式分析和数据可视化，以及实时提醒精神病患者。虽然最初的精神病风险计算器已经在几个NHS信托的试点研究中得到验证，尽管使用追溯性患者记录⁶^,^{6，14，21，}^,²¹这个实验设计提供了第一个证据基础，这个风险计算器可以复制和部署实时使用。这种方法允许通过现有的临床通知渠道（如 Email）实时自动将预后结果传送给临床医生。这清楚地表明了进行大规模有效性试验的技术可行性，以评估该风险计算器在现实世界中的最终临床效用。

该协议在经验上是创新的，因为不存在类似的精神病风险检测和警报系统。此外，该协议在临床使用中具有很高的通用性，特别是因为我们的方法具有独特的优势。从理论角度看，我们使用的风险预测模型是基于 SLaM NHS 信托的大型回顾性去识别队列而开发的。SLaM 为伦敦南部 136 万人口提供二级精神卫生保健，是世界上精神病记录最高的国家之一。这个庞大的群体在社会人口和诊断特征上具有很高的多样性，使我们能够开发一种风险预测模型，这种模式不太可能偏向具有特定特征的人口。这有证据支持，证明这个风险计算器的预后准确性已经在两个不同的数据库^14，21^,²¹中复制了两次，包括一个SLaM以外的数据库。这种风险模型的另一个理论优势是，将基本的人口统计和临床诊断信息用作预测变量。这些信息在电子临床数据中无处不在，事实上，这些预测变量的缺失数据在^{我们以前的研究中}^,已证明比较少^见。建筑预测器的信息可用性很高，因此可以在不同二级精神卫生保健部门的大量患者样本上运行风险计算器。此外，风险计算器是一种通用算法，适合所有处于二级精神卫生保健中出现精神病风险的个人，而不论个人的年龄如何。也就是说，这个计算器不仅适用于15-35岁范围的峰值精神病风险^16，但也适合那些超出这个范围的人，表现出高度的通用性。

从实际角度来看，风险计算器和 CogStack 平台都是轻量级和开源服务，不涉及资源量大的技术或昂贵的基础架构。这种低成本且易于部署的平台可以减少在真实临床环境中采用该平台的障碍。此外，我们的解决方案克服了主要实施障碍：除非临床医生在日常实践中使用风险估计系统^，否则它们几乎没有价值。具体来说，我们的方法从 EHR 访问数据，独立于电子医疗记录系统执行分析，并可通过现有通知渠道将分析结果发回临床医生。此方法不要求修改预先存在的系统中的业务逻辑，并且可以作为独立服务支持和扩展现有的临床决策支持系统。因此，该协议与已有的临床系统具有很高的兼容性，并可轻松集成到常规临床实践中。此外，该协议提供了用户友好的界面，用于搜索、分析和可视化临床数据，使临床医生能够轻松解释和探索风险结果。

此协议也有其局限性。首先，在常规临床实践中尚未评估该协议的有效性。本研究侧重于在本地 EHR 中实施实时精神病风险检测和警报系统的技术可行性测试。为了进一步评价该系统在常规临床实践中的有效性，未来需要大规模随机对照试验^。第二个限制是，此协议中的风险分数预测基于第一个主诊断，即在单个快照中收集的静态数据。然而，CHR-P症状是随时间演变的内在变化。一个动态版本的精神病风险计算器，其中预测模型可以动态更新，以反映变化，最近已经开发^26。今后的工作将侧重于将这个动态计算器集成到当前协议中。

此方法中最关键的步骤是确定用于风险计算器中提取预测变量的 EHR 数据。这还可能涉及创建数据元素映射，当 EHR 系统使用的数据模型不同于该协议中使用的数据模型时，例如针对患者种族的不同编码系统。我们有开源的所有代码和映射定义在线（https://github.com/cogstack-slam/psychosis）。根据这些材料，可以根据自己的情况复制部署或调整计算器。另一个关键步骤是在 CogStack 中创建用于数据引入的数据库视图。由于弹性搜索中的关系联接操作（即合并来自一个或多个数据库表的列）可能会导致高计算成本，因此我们通过创建数据库视图在 EHR 数据库中执行这些联接操作。此视图将提取风险计算器中预测变量所需的所有信息以及 CogStack 管道用于数据引入的数据分区的两个重要字段相结合。第一个字段是视图中的每个记录的唯一主键（"patient_id"使用此协议），第二个字段是最近修改记录时的时间戳。如果这两个字段设置不正确，CogStack 可能无法及时同步 EHR 数据库中的数据更新。有关 CogStack 数据引入故障的详细说明，可在https://cogstack.atlassian.net/wiki/spaces/COGDOC/overview和https://github.com/CogStack/CogStack-Pipeline上提供。

此协议可高度可传输，可轻松部署在具有 CRIS 或 CogStack 平台的 NHS 信托中。到目前为止，CRIS平台（包括同意程序）在其他地方已得到充分描述，并在英国12个NHS信托机构进行扩展，利用超过200万个已解鉴定的患者记录（https://crisnetwork.co/）。同样，CogStack 平台不仅部署在 SLaM 中，还部署了英国其他 NHS 信托机构，如伦敦大学学院医院（UCLH）、国王学院医院（KCH）、盖伊和圣托马斯（GSTT）以及默西护理 NHS 信托。那些没有平台的信托可以使用在线版本的风险计算器（http://psychosis-risk.net），或基于本手稿和我们的在线文档从头开始构建此协议。尽管此协议是为精神病风险检测而开发的，但此协议的体系结构设计并未与此特定用例相关联。该协议非常灵活，能够重新配置和重新利用实时监测和警报组件，用于其他风险测量领域，如药物不良反应，从而使临床医生能够及时采取行动，改善患者护理、安全和经验。

Disclosures

作者没有什么可透露的。

Acknowledgments

这项研究由伦敦国王学院概念信心奖（MRC）（MC_PC_16048）直接输出到PFP。RD和AR得到以下组织的支持：（a）莫兹利慈善机构;（a）（b）伦敦南部国家卫生研究所生物医学研究中心和莫兹利NHS基金会信托基金和伦敦国王学院;（c）英国卫生数据研究部，由英国医学研究理事会、工程和物理科学研究理事会、经济和社会研究理事会、卫生和社会护理部（英格兰）、苏格兰政府卫生和社会护理局首席科学家办公室、卫生和社会护理研究与发展司（威尔士政府）、公共卫生局（北爱尔兰）、英国心脏基金会和韦康信托基金资助;（d） BigData@Heart联合会，由创新药物倡议-2联合承诺根据第116074号赠款协定供资。这项联合承诺得到欧洲联盟地平线2020研究和创新方案和EFPIA的支持;由DE Grobbee和SD Anker担任主席，与20个学术和行业合作伙伴以及ESC合作;（e）伦敦大学学院国家卫生研究所医院生物医学研究中心。这些供资机构在设计研究、收集和分析方面没有作用。所表达的意见是提交人的观点，不一定是国民保健制度、国家人权系统或卫生部的意见。

Materials

Name	Company	Catalog Number	Comments
CogStack-Pipeline	King's College London		Open source software
Elasticsearch	Elastic NV		Open Source Search & Analytics
Kibana	Elastic NV		Open source data visualization plugin for Elasticsearch
Python packages ("elasticsearch", "elasticsearch_dsl", "pandas" and "numpy")	Open source community		Open source packages