华山医院(试水人工智能,如何填补从数据到临床应用的空白区())
专题速览
2019年
第二期
文章图片
文章图片
文章图片
文章图片
<<滑动查看下一张图片>>
这是专题
第2篇文章
全文字数:2800余字
文章图片
文章图片
黄虹
复旦大学附属华山医院信息中心主任
大数据预测分析是基于大数据的一个应用方面,预测分析当然本身也非常可能用到人工智能的三大基石之一——算法,而人工智能的另一个基石就是数据。因此两者可以说是互相依存、不可分割。大数据预测侧重数据的宽度和广度,以及对现实世界的认知、验证,以及认知体系本身的完善和表达,人工智能侧重算法的高效和算力的支撑,两者的结合,会有效加快智慧医疗的步伐。
在华山医院的CDR(临床数据仓库)基本建设完备后,医院的临床数据量就一直在高速增长着,如今已经成为一个海量的大数据仓库。
作为华山医院信息中心主任,我一直思考着一个问题——如何才能让这些数据更好地为临床科研和医院管理进行服务,发挥出这些数据的真正的价值?
填补从数据到临床的空白区
我们都知道,目前关于CDR有几个不同的定义:
根据HIMSS标准,CDR是一个为医疗执业者提供患者临床信息实时事务处理的数据库;Gartner则认为,CDR是一个以患者为中心、颗粒化的健康数据集合体,其数据通常收集自多源的IT系统,用以支持多重应用。一般认为,CDR是一个整和各种临床来源数据的实时数据库,用以统一方式呈现患者个体数据视图。它为医师提取单个患者的数据而优化,而不是为识别患者群体的共同特征或者促进特定临床科室的管理而优化。
总而言之,CDR就是临床数据库。
关于它的突出特性,我根据华山医院的实际情况,做了以下归纳总结:
(1)CDR集成了实时的院内各子系统数据;(2)是以患者为中心的,具有时间轴,面向医生的诊疗过程和流程的。
而对于临床大数据平台,我对数据的管理和应用要求做了如下总结:
(1)大数据采集汇聚——多源异构数据的采集与汇聚;
(2)大数据治理——以统一的数据标准对多源异构数据进行归一化处理;
(3)大数据计算——大数据计算的基础环境和功能;
(4)大数据挖掘分析——多源、异构数据的挖掘和分析;
(5)大数据利用——以医生和管理者为核心,对医疗服务、科研管理、医院治理等的辅助决策支撑应用。
很明显,目前的CDR和真正的临床大数据应用平台之间,还有一段空白需要填补,作为医院信息化系统的建设者和管理者, 我认为面对要求,CDR的建设目标和方案是很难满足的,这也是正是医院的信息中心和临床应用之间难以直接对接的主要原因。 我一直在思考如何填补上这段空白。
与此同时,我院神经外科的孙一睿博士,却在为临床科研缺少数据和分析工具而发愁。
根据他以往的经验,对于临床数据的的研究流程共分为6步:业务理解、数据理解、数据准备、数据建模、结果评估,以及模型部署等。 在传统流程中, 完成6步的总时长通常接近40周,也就是10个月的时间。在这近10个月的时间里,研究者相当长的时间是在等待专业数据分析人员的协作。这项工作繁冗复杂,从选取和清洗数据,到构建、整合和完成标准化,通常需要花费3~4个月的时间。但难度更大的环节是数据建模。研究者需要精通数据库分析和统计学软件,并且常常需要数名经验丰富的专家协助。面对日益增长的临床业务和指数式增加的临床数据,孙医生也意识到,他需要更简单、高效的临床数据治理和分析手段,来对接医院庞大的临床数据仓库,真正发掘出这座金矿的价值。
试水人工智能辅助诊断技术
来自信息部门和临床科室的共同的需求终于碰撞出火花。
在2018年,由我院医院神经外科周良辅院士领衔,在毛颖副院长、信息中心、以及神经外科急救中心胡锦教授、孙一睿博士的多方支持下,经过大量前期调研方案对比,将人工智能辅助诊断技术融入了神经外科的急诊业务流程,而首个测试项目,就是危重患者的凝血功能异常预测。
急诊外科疾病的救治过程中,围手术期凝血功能障碍是最重要且普遍的病理生理改变。 我们将“凝血功能危险因素分析”作为了首个研究项目,原因有三个: 一是凝血功能障碍在神经外科急诊发病率为30%,二是脑外伤后发生率为40%~80%——这一高发病率为研究者带来了第三点——充足的数据量。 更具有临床意义的是,对凝血功能障碍的早期干预可以改善患者预后。
孙一睿博士选择了将2015年~2017年的临床数据作为首轮机器学习的对象,此前至2002年间的数据则作为验证对象使用。两轮数据共涉及11,232例急诊手术,超过300万条数据,覆盖了500余项评估内容。
首轮机器学习的结果显示,抗凝药服用史、性别和年龄并不明显影响围手术期(围绕手术的一个全过程)的凝血功能——在传统知识体系中,这些被列为影响神经外科急诊患者凝血功能异常的重要因素。
在前五大因素中,它们分别排名第一、第四和第五。 取而代之的实际影响因素更为复杂。 数据分析结果显示,包括人口学本特征、心肝肾等功能、药物干预、体温、酸碱平衡……其中,肝功能、肾功能和感染是主要风险因素。
利用我院信息中心搭建的大数据平台和分析系统,孙一睿博士成了Gartner所描述的“平民数据科学家”——他们本职工作可能是业务分析师、BI工程师、IT工程师,并不研究算法,但是会利用和创建统计分析模型来完成业务分析。
未来,华山医院的临床科研人员无需等待冗长的数据分析过程,通过便捷的自助式数据探索,可以实现“一键建模” ,及时发现临床、诊疗和住院等数据中潜藏的关联和模式——就像孙一睿博士在“凝血功能危险因素分析”中发现抗凝药物并非凝血功能异常的首要因素那样。同时,医学工作者将可以根据自身兴趣和研究方向,随时发起一场前无古人的探索,对数据的预测分析,将在几秒钟内为研究者证实或证伪每一项预判,并启迪研究者继续深入关乎生命的研究。 大数据已经开始影响到关乎每一个人的医学的研究模式,大数据预测分析工具的出现,帮助人们在“逼近真相”的方向上向前迈出了一大步。
在医学研究领域,人们很容易理解这一步的价值,它关乎生命,毋庸赘言。在信息中心,从系统支撑服务向数据服务也在努力做出转型。我们根据这个研究主题,对原有的数据分类做了重新设计,传统的数据中心的设计方法更多的是按照来源进行分类,很少基于数据服务对临床数据进行再分类和再加工。我们针对出血评估这一对外科医生迫切需要的工具,按照临床主题即患者来源、检验、就诊记录等内容做了二次分类和索引,并启发我们在数据管理方面有效地从CDR1.0向2.0过渡。 1.0专注数据的大而全,2.0专注数据的精细和效率。 同时,在数据利用的过程中,不断检测生产系统的数据产出质量,对检验系统、患者就诊系统、电子病历等系统做了相应的改进, 一定程度上带动了系统改进从需求驱动向“需求驱动+数据驱动”的转型 。同时,由于提升了临床数据的细分,医院病种库的效率也从原先几天到一天甚至几小时就能建立一个病种库。 大数据预测分析最初在行业中被视为生产力工具,现在随着其价值在医学研究领域的显现,它已经变成了一种拯救生命的工具。 医院信息部门和临床部门的紧密结合是发掘医院临床数据金矿的必由之路。
专题相关文章推荐
专题预告!与临床一起,探索医疗人工智能的可能性
轮值主编王奕:人工智能,是一种追求
专题 收藏版! 辩证 解读 医疗信息化建设应如何借力临 床思维
文章图片
读懂FHIR:通向未来医疗的重要路径 ——HL7的发展及FHIR的意义和价值
文章图片
-END-
微信改版
星标/置顶 e医疗
深度好文不迷路哦~
文章图片
【华山医院(试水人工智能,如何填补从数据到临床应用的空白区())】
近期专题推荐点击阅读
文章图片
“医疗信息化十年——2008到2018”系列专题同时刊登在2018年第6期和2019年第1期上,欢迎订阅(后台回复“订阅”获取订阅方式)。
特辑收藏版!医疗信息化十年
专题收藏版!辩证解读医疗信息化建设应如何借力临床思维
“安全+”专题数据质控“相对论”新旧IT
DRGs医学影像信息化变革的起点
医学装备智能化
CHIMA第三届委员名单
琚文胜:以色列数字医疗考察记
三级公立医院绩效考核启动
专题:医疗IT青年人的风采
聚焦医疗大数据建设发展
……
更多专家和主题
请在菜单栏“搜往期”输入关键字查看。
杂志订阅
微信后台回复“订阅”获取订阅方式
?以上文章来源
e医疗原创文章,转载请注明来源。
文章图片
推荐阅读
- 见习生
- 呼市首大医院温馨提示(男人有啥也不能有“qian”)
- 停车难
- 《医疗事故》
- 从某医院副院长拒不戴口罩被保安视频曝光事件看当前物业管理水平
- 检查骨龄一定要到正规医院
- 关爱父母,从小病开始
- 杭州杭城皮肤病研究院好不好(正规医院全面保障你的皮肤健康)
- 读《别让医院蒙了你》随想
- 随笔(二零八)|随笔(二零八)|医院