当前位置:文档之家› 电子病历的智能化研究现状

电子病历的智能化研究现状

电子病历的智能化研究现状
随着社会的快速发展和进步,人们的物质文化生活水平和质量也在不断提高。

在满足基本的吃穿住行之余,人们对健康的关注程度也越来越高。

值得一提的是,近几年来计算机应用技术和理论在医学方面的应用尤为显著,尤其是2009年3月中共中央国务院颁布的《关于深化医药卫生体制改革的意见》当中明确指出:建立实用共享的医药卫生信息系统,以建立居民健康档案、医院管理和电子病历为重点大力推进医药卫生信息化建设。

在当今大数据的时代,数据起着无可比拟的作用,而对于医药卫生信息系统而言,电子病历作为基础数据在当中扮演着极为重要的角色。

电子病历(Electronic Medical Record,EMR)是医务工作者在疾病诊疗的过程中,将采集到的病历情况记录转换成一些数字化的信息,从而实现对病人病历进行存储、统一管理等的医疗记录。

众所周知,电子病历是一种极其有价值的医疗知识资源,它当中包含了大量准确、详细并与患者健康状况密切相关的信息,以XX大学附属第一医院的一份中文电子病历为例,其主要包含了病人的病例特点、诊断依据以及诊疗计划等重要信息。

图1.1展示了一份中文电子病历数据样本。

因此,通过对中文电子病历完成命名实体识别、实体关系抽取以及语义搜索等任务来全面获取和分析病人自身详细的医疗知识信息。

通过这种方式,广大用户可以通过系统咨询自身的健康状况。

此外,更为
重要的是,利用获取到的相关医疗知识信息可以辅助医务人员对病人的诊断治疗以及帮助相关研究者构建临床决策支持系统。

该课题不仅响应了《关于深化医药卫生体制改革的意见》中的号召,并在一定程度上对推进医药卫生信息化建设有着重大的意义。

命名实体识别
针对医疗这一特定的领域,二十世纪末,国外就开始了医疗信息
化的研究。

因此,国外已经具有相对国内而言比较成熟的大型医疗语料库以及相关研究方法。

更为重要的是,国外还建立了一套一体化医学语言系统(The Unified Medical Language System,UMLS)。

2008年,Li等人对比了面向英文电子病历的条件随机场模型和支持向量机模型进行命名实体识别研究的结果,最终实验结果表明条件随机场模型相较于支持向量机模型取得了较好的结果。

2011年,de Bruijn等人在引入UMLS的基础上采用Self-Training模型进行命名实体识别研究,其最优结果达到了85.23%。

2012年,Jonnalagadda[等人采用条件随机场模型对英文电子病历中的医疗问题、检查、治疗这3类实体进行识别,其F值达到了0.82
目前,电子病历的发展在我国面临着缺少统一的标准和规范、法律地位尚未确定、应用层次比较浅等问题。

因此,国内针对医疗领域的命名实体识别研究仍处于起步阶段。

2011年,叶枫等人利用条件随机场模型识别中文电子病历中的疾病、疾病症状、检查手段这3类实体,其最佳F值分别达到了92.67%、93.76%和95.06%。

但是该模型识别出的实体种类较少,且训练集和测试集规模较小,覆盖面不够广泛,影响力不大。

2014年,张立邦等人采用改进后的Bootstrapping算法识别疾病实体时,效果达到了0.93,但是在识别治疗和药品等实体时,效果还不到0.3。

同年,Wang[等人采用隐马尔可夫模型和条件随机场模型构建了11613条病人自诉症状实体标注语料,但是该研究抽取的实体更为单一,实用性不高。

实体关系抽取
针对医疗这一特定领域,2010年,I2B2(Informatics for Integrating Biology&the Bedside)组织了与实体关系抽取相关并最具有代表性的评测--概念识别及关系抽取评测,而实体关系抽取研究是该评测中的一个子任务。

基于该评测任务,大量研究人员针对实体关系抽取任务展开了一系列的研究。

2010年,Demner-Fushman等人通过引入医疗词典资源和UMLS大大提高了实体关系抽取的效率。

2011年,Bruijn[13]等人采用支持向量机的方法并针对不同的实体关系训练了不同的分类器以此来提高实体关系识别的效果。

2015年,Kim[14]等人通过基于树核函数的方法来进行实体关系抽取研究,且其实验结果较好。

目前,国内针对医疗领域的实体关系抽取研究相较于国外而言起步较晚,尤其是在电子病历方面的研究更是少之又少。

2012年,Miao Q等人采用条件随机场模型对医学领域实体间的关系进行抽取,其最终F值超过了75%。

2016年,程健一采用了特征与树核函数相结合的方法对中文电子病历中的实体关系进行抽取,其最终F值为75.9%,但是存在少许实体关系抽取结果比较低。

2018年,基于中文电子病历的特点,牧扬子将命名实体识别和实体关系抽取视为联合任务来抽取实体关系,显著提高了半监督学习模型的抽取效果。

从以上的分析我们可以得出,国内相较于国外而言对于电子病历的研究还不够广泛深入,面向中文电子病历的命名实体识别和实体关系抽取的公开
研究成果也比较少。

因此,对于该方面还需要研究者们进一步的研究和探索。

相关主题