什么是结构化电子病历
结构化电子病历的特点及优势
结构化电子病历(Structured EMR)在数据处理上和上一代电子病历(非结构化电子病历:Non-Structured EMR)有本质的区别。
在非结构化电子病历系统中,除了表格式数据外,所有的医疗文书都以文本的方式保存到数据库中。
这些文本包括plain text或带格式的文本。
随着XML技术的出现,一些非结构化电子病历也以XML的方式保存数据。
那么结构化电子病历和非结构化电子病历最显著的区别在哪里呢?
1.1 结构化电子病历的定义
结构化电子病历是指从医学信息学的角度将以自然语言方式录入的医疗文书按照医学术语的要求进行结构化分析,并将这些语义结构最终以关系型(面向对象)结构的方式保存到数据库中。
由于医学信息学上关心的医学术语都是以关系型(面向对象)结构的方式保存在数据库中,在医学数据的处理过程中,可以采用关系型(面向对象)的计算方法对医学数据进行整合计算,从而为电子病历的衍生功能,如临床路径(Clinical Pathway)打下一个非常好的数据基础。
由于结构化电子病历是以关系型(面向对象)结构保存到数据库中,其元数据包含各种数据类型,如表示时间的datetime类型,表示长度、体积的float类型,甚至还可以是自定义的数据类型。
这样在后期的数据挖掘分析模型中,不仅会有医学术语(Measures),
如发病周期,肿瘤大小等,还包括度量这些医学术语的指标值,如时间,大小尺寸等,这样就可以根据实际需要构建数据挖掘的立方体(CUBE),从而为临床数据分析和挖掘使用。
例1:如果描述一个‘胸部疼痛3日’病症的句子,我们就按照词语的类别,把它划分为‘胸部’(名词)、‘疼痛’(动词、行为短语)、‘3’(数词)和‘日’(单位名词)4个部分。
‘胸部’是这一句话中描述‘身体部位’的元素,‘疼痛’是描述‘症状’的元素,‘3’是‘数值’元素,‘日’是‘时间单位’元素。
那么如图1.2所示,我们应该可以在相应的元素分类中找到这些元素(假设这些元素已经定义好了)。
这样按顺序组成一个复合元素:‘{身体部位}{常规症状}{数字}{时间单位}’,然后再把该复杂元素添加到病历模板中,在使用该病历模板时选择和填写相应的项,效果如图1.3:
图 1.3
选择红色框的词语,并且在{数字}的位置上填写‘3’(在这个位置上只能输入数字和小数点)就可以组成需要的语句【】了,当然您也可以组成‘头部红肿28小时’等语句。
如果我们添加两个这样的复杂元素到病历模板中就能组成‘胸部疼痛3日,头部红肿28小时’的句子。
这样就避免了用词的随意性,给今后的数据收集、研究提供了方便。