当前位置:文档之家› 时间序列数据挖掘在医疗领域的应用

时间序列数据挖掘在医疗领域的应用

时间序列数据挖掘在医疗领域的应用
摘要:医院信息管理系统,不仅有利于提高了医务工作者的工作效率,同时也积累了大量的时间序列数据。

时间序列数据挖掘技术对这些大量数据进行分析,会发现有用的、潜在的知识为开展高水平医学研究提供了有力的技术工具。

对历史数据进行分析的同时能预测出未来的相关数据,为医院管理人员作出正确决策提供了依据。

因此对医院信息系统中时间序列数据挖掘的过程以及所应用的技术深入研究,能充分发挥数据挖掘在医疗领域的作用。

关键词:时间序列;数据挖掘;医疗领域
0 引言
医院利用医院信息系统(Hospital Infmation System,HIS)进行管理,不仅提高了工作效率,而且会积累大量的时间序列的数据。

时间序列中记录了信息系统各个时刻的所有重要信息。

利用时间序列数据挖掘技术在庞大的数据中发掘有用的知识,充分利用这些知识,可以为广大患者提供更有效的服务;发现时间序列中对象演变的特征或对象变化的趋势,有利于管理者发现医院运作的基本规律,预测医院发展的趋势,合理、科学地规划医院的发展方向。

1 时间序列数据挖掘
时间序列数据挖掘(Time Series Data Mining, TSDM)就是从大
量的时间序列数据中, 提取隐含在其中的、人们事先不知道的,与时间属性相关的、潜在有用的信息和知识的过程。

研究内容包括相似性搜索、趋势分析、时间序列模式挖掘和周期模式挖掘数据。

时间序列数据挖掘技术是一门综合性的技术领域,主要涉及数据库、人工智能、数理统计等众多领域的知识,属于复杂型的数据挖掘,对科技、人类
社会的发展有重要意义。

时间序列数据挖掘过程分4步进行:①确定挖掘对象:在这个步骤中要充分理解挖掘的应用领域,并确定研究问题的目标对象,熟悉解决问题的方法,理解相关领域的知识,确定数据挖掘结论的评估标准;②准备数据:选择适合挖掘、具有时间序列特征的数据,并将其搜集整理成一种统计数据。

由于数据冗余性的特征,需要进行整理,清洗不完全的数据来削减数据。

数据具有多样性要求对数据要采用相应的方法进行预处理,转换原始数据为数据挖掘所需的数据形式;③数据挖掘:对经过转换的数据选择合适的模型,确定训练与检验程序,建立模型与评估标准;④评估知识:对数据挖掘的结论进行解释,与研究目标进行比较。

发现数据挖掘过程中可能存在的错误步骤,并且寻找解决方法;⑤知识的应用:在应用知识的过程中随时总结和发现
实施过程中出现的问题,并解决问题,指导日后的实际应用。

2 时间序列数据挖掘技术
(1)时间序列预测法。

时间序列预测法是将某种统计指标的数值,按时间先后顺序排列所形成的序列。

对时间序列进行编制和分析,根据时间序列所反映出来的发展过程、趋势和方向,进行延伸或类推,
借以预测下一段时间或以后若干年内可能达到的水平。

分析时间序列的变化特征,建立以数学公式形式表示的预测模型对时间序列进行趋势分析或预测,利用模型推测未来状态。

通常采用的模型有基于人工神经网络的时间序列预测模型、ARIMA模型、移动平均法、一元回归、灰色模型、指数平滑法等。

任何一种模型对实际研究对象的简化和抽象,都会有局限性和不完备性,采用组合预测可以提供预测精度。

目前多采用最优加权组合预测法,即利用多种预测方法,选取合适的
权重系数经过加权平均得出组合预测模型。

(2)时间序列相似性搜索。

时间序列相似性搜索就是通常就是比较两个序列的时间多项式,找到两者之间的偏移量,再对比所采用的相似性度量,最后判断该两序列是否相似及其相似程度。

该技术包括预处理和查询两个阶段。

通过采用维数约简技术将高维的时间序列映射为低维空间上的特征表示,达到降低维数的目的;然后再进行查询比较。

(3)时间序列模式挖掘。

时间序列模式挖掘的研究对象主要是符号模式,目的是从时间序列数据库中找出频繁出现的子序列。

采用Aprior算法可以利用候选模式产生机制来发现频繁的序列模式;使用投影树技术以及将原始数据库划分为特定模式的子数据库的方式来发现序列模式;将频繁序列分解成若干等价类,通过使用垂直的数据
库方式来发现序列模式。

(4)周期模式挖掘。

以一组分片序列为持续时间的序列模式挖掘。

3 在医疗领域的应用
(1)DNA分析研究。

运用相似性搜索法是从事DNA分析研究工作的主要手段。

将从数据库中检索出的样本,构造出患者的基因序列组和健康组织的基因序列形成对照组,采用相似性搜索法对两者进行比较以识别出两类样本间的主要差异或找出每类中频繁出现的模式。

分析得到的模式,在带病样本中出现频度超出健康样本的序列可以认为是导致疾病的基因因素;而在健康样本中出现频度超出带病样本的序列,可认为是抗疾病的因素。

(2)疾病发展变化趋势分析。

利用长期积累的相关疾病的登记资料,采用时间序列预测方法中的趋势外推法、指数平滑法、ARIMA 模型等,分析相关疾病的发展趋势;并比较各种方法的预测精度,赋予不同权重,建立组合预测模型,为疾病的防治策略提供科学的依据。

(3)药品用量预测。

现在,大中型医院药房已在使用计算机进行管理。

在实际应用中现有医院药品管理软件很难合理、科学地管理药品采购。

常见软件通常采用高低限量的系统模式,即当药物储备量库存低于低限时系统自动生成采购单,采购量=高限量一现存量。

然后,药房管理人员在根据工作经验制定采购计划。

但药物都有药效期,超量购进致使药品浪费,量少又不能满足需求。

利用时间序列预测法可以对药品管理系统中现有的药品用量信息进行计算机模拟,构建药品消耗模型。

根据医院药品实际消耗情况自动对药品需求量进行预测,有效克服药品的积压和断货现象,满足临床用药需求,提高药品
采购管理的合理性、科学性。

(4)医院资源优化配置。

医院在不同时间段内的医院投入与产出不同, 通过分析不同时间段的特征可以合理地运用流动资金, 使得医院资金配置得到了优化。

利用周期模式挖掘分析不同时间段各个科室的床位占用情况,对医院的床位进行动态分配, 使得床位资源在不同的时期, 在不同科室之间进行合理分配, 提高床位的周转率,优化了医院的资源。

4 结束语
时间序列数据挖掘已成为数据挖掘领域中比较复杂的一个分支,随着数据挖掘技术的发展和医学研究的深入,国内外医学界正在寻求借助时间序列数据挖掘技术解决医学科研及医院管理问题的途径。

虽然目前时间序列挖掘技术在医疗领域的应用尚处于起步阶段,但随着该方法在医疗领域的日益重视和普及,其必将在医学领域得到更加广泛的应用。

参考文献:
\[1\] 崔雷. 医学数据挖掘\[M\].北京:高等教育出版社,2006.
\[2\] 贾澎涛. 时间序列数据挖掘综述\[J\].计算机应用研究,2005(5).
\[3\] 张松,张军勇,祝扬,等.数据挖掘在医疗管理领域中的应用\[J\].解放军医院管理杂志,2005(8).
\[4\] 张世红.数据挖掘在医学上的应用\[J\].医学情报工作,2004(3).
Application of Time Series Data Mining in the Medical Field
Abstract:
At present, hospital information management system has been widely used in the hospital management which not only help improving the efficiency of medical workers, but also accumulated a great deal of time series data. When time series data mining techniques analyze these large amounts of data, you will find that the useful and the potential knowledge will provide a powerful technology tools for conducting high-level medical research. Analysis of historical data can predict the future, while the relevant data is provided for hospital administrators to make the right decisions. Therefore, the time-series data mining process in hospital information system and the in-depth study in application of the
technology can give full play to the role in the medical field.
Key Words: Time Series; Data Mining; Medical Field。

相关主题