当前位置:文档之家› 时间序列相关算法概要

时间序列相关算法概要

时间序列相关算法
面向瓦斯检测数据的时间序列相似搜索算法研究
赵 华 (西安科技大学硕士论文
1.3 时间序列相似搜索发展趋势
总结现有的基于时间序列相似搜索的各种变换方法可以得出时间序列相似搜索
问题的发展 方向及趋势。从最初时间序列相似性点对点的比较,到 DFT 和 DWT 等
方法的数据变换, 再到时间序列等长分段后处理的方法, 再发展到几种方法结合使
用。 时间序列相似搜索的算 法可以是线性变换,如 DFT 、 DWT 等,也可以是非线
性变换,甚至可以分段处理,以关 键特征代替原始序列。

提出了基于分段多项式表示 (PPR, Piecewise Polynomial Representation 的煤矿
瓦斯监测数据 相似搜索方法和基于二维小波变换的煤矿瓦斯多变量时间序列相似
搜索方法

提出了基于分段多项式表示 (PPR, Piecewise Polynomial Representation 的煤矿
瓦斯监测数据 相似搜索方法。

提出了基于二维小波变换的煤矿瓦斯监测数据的多变量时间序列相似搜索算
法。 将瓦斯多变 量时间序列存为数据矩阵形式, 采用二维小波变换方法对数据矩阵
降维, 并用灰度图像把多 变量时间序列可视化, 再用欧式距离和 Eros 距离进行相似
性比较, 并分别求出它们的查询 效率。

(本篇文章是用于瓦斯涌出量的分析, 不是危险源头的辨识, 但是关于时间序列
数据的处理 可能有用,相当于缩短搜索时间的方法。

基于云模型的时间序列相似性度量方法
时间序列的相似性度量就是衡量两条时间序列之间的相似性 , 是时间序列的查
询、分类、预 测的基础 , 广泛应用于时间序列的聚类、分类和分割等研究领域。一
种有效的相似性度量能 够提高数据挖掘的效率和准确率。

欧氏距离
欧氏距离、动态时间弯曲 (伪 h 翻 iciTm 。认厄 rpign, 简称 DTW 距离和形态
距离是时间序 列相似性度量的经典度量方法 , 这几种方法在在某些方面都有各自的
优势 , 但是它们在应用 到实际的时间序列数据挖掘上有其固有的缺陷。本文在基于
这些经典的相似性度量方法的 基础上结合云模型的方法理论 , 提出了一种基于云模
型的时间序列相似性度量方法。

欧氏距离是时间序列相似性研究中最广泛采用的相似性度量。它的优点是计算
简单 , 容易理 解 , 运行速度快 , 广泛应用于时间序列的聚类和分类等研究领域。然
而欧氏距离测度存在一些 局限性 , 例如对数据在时间轴上的形变缺乏辨识能力和对
噪声的鲁棒性不好 , 对数据中的扭 曲现象非常敏感 , 且要求两个时间序列长度一样 ,
因此应用范围也受到限制。

DT 份距离
D 伴可以有效的消除欧氏距离的缺陷 , 支持时间序列的时间轴伸缩 , 根据最小
代价的时间弯曲 路径进行对齐匹配 , 且 DT 甲距离不要求两个序列的长度一样 , 序
列的值可以是一对多 , 或多对 一 , 比较灵活。

形态距离
形态距离在很大程度上受到 PLR 模型表示的影响 , 若 PLR 模型对原时间序列
的表示存在较 大的误差 , 会引起形态距离度量上的偏差。

云模型
在众多的不确定中 , 随机性与模糊性是最重要的。为了统一刻画模糊性和随机
性 , 李德毅提出 了一种定性与定量之间转换的模型一云模型 , 并研究了随机性与模
糊性以及两者之间的关系 , 其已成功应用于数据挖掘、决策分析、智能控制等众多
领域。

正向云算法与逆向云算法是云模型理论的两个最重要的算法。通过正向云算
法 , 可以将 (Ex,En,eH定性表示的整体特征转换为定量数值表示 , 实现定性到定量
的不确定转换。通过 逆向云算法 , 可以实现定量到定性的映射 , 即将一组精确数据
转换为恰当的语言值 (xE,E几 He 来表示的整体概念 , 并以这三个数字特征表示的
定性概念代表这组精确数据所反映的云滴的 整体特征。

文献 4[]中作者提出的基于云模型的用户相似度比较方法 , 在样本分布稀疏的
情况下 , 评价样 本的相似度。

4[]张 光 卫 , 李 德 毅 , 李 鹏 , 康 建 初 , 陈 桂 生 . 基 于 云 模 型 的 协 同 过 滤
推 荐 算 法 . 软 件 学 报 .2007,18(10:2403一 2411.

本文采用 Huang 提出的将基于时间速度序列 (TSs转换为基于道路速度序列
(LSS,以及将 TSS 转换成 LSS 的算法 CTL, 可以有效、准确的实现 TSS 向 LSS 的转
换 [`3。

[6]Zhenzhiu Hang, Zhenfeng He.A novel approach to extract sPeed Patten form
VTDR data.Poreeedings of the International Conference on Intelligent Computation
Technology and Automation(ICICTA 2008,20(08:209一 214.

本文针对传统的几种经典的相似性度量方法存在的一些缺陷 , 提出一种基于云
模型的时间序 列的相似性度量方法 , 该方法克服了欧氏距离严格要求两个时间序列
长度必须一样的缺点 , 克服了形态距离无法度量整体特征的相似性的缺点 , 克服了
DTW 距离的时间复杂度高的缺 点 , 其包含了时间序列宏观的分布信息也包含了其
微观的趋势信息 , 因此综合考虑了时间序 列整体特征的相似性以及局部趋势变化的
相似性 , 且实现较简单 , 在时间序列相似性度量上 是一个折中的方法 , 并通过实验
验证了该方法的有效性与准确性 , 且能有效地应用于大部分 时间序列的相似性度
量。下一步的工作是利用该方法进行时间序列的预测、聚类 , 便于进一 步验证算法
的有效性。 (真的要搞数据挖掘吗?做成的话要附加到系统中吗?成熟的数据挖 掘的
研究到什么程度了呢?百度 google 不是做的更好?他们的技术肯定不能借鉴了,保密
的了。问题是,瓦斯危险源具有什么特征呢?怎么从海量数据中查询出来呢?查询几
G 的 数据的问题怎么处理呢?用什么搜索呢?

相关主题