当前位置:
文档之家› 基于时间序列降维方法的研究综述
基于时间序列降维方法的研究综述
关键词 数据 挖 掘 ;时 间序 列 ; 线性 表 示 ;非 线性 表 示 D O I :1 0 . 3 9 6 9 / i . i s s n . 1 0 0 1 - 8 9 7 2 . 2 0 1 3 . 1 9 . 0 1 1
时 间序 列 作 为数 据库 中的 一种 数 据形 式 ,它广 泛存 在 于 各 种 大 型的 商业 、医学 、工程 和社 会 科学 等 数据 库 中 , 形 成 规 模庞 大 的时 间序列 数据 库 。由于 时 间序 列具 有数 据 量大 、噪 声干 扰严 重 和短 期 波动 频繁 等 特 点 ,直接 在 原始 时 间序列上进行相似性查 询、分类聚类 、模式挖掘等操 作 ,很难得到满意的结果[ 1 1 。因此 ,开展时间序列的降维 研 究 是 十分 有 必要 的 。许 多学 者 提 出 了时 间序 列 的线性 拟 合 、线性 划 分 等 降维 方法 ,在 刻 画时 间序列 主 要形 态 的 同
中 国科 技信 息 2 0 1 3年 第 1 9期 ’ C H I N A S C I E NC EA NDT E C H N OL OG YI N F OR MA T I ONOc t . 2 o l 3
基 础 及 前 沿
基于 时间序列 降维方法 的研究综述
王赫楠 燕燕 王 和 禹
辽宁 中医药 大学信 息工程 学院,辽宁 沈 阳 1 1 0 0 3 2
的序列降维作用。
2 时间序列的线, I f表示法
2 . 1时 间序 列线 性拟 合方 法
时 ,忽略那些微小的细节 ,把握局部特征 ,从而保持了序 列主要特征的不变性 ,极大提高数据挖掘的效率 ,达到简 化 计算 量 的 目的_ 2 】 。
2 . 1 . 1 极值点拟合法
极 值 点拟合 法 的具 体 实现原 理如 下所述 : 极 值 点拟 合法 I P S e g me n t a t i o n  ̄ ] i 用时 间序 列 数据 的单 调 变化 属性 ,抽取 其 中的 极值 点 作为 特征 数据 ,实现 对 时 间序 列数 据压 缩并 保 留其 主要 变 化特 征 的 目的 。对 于时 间
1时间序列 的非线性表示法号 本 身或 它 的 某阶 导 数在 某 一 时刻 存在
突 变 ,奇 异点 携带 比较 重要 的信 息 。K o r n 等 人提 出的奇 异 值分解 ( S i n g u l a r V a l u e D e c o mp o s i t i o n ,S V D)法 _ 3 在统 计 学里 也 称主 分量 分析 ( P r i n c i p l e C o mp o n e n t A n a l y s i s , PC A)或Ku l l b a c k — L e i b l e r 分解 ,是 一 种基 于 统计 概率 分 布 的投 影 方法 。此 方法 搜 索 i q 个最能代表数据的k 维 正 交 向量n≤k , 使 原 来 的 数据 被 投 影 到较 小 空 间 ,实 现 数据 压 缩 。S V D 是 一 种常 见 的 降维方 法 ,它 已经成 功 用于 图像 和 文 本 的索 引[ 4 】 【 5 ] 。
1 . 2符 号化 表示 法 针 对 时 间序列 符号 化的 方法 主要有 2 种 :1 ) 与处 理其 他 连 续属 性 离散 化 问题 类似 ,通 过 等宽 离散 化 或最 大熵 离 散 化 等方 法 将 时 间序 列 的实 数值 映射 到 有 限的 符号 集 。2 ) 将
一
段时 间序 列 的波 形映 射 为一 个 符号 。这 种 方法 具有 很好
基 础 及 前 沿
中 国 科 技 信 息 2 0 1 3 年 第1 9 期 C H I N A S C I E N C E A N D T E C H N O L O G Y I N F O R M A T I O N O c t . 2 o 1 3
①所选 的特 征值 点必 须是序 列的 极值 点 ; ②该 极值 点 保持 极 值的 时 间段 ( 即 该 点的 前后 极值 点 之 间 的 时 间 段 ) 与该 序 列长 度 的 比值 必 须 大 于 某 个 阈 值 M ( 参 数M看 作特 征 点 的判 断影 响 因子 ,M的取 值 和领 域 知识 、序列 长度 以及实 际的关 注点有 关 ,一 般在 0 . O 1 ~0 . 1 之 间) .
王赫楠
摘 要 在综合 分析近年 来时间序列数据挖掘 相关文献的基础上 , 从 时间序列 的非 线性 降维方 法以及 时间序列 的 线性 降维方法 两个 方 面对时间序列 的表示方法进行 了综述 , 简要 分析 了基于 时间序 列降维方 法的研 究现状 ,对 比较流行的方 法
进 行 了比 较 分 析 ,对 当前 一 些 未 解 决 的 问题 进 行 了 简要 介 绍 , 并 在 此 基 础 上 对 未来的发展趋 势进 行 了展 望,为研 究者 了解 最新的 时间序列 降维方法 、新 技 术 及 发 展 趋 势提 供 了参 考 。
序 ̄ l Q ( q , q , , …… q , q , q , …… , q ) ( 0 < i ≤n ) , 如果 q 满 足 条件q l ≤q 2 ≤, …, ≤q i 1 ≤q i 但q i ≥q . + l ≥, …, ≥q ~ 1 ≥q , 或 则q i ≥q 2 ≥, …, ≥q i — l ≥q i 但q i ≤q i + 1 ≤, …, ≤q 一 1 q n ,即 时 间序 列Q 的单 调性 在 数据 点q 发 生 变化 ,则q , 作为 极值 点 被 保 留。 2 . 1 . 2 特征 点拟 合法 特 征 点拟合 法具 体实 现原理 如 下所述 : F P S e g me n t a t i o n 算 法把 时 间按 序列 Q 的起 点 和终 点 保 留下来 作为 特征 点 ,其 它关 键 点需满 足以 下两 点要求 :