数据挖掘技术在企业中的应用
知识获取 、 信息提取 、 高性能计算、 并行计算、 数据可 视化等多方面知识, 它包括数据库中的知识发现、 信
息抽取、 信息发现等。 早在 18 年 8 在美国底特 99 月,
() 1关联分析: 从给定的数据集发现频繁 出现的 项集模式知识 ( 又称为关联规则) 关联分析广泛用 ,
于市场营销、 事务分析等应用领域 。 最经典的关联分
掘技术在企业中的应用
A p l c t o f D t 1 n i n e p i e p i a i n o a a Mi i g n E t r r s 1 s
・数 挖 据
掘 技 术 在 企
业
张 苹
Z agPn h n ig
中 的
应
( 驻马店高级技工学校, 河南 驻马店 43 0) 6 00
在企业 当中的应用实例 , 分析 了影响该技术普及的不利 因素, 阐述 了 数据挖掘技术在企业中的应用前景。 关键 词 : 数据 挖掘 ; 决策 ; 数据 库技术
中图分类 号 :P 1 T31 文 献标识 码 : A 文章编 号 :6 1 72(0 1 .0 10 17 . 9. 1) 04 .4 4 2 8
抽取挖掘 出未知的、有价值的模式或规律等知识的 复杂过程【 l 】 。它涉及数据库技术 、 人工智能 、 机器学 习、 神经网络 、 数学 、 统计学、 模式识别、 知识库系统 、
得当, 能够给企业带来巨大的经济效益, 对企业经营 管理产生深远的影响。
1 主要的数据挖掘技术介绍 数据挖掘技术主要包括关联分析 、 分类与预测 、 聚类分析 、 异类分析和演化分析等技术嘲 。
在体育界, B N A将数据挖掘用到无处不在 。在
某期的( ( 体育画报》 里的一篇关于 N A的文章 中提 B
型特征的模型 ( 或函数) 以便能够分类识别未知数 到:二十年来,所有年度防守球员退役时都有枚戒 , “
指带” 在其他报道中,2a e. m定义的“ 。 8gm s o c 关键时
Ke wo d : t iig y r S DaaM nn ;De i o a ig cs nM kn ;DaaBaeT c o o y i t s e h lg n
0 引言 互联 网的飞速发展 让我们拥有了前所未有 的海
律召开的第 1 届 国际人工智能联合会议 的专题讨 1 论会上首次出现知识发现 (n weg i oe K o l e s vr i d D c y n
Ab ta tT ed v lp n f o ue n tm e rn a n i t aat n ep s s Ho t l x s r c: h e eo me t mp tra di e t igm g a mi d t e tr r e . w f l e - o c n b n y o i ou y
c v t eifr t nt epe tr rsst k e i o u sinta o f s gp o l. sdo ei— a aet o mai h l nep ie ma ed cs n i aq et t sc nu i e pe Ba e nt h n o o o i s o h i n h n to u t n o aamiigtc oo y t ete i dsu sdtea p iaine vrn e t n x mpe ne rs r d ci f t nn h lg , ss ic se p l t n i m n d e a lsi e tr i - o d en h h h c o o a n p e , n lz du fv rbefco s h s a fe t ep p lr ig a diu tae ep o p c f etc oo s a ay e n a oa l tr o em ya c o ua z , n ls tdt r s e t h lg i a t h t in l r h o t en h y n e tr r e . ne i s p s
量数据。 互联网在降低信息壁垒、 辅助管理决策的同
时, 这也带来 了难以消化识记 、 以辨识真假、 难 难以 识贫乏已经成为一个典型难题,而数据挖掘的出现
D t ae,D ) a bs K D 这个术语。而数据挖掘(M) a s D 是知
识发现最核心的部分。 经历二十多年的发展, 数据挖 研究和应用受到了学术界 和实业界越 来越 多的重
( dacd eh i l h m d n co aZ u ai ho, ea u ai 6 00 T c aS Z a
用
摘 要: 计算机和互联网的飞速发展给企业带来海量数据 , 如何充分挖掘这些数据隐藏的信息以辅助企
业决策成为 当前企业面临的问题之一。 基于对主要的数据挖掘技术的简介 , 本文讨论 了 该技术的应用场合和
41
鬻~
析案例 即“ 啤酒与尿布” 。 ( 分类与预测 : 2 ) 找出一组能够描述数据集合典 据的归属或类别, 即将未知事例映射到某种离散类 别之一 。分类模型 ( 或函数) 可以通过分类挖掘算法 从一组 训练样本数据 ( 其类别归属 已知) 中学 习获
得 。分类挖掘所获的分类模型可以采用多种形式加
保证安全 、 以统一处理等众多问题。数据丰富、 .掘已经成为一个 自 难 知 成体系的应用学科 。数据挖掘的
恰好解决该问题 ,让企业能够充分应用生产经营数 视, 成为信息产业最有前途的交叉学科[ 2 ] 。如果运用 据进行决策。 数据 挖掘 (a n n , M) D t Mi gD 是从 大量数据 中 a i