数据挖掘技术在电子商务中的应用学院专业研究方向学生姓名学号任课教师姓名任课教师职称2013年6月20日数据挖掘技术在电子商务中的应用摘要:电子商务在现代商务活动中的作用正变得日趋重要,电子商务的广泛应用使企业产生了大量的业务数据,按企业既定业务目标对这些数据进行数据挖掘可以帮助企业分析出完成任务所需的关键因素。
由此凸显出数据挖掘的重要。
本文讨论了数据挖掘的主要方法,具体阐述了数据挖掘技术在电子商务中的作用及应用。
关键词:数据挖掘;电子商务;路径分析;关联分析1. 引言随着Internet 的普及,电子商务的兴起,人们的商务理念正在改变,在人们访问、浏览、交易,电子商务企业更新产品信息的同时, Web网上产生了大量的数据,这些数据充斥着网络,充斥着电子商务企业,充斥着客户。
企业只有从海量的数据中挖掘出有价值的信息,为顾客提供更好的服务,才能吸引顾客和挽留顾客,提高自己的效益。
如何更快、更好地利用各种有效的数据更好地开展电子商务,这是目前电子商务急需解决的问题。
2.电子商务和数据挖掘简介2.1 电子商务电子商务是指个人或企业通过Internet网络,采用数字化电子方式进行商务数据交换和开展商务业务活动。
目前国内已有网上商情广告、电子票据交换、网上订购,网上、网上支付结算等多种类型的电子商务形式。
电子商务正以其低廉、方便、快捷、安全、可靠、不受时间和空间的限制等突出优点而逐步在全球流行。
电子商务是指以Internet网络为载体、利用数字化电子方式开展的商务活动。
随着网络技术和数据库技术的飞速发展,电子商务正显示越来越强大的生命力。
电子商务的发展促使公司内部收集了大量的数据,并且迫切需要将这些数据转换成有用的信息和知识,为公司创造更多潜在的利润。
利用数据挖掘技术可以有效地帮助企业分析从网上获取的大量数据,发现隐藏在其后的规律性,提取出有效信息,进而指导企业调整营销策略,给客户提供动态的个性化的高效率服务。
2.2 数据挖掘技术数据挖掘(Data Mining),又称数据库中的知识发现(Knowledge Discovery in Database, KDD),是从大量的、不完全的、有噪声的、模糊的和随机的数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。
数据挖掘是一门广义的交叉学科,它汇聚了不同领域尤其是数据库、人工智能、数理统计、可视化、并行计算等方面的知识。
数据挖掘技术从一开始就是面向应用领域,它不仅是面向特定数据库的简单检索查询调用,而且,要对数据进行微观、中观乃至宏观的统计、分析、综合和推理,以指定实际问题的求解,企图发现事件间的相互关联,甚至利用已有的数据对未来的活动进行预测。
数据挖掘技术在金融、保险、电信、大型超市等积累有大量数据的电子商务行业有着广泛的应用,如信用分析、风险分析、欺诈检验、用户聚类分析、消费者习惯分析等。
[1]而电子商务中的数据挖掘即Web挖掘,是利用数据挖掘技术从www的资源(即Web 文档)和行为(即We服务)中自动发现并提取感兴趣的、有用的模式和隐含的信息,它是一项综合技术涉及到Internet技术学、人工智能、、信息学、学等多个领域。
2.3 数据挖掘过程挖掘数据过程可以分为3个步骤:数据预处理、模式发现、模式分析。
2.3.1 数据预处理实际系统中的数据一般都具有不完全性、冗余性和模糊性。
因此,数据挖掘一般不对原始数据进行挖掘,要通过预处理提供准确、简洁的数据。
预处理主要完成以下工作:包括合并数据,将多个文件或多个数据库中的数据进行合并处理;选择数据,提取出适合分析的数据集合;数据清洗、过滤,剔除一些无关记录,将文件、图形、图像及多媒体等文件转换成可便于数据挖掘的格式等。
2.3.2 模式发现模式发现阶段就是利用挖掘算法挖掘出有效的、新颖的、潜在的、有用的以及最终可以理解的信息和知识。
可用于Web的挖掘技术有路径选择、关联分析、分类规则、聚类分析、序列分析、依赖性建模等等。
2.3.3 模式分析模式分析是从模式发现阶段获得的模式、规则中过滤掉不感兴趣的规则和模式。
通过技术手段,对得到的模式进行数据分析,得出有意义的结论。
常用的技术手段有:关联规则、分类、聚类、序列模式等。
[2]电子商务是现代信息技术发展的必然结果,也是未来商业运作模式的必然选择。
利用数据挖掘技术来分析大量的数据,可以挖掘出商品的消费规律与客户的访问模式,帮助企业制定有效的营销策略,充分发挥企业的独特优势,促进管理创新和技术创新,提高企业竞争力。
随着电子商务发展的势头越来越强劲, 面向电子商务的数据挖掘将是一个非常有前景的领域。
它能自动预测客户的消费趋势、市场走向,指导企业建设个性化智能网站,带来巨大的商业利润,可以为企业创建新的商业增长点。
但是在面向电子商务的数据挖掘中也存在很多问题急需解决,比如怎样将服务器的日志数据转化成适合某种数据挖掘技术的数据格式,怎样解决分布性、异构性数据源的挖掘,如何控制整个Web上知识发现过程等。
随着硬件环境、挖掘算法的深入研究及应用经验的积累,数据挖掘技术及在电子商务中的应用必将取得长足的进展。
3.Web数据挖掘对象的分类Web数据有3种类型:HTML标记的Web文档数据,Web文档内连接的结构数据和用户访问数据。
按照对应的数据类型,Web挖掘可以分为3类:3.1 Web内容挖掘就是从Web文档或其描述中筛选知识的过程。
3.2 Web结构挖掘就是从Web的组织结构和链接关系中推导知识。
它的目的是通过聚类和分析网页的链接,发现网页的结构和有用的模式,找出权威网页。
3.3 Web使用记录挖掘就是指通过挖掘存储在Web上的访问日志,来发现用户访问Web页面的模式及潜在客户等信息的过程。
4.电子商务中数据挖掘的方法针对电子商务中不同的挖掘目标可以采用不同的数据挖掘方法,数据挖掘的方法有很多,主要包括下面3大类:统计分析或数据分析,知识发现,基于预测模型的挖掘方法等。
4.1 统计分析统计分析主要用于检查数据中的规律,然后利用统计模型和数学模型来解释这些规律。
通常使用的方法有线性分析和非线性分析、连续回归分析和回归分析、单变量和多变量分析,以及时间序列分析等。
统计分析方法有助于查找大量数据间的关系,例如,识别时间序列数据中的模式、异常数据等,帮助选择适用于数据的恰当的统计模型,包括多维表、剖分、排序,同时应生成恰当的图表提供给分析人员,统计功能是通过相应的统计工具来完成回归分析、多变量分析等,数据用于查找详细数据,浏览子集,删除冗余等。
4.2 知识发现知识发现源于人工智能和机器学习,它利用一种数据搜寻过程,去数据中抽取信息,这些信息表示了数据元素的关系和模式,能够从中发现商业规则和商业事实。
利用数据可视化工具和浏览工具有助于开发分析以前挖掘的数据,以进一步增强数据发掘能力。
其他数据挖掘方法,如可视化系统可给出带有多变量的图形化分析数据,帮助商业分析人员进行知识发现。
4.3 预测模型的挖掘方法预测模型的挖掘方法是将机器学习和人工智能应用于数据挖掘系统。
预测模型基于这样一个假设:消费者的消费行为具有一定的重复性和规律性,这使得商家可以通过分析收集存储在数据库中的交易信息,预测消费者的消费行为。
按消费者所具有的特定的消费行为将其分类,商家就能将销售工作集中于一部分消费者,即实现针对性销售。
5.数据挖掘技术在电子商务中的应用5.1 数据挖掘在客户关系管理中的应用5.1.1 潜在客户的获取在大多数的商业领域中,业务发展的主要指标包括新客户的获取能力。
企业的市场部门人员可以采用传统的方法来发展新客户,如开展广告活动;也可以根据所了解的目标客户群,将他们分类,然后进行直销活动。
但是,随客户数量不断增长和每位客户的细节因素增多,要得出选择出相关的人口调查属性的筛选条件也会变得很困难。
而数据挖掘技术可以帮助完成潜在客户的筛选工作。
在对 Web 的客户访问信息的挖掘中,利用分类技术可以在Internet 上找到未来的潜在客户。
使用者可以先对已经存在的访问者根据其行为进行分类,并依此分析老客户的一些公共属性,决定他们分类的关键属性及相互间关系。
对于一个新的访问者,通过在Web 上的分类发现,识别出这个客户与已经分类的老客户的一些公共的描述,从而对这个新客户进行正确的分类。
然后从它的分类判断这个新客户是有利可图的客户群还是无利可图的客户群,决定是否要把这个新客户作为潜在的客户来对待。
客户的类型确定后,可以对客户动态地展示 Web 页面,页面的内容取决于客户与销售商提供的产品和服务之间的关联。
若为潜在客户,就可以向这个客户展示一些特殊的、个性化的页面内容。
5.1.2 客户的保持随着行业中的竞争愈来愈激烈和获得一个新客户的开支愈来愈大,保持原有客户的工作也愈来愈有价值。
在客户关系管理的实施中,企业通过预测,找出可能会流失的客户,并分析出主要有哪些因素导致他们想要离开,在此基础上,有针对性地挽留那些有离开倾向的客户。
客户常会迷失在复杂的网站和众多的商品信息中。
这就要求电子商务网站应当“以客户为中心”。
在电子商务中, 传统客户与销售商之间的空间距离已经不存在, 在Internet 上, 每一个销售商对于客户来说都是一样的,那么使客户在自己的销售站点上驻留更长的时间, 对销售商来说则是一个挑战。
为了使客户在自己的网站上驻留更长的时间,就应该全面掌握客户的浏览行为,知道客户的兴趣及需求所在,并根据需求动态地向客户做页面推荐, 调整Web 页面, 提供特有的一些商品信息和广告,以使客户满意, 从而延长客户在自己的网站上的驻留的时间。
实施客户关系管理战略,为客户提供与众不同的个性化服务。
基于数据挖掘的电子商务推荐系统通过对客户的访间行为、访问频度、访问内容等信息进行挖掘,提取客户的特征。
获取客户访问模式。
据此创建个性化的电子商店,主动向客户提供商品推荐,帮助客户便捷地找到感兴趣的商品。
这是一种全新的个性化购物体验。
不仅容易使访问者转变成购买者,而且可根据客户当前购物车中的物品,向客户推荐一些相关的物品,提高站点企业的交叉销售量,甚至还可以根据需求动态地向客户做页面推荐,提供个性化的商品信息和广告,提高客户对访问站点的兴趣和忠诚度,防止客户流失。
[4]5.1.3 管理客户数据随着“以客户为中心”的经营理念的不断深入人心,分析客户、了解客户并引导客户的需求已成为企业经营的重要课题。
基于数据挖掘技术,企业将最大限度地利用客户资源,开展客户行为的分析与预测,对客户进行分类。
有助于客户盈利能力分析,寻找潜在的有价值的客户,开展个性化服务,提高客户的满意度和忠诚度。
通过Web资源的挖掘,了解客户的购买习惯和兴趣,从而改善网站结构设计,推出满足不同客户的个性化网页。