当前位置:文档之家› 市场研究——聚类分析法

市场研究——聚类分析法


聚类分析原理

Company Logo
聚类分析起点——衡量距离
进行聚类分析时,用样本间的距离来测度不同样本 间是否具有相似性。 因此,在进行分析前,首先要解决的一个问题—— 如何衡量样本点之间的距离? 设每个样品有p个指标,把n个样本看成p维空间 中的n个点,则两个样本间相似程度就可用p维空 间中的两点距离公式来度量。 (当变量的测量值相差悬殊时,要先对样本进行标 准化,以消除计量单位对计算结果的影响。)
聚类分析在实验市场选择中的应用
通过聚类分析,可将待选的实验市场(商场、居 民区、城市等)分成同质的几类小组,在同一组 内选择实验单位和非实验单位,这样便保证了这 两个单位之间具有了一定的可比性。
聚类分析以商店的规模、类型、设备状况、所处 的地段、管理水平等作为变量,进而将不同的市 场分类。
聚类分析在销售片区确定中的应用
聚类分析在市场机会研究中的应用
企业制定市场营销战略时,弄清在同一市场中哪些企业是 直接竞争者,哪些是间接竞争者是非常关键的一个环节。 要解决这个问题,企业首先可以通过市场调查,获取自己 和所有主要竞争者在品牌方面的第一提及知名度、提示前 知名度和提示后知名度的指标值。 聚类分析将市场调查获得的变量数据,进行聚类分析,将 企业和竞争对手的产品或品牌进行归类,属于同一类别的 产品和品牌就是所分析企业的直接竞争对手;并结合每一 产品或品牌的多种不同属性的研究,发现哪些属性组合目 前还没有融入产品或品牌中。从而寻找企业在市场中的机 会,为企业制定有效的竞争战略提供基础性的资料。

x1 , y1

x2 , y2
离差平方和法( Ward’s method word)
使小类内各样本的欧氏距离总平方和增加最小 的两小类合并为一类。
St ( X i (t ) X (t ))(X i (t ) X (t ))
i 1 nt
S St ( X i (t ) X (t ))(X i (t ) X (t ))
SPSS软件进行系统聚类操作步骤
选择分析-分类-系统聚类 把热量、钠含量、酒精、价格选入变量框; 把啤酒名选入“标注个案”框。
选择“绘制”,选中“树状图”;
方法设定
在聚类方法框中选 择需要的方法; 在度量标准框中选 择距离的计算方法 ; 在“标准化”框中 选择Z得分。
输出结果 :聚类表
聚类分析法案例研究

Company Logo
聚类分析
系统聚类法 案例:汽车 市场需求情 况研究

快速聚类法
案例:饮料 产品竞争分 析
Company Logo
系统聚类分析应用举例:
汽车市场行标准化变换处理,经过 运算使数据标准化得到表4-2,使它的每列数据的平均值为0,
K-均值聚类的步骤
先确定k个点为“凝聚点”(SPSS软件自动确定 );也就是说,把这k个点作为k类中每一类的凝 聚点。 然后,根据和这k个点的距离远近,把所有点分 成k类。再把这k类的中心(均值)作为新的凝聚点 ,再重新按照距离分类。 如此叠代下去,直到达到停止叠代的要求(比如 ,各类最后变化不大了,或者叠代次数太多了) 。
两点距离公式可以从不同角度进行定义,按q的取值不同 可以包括多种距离计算方法。 常用的距离的计算方法有:
1欧氏距离(Euclidean)
( xik x jk ) 2
2平方欧氏距离Squared Euclidean
( xik x jk ) 2
3切比雪夫距离(Chebychev) max | xik x jk |
2. 传统统计法,根据客户属性特征的简单统计来划分客户 类别; 3. 非传统统计方法,即基于人工智能技术的非数值方法。 聚类分析法兼有后两类方法的特点,能够有效完成客户 细分的过程。消费同一种类的商品或服务时,不同的客 户有不同的消费特点,通过研究这些特点,企业可以制 定出不同的营销组合,从而获取最大的消费者剩余,这 就是客户细分的主要目的。
SPSS软件进行聚类分析
1、SPSS系统聚类法 2、SPSS快速聚类法

Company Logo
1、SPSS系统聚类法
以 啤 酒 分 类 为 例
啤酒名 Budweiser Schlitz Ionenbrau Kronensourc Heineken Old-milnaukee Aucsberger Strchsbohemi Miller-lite Sudeiser-lich Coors Coorslicht Michelos Secrs Kkirin Pabst Hamms Heilemans Olympia Schlite 热量 钠含量 酒精 144.00 19.00 4.70 181.00 19.00 4.90 157.00 15.00 4.90 170.00 7.00 5.20 152.00 11.00 5.00 145.00 23.00 4.60 175.00 24.00 5.50 149.00 27.00 4.70 99.00 10.00 4.30 113.00 6.00 3.70 140.00 16.00 4.60 102.00 15.00 4.10 135.00 11.00 4.20 150.00 19.00 4.70 149.00 6.00 5.00 68.00 15.00 2.30 136.00 19.00 4.40 144.00 24.00 4.90 72.00 6.00 2.90 97.00 7.00 4.20 价格 .43 .43 .48 .73 .77 .26 .40 .42 .43 .44 .44 .46 .50 .76 .79 .36 .43 .43 .46 .47
这一步合并了1和17
这一步合并了第9和 12。但这里9代表第 8步中形成的类,12 代表第9步中形成的 类。依此类推可知 这一步合并之后的 新类包括出9,20, 10,12,13。
冰 柱 图
从图中可以 读出所有的 分类结果。 图中标出的 是分5类的 情况。
聚类树形图
图形反映了类间的距离和聚类过程。
SPSS结果
在开始的操 作中,通过 相应的选项 可以把分类 结果存储起 来。
2、SPSS快速聚类法
选项
人为固定分类数 ANOVA表, 初始凝聚点等 读写凝聚点
快速聚类法的聚类数由用户指定,分类是唯一的。
1.分类数:初步判定聚成K类
2.聚类方法:method: iterate and clussify(聚类分 析的每一步都重新计算新的类中心点) clussify only(聚类分析过程类中心点始终为初始类中心点,仅作 一次迭代)
方差为1,这样表4-1中5列具有不同量纲、不同数量级的数据 就能放在一起比较;其次用表4-2中经过标准化处理后的30个
不同地区数据求出欧氏距离。
表 4-2
数据标准化
聚类树形图
例 饮料分类
•16种饮料的热量、咖啡因、钠及价格四种变量
指定聚成四类
Ini tial Clust er Ce nters Cluster CALORIE CAFFEINE SODIUM PRICE 1 207.20 3.30 15.50 2.80 2 146.70 4.30 9.70 1.80 3 95.90 .00 8.50 1.30 4 .00 4.20 13.10 2.20
4明考夫斯基距离(明氏距离)**
dij (q) ( X ik X jk )
k 1 p q 1/ q
如何进行聚类分析?
最短距离法 最长距离法 重心法 Ward法(离差平方和法)等
最短距离
S1 S2 S3
S4 S5
最短距离
S1 S3
S4 S5
最长距离
重心法(Centroid clustering): 均值点的距离
聚类是指将数据分类到不同的类或者簇的过程; 基本原则是同一个类别中的对象有很大相似性, 而不同类别间的对象有很大相异性。
聚类分析的种类
聚类分析的方法主要有两种: (一):系统聚类分析方法 (Hierarchical Cluster Analysis) (二):快速聚类分析方法 (K-Means Cluster Analysis)
3.聚类中心:centers
4.迭代次数:iterate 5.保存分类结果:save
聚类分析在市场研究中的应用
实验市场选择
市场机会研究 客户细分 销售片区确定

Company Logo
聚类分析在客户细分中的应用
常用的客户分类方法主要有三类:
1. 经验描述法,由决策者根据经验对客户进行类别划分;
t 1 t 1 i 1
q
q
nt
离差平方和法: 合并”离差平方和”变动最小的两个类
(1 1.5) 2 (2 1.5) 2 0.5
1,2 红 7,9 绿 4,5 黄
(7 8) (9 8) 2
2 2
(4 4.5) 2 (5 4.5) 2 0.5
离差平方和法: 合并离差平方和变动最小的两个类
LOGO
聚类分析
学生:胡琪玲
主要内容
聚类分析概述 聚类分析原理
利用SPSS进行聚类分析 聚类分析法案例研究

Company Logo
聚类分析概述
聚类分析是根据事物本身的特性研究个体的一种 方法,进行聚类分析的目的在于将相似的事物归 类。“物以类聚,人以群分”。
系统聚类法
是按个体在性质或成因上的亲疏关系,把个体 逐级聚集成类的一种多元统计分析方法。按照 分类对象不同又可以分为:
1、对变量(指标)进行分类,称为R型聚类
2、对观测值(样品)来分类,称为Q型聚类

Company Logo
系统聚类法步骤: 开始时,每个个体各自为一类, 然后以某种表示个体亲疏关系的统计量为分类 依据,把彼此关系相对密切的个体合并为小类 ,再把关系相对密切的小类进一步合并,循环 进行此步骤。 直到合并成一个大类为止,最终得到一个反映 各对象间亲疏关系的分类结果。
相关主题