第十二章 多变量分析方法
16
Y Y购,该被调查者属于购买者组 Y Y非购,该被调查者属于非购买者组
17
3、回归分析方法及其应用
回归分析是处理自变量x1,x2,x3,…… xn与因变量y之间相关关系的方法,它从 定量的角度寻找变量之间的因果关系, 从而判断某些因素的变化对其他因素的 影响。
18
回归分析法的步骤:
1
2 3 4
9
7 10 8
8
6 7 4
7
6 8 5
5
6 7 购买者平均值
9
8 7 8.2857
9
6 5 6.4286
3
7 6 6.00
非购买者组
1
2 3 4 5
4
3 6 2 1 3.20
4
6 3 4 2 3.80
4
6 3 5 2 4.00
15
非购买者平均值
b P -1 D - 0.016 - 0.00023 5.08571 0.05101 - 0.016 0.04481 - 0.00911 2.62857 - 0.00023 - 0.00911 0.04058 2.0000 0.21692 0.01820 0.05604 Y 0.21692 X1 0.01820X 2 0.05604X 3 购买组 Y 0.21692 8.29 0.01820 6.43 0.05604 6 2.25 非购买组 Y 0.21692 3.2 0.01820 3.8 0.05604 4 0.987
yi b1 x1i b2 x2i b j x ji 式中:yi — —第i个研究对象的判别值 x ji — —第i个研究对象在第j个因素(j= , 3,n)上的观察值 1 2, b j — —第j个因素的比重或判别系数
然后根据所收集到的资料计算出判别临界值yc 作为判别研究对象属于两组之中哪一组的标准。
20
回归系数的计算式如下:
b
x y
i 1 m i i 1
m
i
nx y
xi2 nx 2
a y bx
此外,两变量之间的相关程度如何,利用相关性分析。一般情况下针对 等量尺度问题的相关系数计算式如下: 1 r 1
r
(x
i 1 i
m
i
x )( yi y )
6
例——系统分类法之最短距离法
最短距离法是将距离 最短的两个目标或类 别组合在一起。
d ij min 度进行 调查。其中有两个问题如下:
“您每月大约喝多少瓶啤酒?” “您对‘饮酒是人生的快乐’这句话的看法 如何?”
同意10 9 8 7 6 5 4 3 2 1 不同意
2
n n 如果下季度广告费的支出为80万元时,则产品的销售额为: ˆ Y a bX 344 .27 24 .04 * x 344 .27 24 .04 * 80 2267 .(万元) 5
i
Y b X
1658 24 .04 * 54 .64 344 .27
L1 y
L2 y L11 L12 L21 L22
-49.4 -49.4 -36.4 -36.4 -23.4 -5.4 0.6 -22.4 -167.4 -266.4 -656.0 -65.6 43.56 31.36 43.56 21.16 6.76 0.16 19.36 40.96 40.96 70.56 318.4 31.84 -8.58 -7.28 -8.58 --5.98 -3.38 0.12 1.32 -4.48 -17.28 -31.08 -85.2 -8.52 -8.58 -7.28 -8.58 --5.98 -3.38 0.12 1.32 -4.48 -17.28 -31.08 -85.2 -8.52 1.69 1.69 1.69 1.69 1.69 0.09 0.09 0.49 7.29 13.69 30.1 3.01
8
其中5位顾客的调查结果如下:
顾客 1 2 3 4 5 饮用量(瓶) 20 18 10 4 4 态度 7 10 5 5 3
9
聚类分析的步骤: 1、数据变换 2、计算各样本之间的距离 3、类别合并 4、聚类分析图 1
d ij xi x j yi y j
远东企业公司发展了一种新产品,该公 司在新产品未大量上市前,为安全起见, 将新产品的样品寄给了十二个国家的进 口代理商,要求对该产品给予评估。评 估的因素有三:式样、包装及耐久性。 评分表采用10分制,每一进口代理商并 被要求说明是否愿意购买,调查结果如 下:
14
产品特性 式样 包装 耐久性
购买者组
y b0 b1 x1 b2 x2 bn xn
25
用矩阵表示为:
Y Xb
b0 b1 . b p1 . . bn 1
式中:
Y1 Y2 . Y n 1 . . Yn
Sxx=1744.5
Syy=1035101
Sxy=41944.64
22
2500 2000 1500 1000 500 0 0 20 40 60 80 100
23
判断相关性 相关系数
r
i
X X Y Y X X Y Y
t 2 i t
S xy S xx S yy
置信区间
s
Y Yˆ
n m 1
2
26613 54.38 11 1 1
90%的置信度,置信区间:上限:2267.5+54.39*1.86=2368.8 万元 24 下限:2267.5-54.39*1.86=2166.33万元
多元线性回归分析
多元回归分析处理因变量与多个影响因素 (自变量)的相关性关系。 其线性模型为:
1,X 11,X 12, X 1n 1,X ,X , X 21 22 2n X n p 1,X n1,X n 2, X nn
b ( X ' X ) 1 X ' Y
相关系数的计算式:
26
二元线性回归分析模型
预测公式: Yˆ b
2
2
2
3
4
5
距离 0.04 0.09 0.10
0.29
10
2、判别分析法及其应用
判别分析法是用于判别样本所属类型的 一种多变量统计分析方法 作用于在已知被研究对象已分成若干类 的情况下,确定新的被研究者究竟属于 已知类型中的哪一类。
11
判别分析法的基本原理 判别分析是根据样本数据,确定判别系数
序号 自变量X 因变量Y X2 Y2 XY 预测值 预测值的 误差 51.17 -48.09 13.35 21.65 -83.22 8.69 76.56 -30.91 -72.22 28.61 34.40 误差的平方
1 2 3 4 5 6 7 8 9 10 11 合计
36 42 55 48 45 47 50 61 68 72 77 601.0
x x2 x1 x2
2 1 2 2 2 1 2 2 1 2
2
1
1 2
2
2
b2
x1
x x2 x1 x2
x Y x x xY
1 2
b0 Y b1 x1 b2 x2
27
年份
X1i 人均年收 入(千元 16 17 16 18 20 23 27 29 29 31 226 22.6
0
b1 X 1 b2 X 2 e
式中:
Y nb b x b x xY b x b x b x x x Y b x b x x b x x xY x x x Y b
0 1 1 2 2 1 0 1 1 2 1 2 2 0 2 1 1 2 2 2 1 1 2 2 2
第十二章 多变量分析方法及其应用
1
多变量分析方法在市场研究中应用的 作用
1、简化数据结构,选择变量子集 合 2、对数据进行分类处理、分类研 究、构造分类模式 3、构造模型
2
1、聚类分析方法及其应用
聚类分析的作用:将一些变量、目标、 公司等进行分类组合
3
聚类分析的基本方法原理——就是测量 研究目标之间的相似性,根据相似的程 度将研究目标进行分类。 测量研究目标之间的相似性的方法通常 有两种:
2
r 0.7, 强相关 0.3 r 0.7,中度相关 r 0.3, 弱相关
(x
i 1
m
x )
(y
i 1
m
i
y )2
21
【例】某企业研究企业广告支出费对产品销售额的影响,现获得最 近11个季度有关的统计资料如下表,试分析企业广告支出对销售额 有无显著影响,如果企业下季度准备广告支出80万元,估计企业的 销售额为多少?
41944 .36 1744 .545 *1035101
0.987
2
从散点图和相关系数表明企业广告费支出与产品销售额之间存在强线 性相关关系。可用一次线性相关分析法进行预测。 ˆ 2.预测方程: Y a bX
b a n X i Yi X i Yi n X i2 X i 11 * 1038348 601 * 18237 24 .04 11 * 34581 601 * 601
两目标之间的距离 两目标的关联系数