当前位置:文档之家› 第6章 SPSS的方差分析

第6章 SPSS的方差分析

30
• 平均值之间的多重比较
– 若方差分析的结果不拒绝H0,表示拒绝不 同水平下各总体均值相等的证据不足 ————>分析终止 – 若方差分析的结果拒绝H0,接受H1, 表示 不同水平下各总体均值不全相等
• 哪两两总体的均值之间相等? • 哪两两总体的均值之间不等?
————>需要进一步作多重比较
• 多重比较检验问题也是假设检验问题, 遵循假设检验的基本步骤。
地区对销售额的单因素方差分析结果
ANOVA 销 售额 Sum of Squares 9265.306 16904.000 26169.306 df 17 126 143 Mean Square 545.018 134.159 F 4.062 Sig . .000
Between Groups Within Groups Total
24
广告形式对销售额的单因素方差分析结果
ANOVA 销 售额 Sum of Squares 5866.083 20303.222 26169.306 df 3 140 143 Mean Square 1955.361 145.023 F 13.483 Sig . .000
Between Groups Within Groups Total
3. 计算检验统计量的观测值和概率P-值 4. 给定显著性水平,并作出决策。
20
SPSS操作
完全窗口分析: [Analyze][Compared Means ] [One-Way Anova]。打开 One-Way Anova主对话框, 如图6-1所示。
图6-1 单因素方差分析的实现
21
选入分组变量,必须满足 只取有限个水平的条件。
可以看到:观测变量销售额的离差平方总和为26169.306; 如果仅考虑广告形式单个因素的影响,则销售额总变差中,不 同广告形式可解释的变差为5866.083,抽样误差引起的变差为 20303.222,它们的均方分别为1955.361和145.023,相除所得 的F统计量的观测值为13.43,对应的概率P值近似为0。如果显 著水平为0.05,由于P值<0,则应拒绝原假设,认为不同广告形 式销售额产生了显著影响,不同广告形式对销售额的影响效应 25 不全为0。
8
基本概念
• 因素:变量,是方差分析研究的对象。 分为观测因素(变量)和控制因素(变 量)。例如 ,饮料的销售量和饮料的颜 色。
• 水平:因素的内容(取值)。例如颜色 因素的水平为无色、粉色、橘黄色、绿 色。
9
• 单因素方差分析:仅研究单个控制因素对 观测因素的影响,即只针对一个因素进行 方差分析。 • 多因素方差分析:研究多个控制因素对观 测因素的影响,即同时针对多个因素进行 方差分析。 • 方差分析的两个基本假设:
– 饮料颜色和销售地区对销售量的影响分析。 – 观测变量各总体应服从正态分布; – 观测变量各总体相互独立且方差相同。 – 饮料颜色对销售量的影响分析。
10
方差分析的原理
• 观测数据存在着差异。差异的产生来自 于两个方面:
一是因素中的不同水平造成的; 二是由于抽选样本的随机性而产生的。
• 上述两个方面产生的差异可以用两个方 差来计量:
33
• LSD(最小显著性差异)方法
– 检验统计量为t统计量:
x t
i
MSE 1 ni 1 n j
x j i j
t n k
• Bonferroni(邦弗朗尼)方法
– 检验敏感性高,能检验出控制变量不同水平 下均值间的微小差异;适用于各总体方差相 等的情况。 – 未对犯一类错误的概率问题加以有效控制。 – 检验统计量为t统计量,与LSD基本相同。 – 控制了犯一类错误的概率,使得显著性水平 缩小到原有的1/N。两总体均值差的置信区 间为: x x t n k MSE 1 n 1 n
第6章 SPSS的方差分析
1
主要内容
• • • • 6.1 方差分析概述 6.2 单因素方差分析 6.3 多因素方差分析 6.4 协方差分析
2
6.1 方差分析概述
• 方差分析:
– 解决多个总体均值是否相等的检验问题。
– 例如,某饮料生产企业研制出一种新型饮料。 其颜色有四种:橘黄色、粉色、绿色和无色透 明。这四种饮料的营养含量、味道、价格、包 装等可能影响销售量的因素全部相同。现从地 理位置相似、经营规模相仿的五家超级市场上 收集了前一期该种饮料的销售情况如下表。
i 1 j 1
—反映抽样误差的程度
17
单因素方差分析的数学模型
• 假设控制变量A有k个水平,每个水平都有r个样 本,则在水平Ai下的第j个样本的观测值可定义为:
xij i ij ai ij
i 1, 2,, k ; j 1, 2,, r
其中 i 为观测变量在水平Ai下的理论值, 为总 的理论值, ai 为控制变量水平Ai对试验结果产生 k 的附加影响,称为水平Ai的效应,有 i 1 ai 0 且 , 。 ˆi xi x ˆx a
12
F统计量
• 组间方差与组内方差之比是一个服从F分布的 统计量,表示为:
组间方差 F 组内方差
13
方差分析的任务及思路:
• 任务:从观测变量的方差入手,研究诸多控制变 量中哪些变量是对观测变量有显著影响的变量。 对观测变量有显著影响的各个控制变量其不同水 平以及各水平的交互搭配是如何影响观测变量的。 • 思路:从观测变量的方差入手,通过推断控制变 量各水平下各观测变量总体的均值是否存在显著 差异,分析控制变量是否给观测变量带来了显著 影响,进而再对控制变量各个水平对观测变量影 响的程度进行剖析。
28
Levene 检验法
将原样本观察值作离均差变换,或离均差平方变
换,然后执行完全随机设计的方差分析,其检验 结果用于判断方差是否齐性。
(1) dij Yij Yi , (2) dij Yij mdi , (3) dij Yij Yi
2
因为levene检验对原数据是否为正态不灵敏,所 以比较稳健。目前均推荐采用LEVENE方差齐性检 验。
23
步骤:
• 明确观测变量和控制变量。以商品销售额 为观测变量,广告形式和地区为控制变量。 • 给出假设。原假设为:不同广告形式没有 对销售 额产生显著影响(即不同广告形 式对销售额的效应同时 为0);不同地区 的销售额没有显著差异(即不同地区对销 售额的效应同时为0)。 • 剖析观测变量的方差。 • 通过比较观测变量总离差平方和各部分所 占的比例,推断控制变量是否给观测变量 带来了显著影响。
14
方差分析的两个假设前提
• 观察变量各总体应服从正态分布。 • 观察变量各总体的方差应相同。
15
6.2 单因素方差分析
• 单因素方差分析的基本思想
– 研究一个控制变量的不同水平是否对观测变量 产生了显著影响。例如,饮料的不同颜色是否 对销售量有影响;学历高低对工资收入是否有 显著影响等。 一、明确观测变量和控制变量 二、剖析观测变量的方差 三、比较观测变量总离差平方和中各部分的比例。
18
如果控制变量A对观测变量没有影响,则各 水平的效应 ai 应全部为0,否则应不全为0。 这正是方差分析要检验的内容。
1
H0 : a1 a2 ak 0
2. 选择检验统计量
SSA (k 1) MSA F F k 1, n k SSE n k MSE
选入因变量, 可有多个变量
见图 6-3
见图 6--4
见图 6--5
图6-2 One-Way Anova主对话框
22
案例:
某企业在制定某商品的广告策略时,收集
了该商品在不同地区采用不同广告形式促销 后的销售额数据,希望对广告形式和地区是 否对商品销售额产生影响分别进行分析。见 “广告地区与销售额.sav”。
26
单因素方差分析的进一步分析
• • • • 方差齐性检验 多重比较检验 先验对比检验 趋势检验
27
方差齐性检验
• 方差齐性检验是对控制变量不同水平下 各观测变量总体方差是否相等进行分析。
• 方差齐性检验采用了方差同质性检验方 法,其原假设是:控制变量各水平下观 测变量总体的方差无显著差异。思路同 两独立样本T检验中的方差检验。
无色 粉色 橘黄色 绿色
图1 某饮料在五家超市的销售情况
5
• 20个数据各不相同,差异的产生可能来 自于两个方面:
抽样的随机性造成的; 由于人们对不同颜色有所偏爱引起的。
–问饮料的颜色是否对销售量产生影响?
6
某饮料在五家超市的销售情况
超市
1 2
单位:箱
无色
26.5 28.7
粉色
31.2 28.3
3
某饮料在五家超市的销售情况
超市
1 2
单位:箱
无色
26.5 28.7
粉色
31.2 28.3
橘黄色
27.9 25.1
绿色
30.8 29.6
3
4 5
25.1
29.1 27.2
30.8
27.9 29.6
28.5
24.2 26.5
32.4
31.7 32.8
4
35 30 25 20 15 10 5 0 1 2 3 4 5

i
j

2N




i
j

34
• Tukey(杜奇)方法
0.05 0.0975 0.1426 0.1855 0.2262 0.4013 0.6415 0.9231
– 多重比较检验:利用全部观测变量值,实现对 各个水平下观测变量总体均值的逐对比较。避 免犯一类错误概率的扩大。 32
相关主题