第五章方差分析思考与练习参考答案1.试述方差分析的基本思想。
解答:方差分析的基本思想是,将观察值之间的总变差分解为由所研究的因素引起的变差和由随机误差项引起的变差,通过对这两类变差的比较做出接受或拒绝原假设的判断的。
2.方差分析有哪些基本假设条件?如何检验这些假设条件?解答:(1)在各个总体中因变量都服从正态分布;(2)在各个总体中因变量的方差都相等;(3)各个观测值之间是相互独立的。
正态性检验:各组数据的直方图/峰度系数、偏度系数/Q-Q图,K-S检验*等方差齐性检验:计算各组数据的标准差,如果最大值与最小值的比例小于2:1,则可认为是同方差的。
最大值和最小值的比例等于1.83<2。
也可以采用Levene检验方法。
独立性检验:检查样本数据获取的方式,确定样本之间无相关性。
3.对三个不同专业的学生的统计学成绩进行比较研究,每个专业随机抽取6人。
根据数据得到的方差分析表的部分内容如表5-21。
请完成该表格。
如果显著性水平α=0.05,能认为三个专业的考试成绩有显著差异吗?表5-21 不同专业考试成绩的方差分析表差异源SS df MS F组间193.0 ________ ________ ________组内819.5 ________ ________总计1012.5 ________解答:表5-21 不同专业考试成绩的方差分析表差异源SS df MS F组间193.0 ____2_ __ ____96.5____ 1.766321组内819.5 ____15____ 54.63333总计1012.5 __ 17____查f为三个专业的成绩无显著差异。
根据以下背景资料和数据回答4-7题。
为测试A、B、C、D、E五种节食方案,一位营养学家选择了50名志愿者随机分成五组,每组采用一种方案测量两个月后每个人的降低的体重,得到的实验数据如表5-22。
表5-22 不同节食方案的降低的体重(公斤)序号 方案A 方案B 方案C 方案D 方案E 1 6.5 2.9 8 5.1 11.5 2 11.6 5.5 11.9 2.5 13.2 3 7.7 4.3 8.5 1.5 11 4 8.7 3.6 8.9 2.2 13.1 5 8.4 3.9 9.1 1.4 13.8 6 4.1 6.7 11.4 3.1 12.8 7 8.7 4.5 12.6 5.4 12 8 6.6 1.7 12.4 1.9 11.5 9 7.1 6.5 9.4 4.1 14.6 10 8.9 5.4 10.6 3.6 13.74.不同节食方案的实验效果的描述统计资料如表5-23。
根据这些结果可以认为各组数据是等方差的吗?5-23 不同节食方案的实验效果的描述统计 组 计数 平均 方差 A 10 7.83 3.88 B 10 4.50 2.47 C 10 10.28 2.92 D 10 3.08 2.07 E 10 12.72 1.39解答:方差齐性检验:各组最大方差/最小方差= 2.791367,小于4,认为各总体服从方差齐性基本假定。
Levene 统计量结果如下:与上面结论一致。
方差齐性检验体重变化 Levene 统计量df1df2显著性.592445.6705.利用表5-22的数据进行单因素方差分析,则何为H 0与H 1?解答:若用i μ表示不同节食方案下减重的平均值,则6.用SPSS 软件对表5-22的数据进行方差分析,设显著性水平α=0.05,检验的结论如何?提示:你需要把数据调整为SPSS 需要的形式。
解答:单因素方差分析0125H :μμμ===1125H :,,,不全相等μμμ体重变化平方和df 均方 F 显著性组间634.565 4 158.641 62.300 .000组内114.589 45 2.546总数749.154 49结论:不同节食方案对于减重的效果有显著差异。
7.在上题中我们拒绝了零假设。
试在同样的显著性水平α=0.05的条件下,用SPSS软件中的LSD法检验方案B与其他4种方案差异的显著性。
解答:多重比较因变量: 体重变化LSD(I) 因素(J) 因素均值差(I-J)标准误显著性95% 置信区间下限上限方案A 方案B 3.3300*.7136 .000 1.893 4.767 方案C -2.4500*.7136 .001 -3.887 -1.013 方案D 4.7500*.7136 .000 3.313 6.187 方案E -4.8900*.7136 .000 -6.327 -3.453方案B 方案A -3.3300*.7136 .000 -4.767 -1.893 方案C -5.7800*.7136 .000 -7.217 -4.343 方案D 1.4200 .7136 .053 -.017 2.857 方案E -8.2200*.7136 .000 -9.657 -6.783方案C 方案A 2.4500*.7136 .001 1.013 3.887 方案B 5.7800*.7136 .000 4.343 7.217 方案D 7.2000*.7136 .000 5.763 8.637 方案E -2.4400*.7136 .001 -3.877 -1.003方案D 方案A -4.7500*.7136 .000 -6.187 -3.313 方案B -1.4200 .7136 .053 -2.857 .017 方案C -7.2000*.7136 .000 -8.637 -5.763 方案E -9.6400*.7136 .000 -11.077 -8.203方案E 方案A 4.8900*.7136 .000 3.453 6.327 方案B 8.2200*.7136 .000 6.783 9.657 方案C 2.4400*.7136 .001 1.003 3.877 方案D 9.6400*.7136 .000 8.203 11.077*. 均值差的显著性水平为 0.05。
结论:方案B与方案D无显著差异。
P值为.053略大于显著性水平0.05。
其余各方法差异显著。
8.五个地区每天发生的交通事故次数如表5-24。
由于是随机样本,有些地区的样本容量较大,而有些地区的样本容量较小。
试以α=0.05的显著性水平检验这五个地区平均每天的交通事故次数是否相等。
解答:单因素方差分析事故次数平方和df 均方 F 显著性组间183.868 4 45.967 4.686 .007组内206.017 21 9.810总数389.885 25结论:在α=0.05的显著性水平下,这五个地区平均每天的交通事故次数不等。
9.在α=0.01的显著性水平下求解回答第8题中的问题。
解答:结论:在α=0.01的显著性水平下,这五个地区平均每天的交通事故次数不等。
10.在一次无重复双因素方差分析实验中,因素A有4个水平,因素B有6个水平。
得到的方差分析表的部分内容如表5-25。
完成该表格。
在5%的显著性水平下因素A的影响显著吗?因素B 呢?表5-25 无重复双因素方差分析的方差分析表差异源SS df MS F因素A 77.50 ________ ________ ________因素B 123.83 _______ ________ ________误差92.50 _______ ________293.83解答:因素A77.5 ___3_____ 25.833333 0.8378378因素B123.83 ___5_____ 41.276667 1.3387027误差92.5 ___15_____ 30.833333总计293.83 ___24_____结论:查f在5%的显著性水平下因素A的影响不显著,因素B的影响不显著。
11.为了比较三个不同专业毕业生的收入设计了以下实验:从三个专业毕业两年的毕业生中,按毕业时的平均学习成绩(分为6个等级)各选择一名学生进行调查,调查结果如表5-26。
显著性水平α=0.01。
试分析不同专业毕业生的收入有显著差异吗?学习成绩对收入有显著影响吗?表5-26不同专业毕业生的月收入(百元)平均成绩会计营销经济A+ 51 45 41A 45 38 36B+ 31 33 27B 35 29 32C+ 32 31 26C 27 25 23解答:入有显著影响。
12.在一次双因素方差分析实验中,因素A和因素B各有3个水平,在每种实验条件下重复进行了2次实验。
得到的方差分析表的部分内容如表5-27。
完成该表格。
在5%的显著性水平下因素A的影响显著吗?因素B呢?二者的交互作用是否显著?表5-27 不同专业考试成绩的方差分析表差异源SS df MS F因素A 6100 ________ ________ ________因素B 45300 ________ ________ ________AB的交互作用11200 ________ ________ ________误差19850 ________ ________总计82450 ________解答:差异源SS df MS F因素A6100 2 3050 1.3828715因素B45300 2 22650 10.269521AB的交互作用11200 4 2800 1.2695214误差19850 9 2205.5556总计82450 17结论:查F分布表,可知,在5%的显著性水平下因素A的影响不显著,因素B影响显著,二者的交互作用影响不显著。
[pf(1.3829,2,9)= 0.7005475,pf(10.2695,2,9)= 0.9952425,pf(1.2695,4,9)= 0.6494955]13. 人们通常认为,一个人的学历越高其工资也会越高。
同时,性别也可能是影响工资水平的一个因素。
为了对两个因素进行研究,一名研究人员从毕业两年的学校毕业生中根据学历和性别随机选择了30人,他们的工资水平、学历和性别资料如表5-28。
假设数据是正态的和等方差的。
在α=0.05的显著性水平下,试回答:(1)学历对工资的影响显著吗?(2)性别对工资的影响显著吗?(3)学历和性别的交互作用显著吗?学历:1=中专2=本科3=研究生解答:主体间效应的检验因变量: 工资源III 型平方和df 均方 F Sig.校正模型35557666.667a 5 7111533.333 36.752 .000截距285208333.333 1 285208333.333 1473.945 .000性别3816333.333 1 3816333.333 19.723 .000学历30680666.667 2 15340333.333 79.278 .000性别 * 学历1060666.667 2 530333.333 2.741 .085(1)学历对工资影响显著(2)性别对工资影响显著(3)学历和性别的交互作用影响不显著。