多元统计分析实验报告
第二部分:实验过程记录(可加页) (包括实验原始数据记录,实验现象记录,实验过程发现的问题
等) 操作步骤: 1、 执行“分析”—“比较均值”—“单因素方差分析” ; 2、 在弹出的单因素方差分析对话框中,将时期选为因子,将 X1、X2、X3、X4 选为因变量; 3、 单击“对比” ,选择“多项式” ,在后面的下拉菜单中选择“线性” ,然后继续; 4、 单击“两两比较” ,选择“LSD”和“S-N-K” ,显著性水平默认为 0.05,然后继续; 5、 单击“选项” ,选择“方差同质性检验”和“均值图” ,然后继续,点击“确定”后即可输出结果。
12
题目:研究者提出,随着时间的推移头骨尺寸会发生变化,这是外来移民与原住民人口民族融合的证据。表 6.13 是古埃及三个时期的男性头骨的四个观测值得观测数据,这是个观测变量是: X1=头骨最大的最大宽度 X2=头骨高度 X3=头骨底穴至齿槽的长度 X4=头骨鼻梁高度 对古埃及头骨数据构造单因子 MANOVA 表, a=0.05.并构造 95%联合置信区间来判断在三个时期中哪个分 令 量的均值发生了改变。同常的 MANOVA 假设对这些数据是不是合理的?请解释。 部分数据如下:
实验课程名称:多元统计分析-均值向量检验
实验项目名称 实 验 者 同 组 者
均值向量检验习题 均值向量检验习题 6.24
专业班级
实验成绩 实验成绩 组 别 年 月 日
实验日期
一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,主要仪器设备及耗材,实验
方案与技术路线等) 实验目的:深入了解方差分析及方差分析的概念,掌握方差分析的基本原理;掌握方差分析的过程;增强实 践能力,能够动手用统计软件解决实际问题,熟练掌握方差分析的基本操作。 实验原理:多个正态总体均值向量检验(多元方差分析) 设 有 k 个 p 元 正 态 总 体 N p ( µ1 , Σ), L , N p ( µ k , Σ) , 从 每 个 总 体 抽 取 独 立 样 品 个 数 分 别 为
均值图
教师签字__________
第三部分 结果与讨论(可加页)
一、实验结果分析(包括数据处理、实验现象分析、影响因素讨论、综合分析和结论等) 二、小结、建议及体会 三、思考题 1、方差分析结果: 从该结果可以看到:对于分量 X1,方差检验的 F 值为 3.660,相伴概率为 0.030<显著性水平 0.05,因此 X1 在三个时期的三组有显著性差异;对于分量 X2,方差检验的 F 值为 0.466,相伴概率为 0.629>显著性水平 0.05,因此 X2 在三个时期的三组没有显著性差异或其中一个组与其他两个组没有明显区别;对于分量 X3, 方差检验的 F 值为 3.845,相伴概率为 0.025<显著性水平 0.05,因此 X3 在三个时期的三组有显著性差异; 对于分量 X4,方差检验的 F 值为 0.105,相伴概率为 0.901>显著性水平 0.05,因此 X4 在三个时期的三组 没有显著性差异或其中一个组与其他两个组没有明显区别。 因为 F 值均大于 Sig,拒绝院假设:所有的均值相等。这与均值图所反映的结果一致。而随着时间的 推移,头骨尺寸的变化只要是由于头骨最大宽度 X1 以及头骨底穴至齿槽的长度 X3 的变化引起的。 2、LSD 法多重比较的结果 95%置信区间
1
令 V = −(n + m − ( p + m + 1) 2) ln Λ
1 − Λ L tL − 2λ ⋅ R= 1 pm ΛL
式中
t = n + m − ( p + m ห้องสมุดไป่ตู้ 1) 2
p2m2 − 4 L= 2 p + m2 − 5 pm − 2 λ= 4 2 则 V 近似服从 χ ( pm) ,R 近似服从 F ( pm, tL − 2λ ) ,这里 tL − 2λ 不一定为整数,可用与它最近的整数来作 为 F 的自由度,且 min ( p, m) > 2 。
1 1 (1 此处 X i(1) = ( X i(1 ) , X i(2) , L , X ip ) ), i = 1, L , n 1
(2 X 11 ) ( 2) X 21 第二个总体: M ( 2) X n1 2 (2) (2 2 X 12 ) L X 1(p ) X 1 (2 ( ( X 22 ) L X 22) X 22 ) p ∆ M M M ( ( X n2 ) L X n 2 ) X ( 2 ) 2 p 2 2 n2
多重比较 95% 置信区间 因变量 头骨的最大宽度 X1 (I) 时期 (J) 时期 下限 LSD 1 2 3 2 1 3 3 1 2 头骨的高度 X2 LSD 1 2 3 2 1 3 3 1 2 头骨底穴至齿槽的长度 X3 LSD 1 2 3 -3.32 -5.42 -1.32 -4.42 .78 -.22 -1.51 -2.61 -3.31 -3.51 -2.21 -1.31 -2.45 .58 上限 1.32 -.78 3.32 .22 5.42 4.42 3.31 2.21 1.51 1.31 2.61 3.51 2.65 5.69
k ( 此处 X i( k ) = ( X i(1k ) , X i(2 ) , L , X ipk ) ), i = 1, L , n k
全部样品的总均值向量: X =
1× p
1 n
∑∑ X
a =1 i =1 na
k
na
(a) i ∆( X 1 ,
X 2 ,L, X p )
各总体样品的均值向量: X
此之后检验
多重比较 95% 置信区间 因变量 头骨的最大宽度 X1 LSD (I) 时期 (J) 时期 1 2 3 2 1 3 3 1 2 头骨的高度 X2 LSD 1 2 3 2 1 3 3 1 2 头骨底穴至齿槽的长度 X3 LSD 1 2 3 2 1 3 3 1 2 头骨鼻梁高度 X4 LSD 1 2 3 2 1 3 3 1 2 下限 -3.32 -5.42 -1.32 -4.42 .78 -.22 -1.51 -2.61 -3.31 -3.51 -2.21 -1.31 -2.45 .58 -2.65 .48 -5.69 -5.59 -1.29 -1.63 -1.89 -1.93 -1.56 -1.26 上限 1.32 -.78 3.32 .22 5.42 4.42 3.31 2.21 1.51 1.31 2.61 3.51 2.65 5.69 2.45 5.59 -.58 -.48 1.89 1.56 1.29 1.26 1.63 1.93
(a )
1× p
=
1 na
∑X
i =1
(a) (a ) i ∆( X 1 ,
X 2 ,L, X
(a)
(a ) p ),
a = 1, L , k
此处 X
(a) j
=
1 na
∑X
i =1
na
(a ) ij
j = 1, L , p
类似一元方差分析办法,将诸平方和变成了离差阵有:
A=
∑n
a =1
k
a (X
2
1 3
-2.65 .48 -5.69 -5.59 -1.29 -1.63 -1.89 -1.93 -1.56 -1.26
2.45 5.59 -.58 -.48 1.89 1.56 1.29 1.26 1.63 1.93
3
1 2
头骨鼻梁高度 X4
LSD 1
2 3
2
1 3
3
1 2
所有的置信区间都包含 0 在内,所有头骨的变化只是在一些边缘上的变化,主体上并没有发生大变化。而这 些变化主要是三个时期头骨最大宽度和头骨底穴至齿槽的长度发生变化了,其他两项保持了较好的稳定性。 3、假设是否成立 从同质性方差分析可以看出,方差相等的假设条件成立。通常的方差分析有如下三个假设:(1)每个总体服 从正态分布。 (2)各个总体的方差必须相同。 (3)观察值是独立的。将其与本题比较,我们发现这些条件都 能较好的符合,所以通常的假设是成立的。
(a)
− X ) ′( X
(a)
− X ) LL
(a )
组间离差阵
E= T=
∑∑ ( X
a =1 i =1 k na
k
na
(a) i
−X
(a)
) ′( X i
(a)
−X
(a)
) LL
组内离差阵 总离差阵
∑∑ ( X
a =1 i =1
(a) i
− X )′( X i
− X ) LL
这里 T=A+E 欲检验假设 H 0 : µ1 = µ 2 = L = µ k
n1 , n 2 , L , n k , n1 + L + n k ∆n ,每个样品观测 p 个指标得观测数据如下:
(1 X 11) (1) X 21 第一个总体: M (1) X n11 (1 X 12) L X 1(1) X 1(1) p (1 ( ( X 22) L X 21p) ∆ X 21) = M M M ( (1 ( X n1) L X np)1 X n1) 2 1
H 1 : 至少存在i ≠ j , 使µ1 ≠ µ j
用似然比原则构成的检验统计量为: E E Λ= = ~ Λ ( p, n − k , k − 1) T A+ E 如下 χ 分布或 F 分布来近似。 设 Λ ~ Λ ( p , n, m )
2
给定检验水平 α ,查 Wilks 分布表,确定临界值,然后作出统计判断。当手头没有 Wilks 分布表时可用
方差齐性检验 Levene 统计量 头骨的最大宽度 X1 头骨的高度 X2 头骨底穴至齿槽的长度 X3 头骨鼻梁高度 X4 1.146 .215 1.339 .832 df1 2 2 2 2 df2 87 87 87 87 显著性 .323 .807 .267 .439