当前位置:文档之家› 应用多元统计分析-第三章 均值向量和协差阵检验

应用多元统计分析-第三章 均值向量和协差阵检验


请问:调查结果是否 说明这批妇女的身高 升高了?
为什么要假设检验?
为了回答这个问题,我们必须知道: 样本平均身高与总体平均身高之差
x X 162160 2cm
是由什么原因造成(或带来)的,即 是抽样误差造成的身高没变化
2cm产生的原因 不仅是误差, 确实是身高发生了变化
为什么要假设检验?
又如:同一位老师教授统计系本科两个 班同一门课程,如果两个班考试内容和 形式完全一样,但是平均成绩却不同: 一班28人,平均成绩74.82分,标准差 10.06分 三班38人,平均成绩76.74分,标准差9.11 分 请问:这两个班的平均成绩是否有显著 的差异?(学生成绩.sav)
这样的例子很多,其实只要我们进行比 较、判断时:总体与样本比,不同总体 之间比,样本与样本比等,都要用到假设 检验。
那么如何检验呢?
如何假设检验?
还是回到妇女身高的例子,已知样本均值与总 体均值相差2cm,这2cm是如何造成的?
是抽样误差造成的身高没变化 2cm产生的原因
不仅是误差, 确实是身高发生了变化
假设检验的过程-以妇女身高为例
形式上,上面的关于总体均值的H0相对 于H1的检验记为:
H0 : 160cm H1 : 160cm 我们将 H1 : 160 cm 的假设称为双
尾检验 ,即前面说述的假设检验。
假设检验的过程-以妇女身高为例
如果备选假设为:
H1 : 160 cm
或:
H1 : 160 cm
n
如果 (x X ) 2cm 真是由抽样误差造成的, 那么它就不应该大于2或3个标准差,即
(x
X
)
2或3
n
如何假设检验?
反之,如果:
(
x
X
)
2或3
n
那么我们说不应该发生的小概率发生了, 即2cm的误差不仅是由抽样误差带来的,而 且确实是样本均值与总体均值发生了显著 的差异。即这批妇女的身高增高了!
如何假设检验?
在用计算机软件进行假设检验时,计算 机输出的检验结果是:t-值和p-值(p-
value)
T值就是我们刚才计算过的t值,对于不 同的分布,计算t值的方法和公式不一样。 p-值(p-value)就是对应于t值及之外的双 尾概率,即小概率。
这就是双尾概率,p值为0.045,即p=4.5%
假设检验的过程
第二,确定检验统计量 。 有了两个假设,就要根据数据来对它们 进行判断。
根据零假设(不是备选假设!)来判断:
如果是检验均值的,那么一般是在正态 总体分布的背景下检验的。 如果是检验比例的,那么就要用到非参 数检验。
假设检验的过程
第三,确定显著性水平
根据样本所得的数据来拒绝零假设的概 率应小于0.05,当然也可能是0.01, 0.005,0.001等等。 显著性水平就是小概率水平,但小概率 并不能说明不会发生,仅仅是发生的概 率很小罢了。拒绝正确零假设的错误常 被称为第一类错误(type I error)。
这一步一般都可由计算机软件来完成。
第五,进行判断:如果p-值小于或等于a,
就拒绝零假设,这时犯错误的概率最多
抽样误差,即(x X )在 2 范围内的概率为99.45%
n
.即: P 2
n
(x
X)
2
n
99.45%
抽样误差,即(x X )在 3 范围内的概率为99.73%
n
.即:
P 3
n
(x
X)
3
n
99.73%
如何假设检验?
因此我们就需要计算:样本均值与总体 均值的差究竟等于几个标准差,即:
假设检验的过程
有第一类错误,就有第二类错误; 那是备选假设正确时反而说零假设正确 的错误,称为第二类错误(type II error)。 在一般的假设检验问题中,由于备选假 设往往不是一个点,所以无法算出犯第 二类错误的概率。
假设检验的过程
第四,根据数据计算检验统计量的实现
值(t-值)和根据这个实现值计算p-值;
如何假设检验?
首先可假设这2cm的误差是由抽样误差造 成的。 在总体参数估计中我们学过了样本均值 的分布:
样本均值 (x)服从N ( X , )
n
即:
样本均值(x)服从正态分布N (X, )
n
即: x N (160, 5
)
100
如何假设检验?
那么: (x X ) 2cm,等于 ?个标准差 呢?
第三章 多元正态总体
均值向量和斜方差阵 的检验
第一节
假设检验的回顾
为什么要假设检验?
我们举妇女身高的例子, 如果在2002年对10000 名妇女的身高进行了全 面调查,得出平均身高 为160cm,标准差为5cm。
在2004年对该妇女(还 是原总体)进行了随机 抽样调查,调查了100 名妇女,测得样本身高 162cm,标准差为5cm。
则称为单尾检验。 需要选择何种备选假设,则需根据需要决 定。
假设检验的过程-以妇女身高为例
需要注意的是:计算机输出结果中的p值 是双尾检验的概率。 如果备选假设选择的是单尾检验,则要 将计算机给的p值除以2,即取p值的一半。
计算机给的p值为0.045,即p=4.5%, 如果是单尾检验,则p=0.045/2=0.0225
为什么要假设检验?
还有:某减肥产品夸口说它的减肥效果 是如何如何的好,如果我们有一些志愿 者对该产品试服减肥,减肥前和减肥后 的体重发生了一些差异。(具体数据见 spss数据:diet.sav) 请问:体重发生的差异是否显著的?即 减肥是否真有效果,是否能相信该减肥 产品的减肥效果?
为什么要假设检验?
t
(x
X
)
162 5
160
2 0.5
4
n
100
所以说明样本均值与总体均值的差不仅是 抽样误差,而是确实两者之间存在着显著 的差异,即该批妇女的身高增高了!
如何假设检验?
小概率事件:在一次事件中几乎不可能 发生的事件。
一般称之为“显著性水平,用 表示。
显著性水平一般取值为:
0.05,即5% 0.01,即1%
假设检验的过程-以妇女身高为例
首先要提出一个原假设,如妇女身高的
均值等于160cm( 160cm)。这种原假
设也称为零假设(null hypothesis),记 为H0。 与此同时必须提出对立假设,如妇女身
高均值不等于160cm( 160c)m。对立
假设又称为备选假设或备择假设 (alternative hypothesis)记为H1。
相关主题