当前位置:文档之家› 管理统计学-第4章 假设检验

管理统计学-第4章 假设检验


• 在本例中,
_
x 32 35
3.184
s / n 5.96 / 40
⑤作出统计决策
• 根据样本信息计算出统计量z的具体值,Z 将它与临界值 相比较,就可以作出接受 原假设或拒绝原假设的统计决策。
• 在本例中,由于z=3.184>1.96,落在拒绝 域内,所以拒绝原假设H0。可以得出结论:
在0.05的显著性水平下,抽样结果的平
– p<α,拒绝零假设 – p>α,不应拒绝零假设
举例1
• 某健身俱乐部主管经理估计会员的平均年 龄是35岁,研究人员从2005年入会的新 会员中随机抽取40人,调查得到他们的年 龄数据如下。
33 28 32 26 37 35 27 29 33 30 35 29 39 34 27 37 34 36 31 29 29 26 19 21 36 38 42 39 36 38 27 22 29 34 36 20 39 37 22 39
素有:总体方差已知还是未知,用于进行检验的
样本是大样本还是小样本,等等。
• 在本例中,由于n=40>30是大样本,所以 近似
服从正态分布,以样本标准差代替总体标准差, 所用的统计量是:
_
x
3.184
s/ n
③选取显著性水平,确定接受域和拒绝域
• 显著性水平(Significant Level):事先给定的形 成拒绝域的小概率,用表示。
(3)右单侧检验
两侧,左单侧检验的拒绝域位于统计量分布曲线的左侧,
右单侧检验的拒绝域位于统计量分布曲线的右侧。
④计算检验统计量的值
• 在提出原假设H0和备选假设H1,确定了检验统计 量,给定了显著性水平以后,接下来就要根据
样本数据计算检验统计量的值。其计算的基本公
式为:
_
Z x 0 / n
• 上式不是计算检验统计量的唯一公式
。判断规则为:若
z>1.96或z<-1.96z, / 2则拒1绝.96H0;若-1.96≤z ≤1.96, 则不能拒绝H0。
– (4)计算统计量Z的值
_
x
Z
33400 32808 2.19
/ n 3820/ 200
– (5)检验判断:由于 Z 2.19 Z /2 1.96 , 落在拒绝域,故拒绝原假设H0。
临界值 1 临界值 2
原假设与备择假设的确定
• 若想支持某种假设,把它作为备择假设, 把该陈述的否定假设作为原假设
• 两种假设互斥且完备,接受H0 ,必须拒绝 H1
• 一个特定形式的H1不只与唯一的H0相对
4.1.5 假设的两类错误分析
4.1.5 假设的两类错误分析
4.1.5 假设的两类错误分析
– 结论:以5%的显著性水平可以认为该市2006 年的职工平均工资比2005年有明显的差异。
已知,均值的单侧Z检验
• 1. 假设
– 总数服从正态分布; – 当(n 30)时,不服从正态分布的总体可以用
正态分布来逼近。
• 2. 零假设只有 或者 号
• 3. 使用Z检验统计量
Z
X x x
X
/ n
• 1. 假设
– 总体服从正态分布; – 当(n 30)时,不服从正态分布的总体可以用
正态分布来近似。
• 2. 零假设只有“=”号 • 3. 使用Z检验统计量
Z
X x x
X / n
抽样分布
拒绝域
1/2
拒绝域
置信度 拒绝域
1 -
非拒绝域
1/2
临界值
H0 临界值 样本统计量
举例
• 2005年北京市职工平均工资为32808元, 标准差为3820元。现在随机抽取200人进 行调查,测定2006年样本平均工资为 34400元。按照5%的显著性水平判断该 市2006年的职工平均工资与2005有无显 著差异?
假设检验
两个总体均值差 的假设检验
已知
未知
大样本
小样本
4.2.1 一个正态总体参数假设检验
• 已知的Z检验
已知的Z检验
• 1. 将样本统计量(如X )转换为标 准正态分布Z变量
Z
X x x
X
/ n
• 2. 与Z的临界值比较
– 如Z检验统计量的值落在临界域内则 拒绝H0
– 否则,不能拒绝H0
已知,均值的双侧Z检验
备择假设
• 1. 为原假设的对立情况
– 例如: H1: ≠ 35
• 2. 备择假设用H1表示 • 3. 代表“不能轻易肯定的情况” • 4. 很少包含等号
②确定适当的检验统计量
• 假设检验需要借助样本统计量进行统计推断,称
为检验统计量。不同的假设检验问题需要选择不
同的检验统计量。
_
• 在具体问题中,选择什么统计x 量,需要考虑的因
样本均值是32岁
样本
基本原理
抽样分布
这是样本均值
如果这是 总体均值
判断:拒绝or 不拒绝零假设
= 35?
32 = 35
H0
样本均值
4.1.2 假设检验的分类
• 假设检验包括:参数假设检验和非参数假 设检验
– 参数假设检验:X1,X2,…,Xn是来自分布形式已 知、参数未知总体的样本,由其观测值检验假 设H0:=0; H1: ≠0, 为已知实数
• 假设检验:施加于一个或多个总体的概率分布或 参数的假设
– 假设总体分布的形式或总体的参数有某种特征 – 判断原先的假设是否合理
• 合理:承认假设的正确性 • 不合理:否定原先的假设
– 对问题作出分析或推断
假设检验的过程和思路
——概率意义下的反证法
假设总体的 平均年龄是35岁
总体
判断
X 32 35?
• 试根据调查结果判断主管经理的估计是否 准确?
①提出原假设和备选假设
• 原假设(Null hypothesis)又称零假设, 是需要通过样本推断其正确与否的命题, 用H0表示。
– 本例中可以提出: H0 : 35;这里表示总
体会员的平均年龄,意味着总体会员的平均 年龄与主管经理估计的35岁没有差异。
第4章 假设检验
4.1 假设检验的基本原理 4.2 参数假设检验 4.3 非参数假设检验
例: ➢某种大量生产的袋装食品,按规定每袋重量不 得少于250g。 今从一批该种食品中任意抽取50 袋,发现有6袋低于250g 。若规定不符合标准 的比例达到5%,食品就不得出厂,问该批食品 能否出厂。 ➢从2000年的新生儿中随机抽取30个,测得其 平均体重为3210g,而根据1999年的统计资料,新 生儿的平均体重为3190g,问2000年的新生儿与 1999年相比,体重有无显著差异。
• 与 示原 。假设对立的假设是备选假设,用H1表
– 在本例中,备选假设意味着“总体会员的平 均年龄与主管经理估计的会员平均年龄35岁 有显著差异”,可以表示为H1 : ≠35。
原假设
• 1. 陈述需要检验的假设
– 例如: H0: 35
• 2. 零假设用 H0 表示 • 3. 代表“正常”的情形 • 4. 总是包含等号“=” • 5. 检验以“假定原假设为真”开始
拒绝域
H0: 0 H1: < 0
拒绝域
H0: 0 H1: > 0
拒绝域
1 -
1-
0
Z
0
Z
较小的值与H0不矛盾.
举例
• 已知某电子产品的使用寿命服从正态分布, 根据历史数据,其平均使用寿命为8000小 时,标准差为370小时。现采用新的机器设 备进行生产,随机抽取了100个产品进行检 测,得到样本均值为7910小时。试问在5% 的显著性水平下,新的机器是否合格?
解答
• 这是一个左单侧检验问题。抽样的目的是为了检测新机器生 产的产品的使用寿命是否达到标准,我们比较关心的是使用 寿命的下限,如果新产品的使用寿命与过去相比没有明显降 低,则说明所使用的新机器合格;反之,则说明新机器不合 格。检验过程如下: – (1)提出假设: H0:≥8000;H1:8000;
– 左尾检验、右尾检验和双尾检验
1HH10
: :
0 0
2HH10
: :
0 0
– H0为原假设,H1为备择假设
α
1-α
1-α
α
α/2
μ=μ0 拒绝 H0 临界值
x 接受 H0 接受 H0
x μ=μ0
临界值 拒绝 H0
x
μ=μ0
拒绝 H0
接受 H0
拒绝 H0
4.1.6 总体参数检验的步骤
(1)提出假设
– 根据检验目标,对待推断的总体参数或分布提出一个 基本假设
(2)决定检验的显著性水平α
– 由被检验的统计量分布求出相应的临界值 – 该临界值为零假设的拒绝域和接受域的分界线
(3)构造检验统计量,依据样本信息计算检验统 计量的实际值
(4)将实际求得的检验统计量取值与临界值进行 比较,作出拒绝或接受零假设的决策
• 某健身俱乐部欲根据往年的会员情况,制 定2006年的会员发展营销策略。主管经理 估计俱乐部会员的平均年龄是35岁,其中 25~35岁的会员占总人数的70%。研究人 员从2005年入会的新会员中随机抽取40人, 调查得知他们的平均年龄是32岁,其中 25~35岁的会员占74%。根据这份调查结 果,问主管经理的对会员年龄的估计是否 准确?
解答
• 在本例题中,我们关心的是前后两年职工的平 均工资有没有显著的差异,不涉及差异的方向,
因此,本题属于双侧检验。检验过程如下:
– (1)提出假设: H0:32808;H1:≠32808; – (2)总体标准差已知,大样本抽样,故选用Z
统计量;
相关主题