统计学概论05
5-18
总体标准差未知时对总体均值检验经常用t统 计量: X 0
t s n ~ t (n 1)
但是,在大样本场合(样本容量n大于30时), t-统计量与标准正态分布统计量近似,通常用 z检验代替t检验。
5-19
总体成数的检验
当样本容量较大时,下列统计量服从标准正 态分布:
z p n
5-26
z检验的p-值: z0 检验统计量为z统计量的p-值计算公式, 表示 检验统计量的抽样数据,则p-值的计算方法 如下: 如果:H 1 , 0 p-值=2 pz z0 如果:H 1 , 0 p-值= pz z 0 如果:H 1 , 0 p-值= pz z 0
5-11
二、参数检验
参数检验都是先对样本所属总体的性质作出 若干的假定,或对总体的分布形状加以限定, 然后对总体的有关参数情况进行统计假设检 验。因此,参数检验又称为限定分布检验。 如在总体服从正态分布条件下,对其均值进 行检验。下面通过具体例子来说明参数检验 方法。
5-12
在例1中,按历史资料,总体的标准差是4毫 升。我们通过检验总体均值是否等于250毫升, 来判断饮料厂商是否欺骗了消费者。程序如 下:
5-6
构造一个统计量来决定是“接受原假设,拒绝备选 假设”,还是“拒绝原假设,接受备选假设”。对 不同的问题,要选择不同的检验统计量。检验统计 量确定后,就要利用该统计的分布以及由实际问题 中所确定的显著性水平,来进一步确定检验统计量 拒绝原假设的取值范围,即拒绝域。在给定的显著 性水平α下,检验统计量的可能取值范围被分成两部 分:小概率区域与大概率区域。小概率区域就是概 率不超过显著性水平α的区域,是原假设的拒绝区域; 大概率区域是概率为1-α的区域,是原假设的接受区 域。
5-13
第一步:确定原假设与备选假设。 : H 0 : =250; H 1 <250 以上的备选假设是总体均值小于250毫升,因 为消费者协会希望通过样本数据推断出厂商 的欺骗行为(大于250毫升一般不会发生)。因 此使用左侧检验。
5-14
第二步:构造出检验统计量。 我们知道,如果总体的标准差已知,则正态 总体(正常情况下,生产饮料的容量服从正态 分布)的抽样平均数,也服从正态分布,对它 进行标准化变换,可得到:
5-25
三、p-值检验
p-值检验就是通过计算p-值,再将它与显著性 水平α作比较,决定拒绝还是接受原假设。所 谓p-值就是拒绝原假设所需的最低显著性水 平。p-值判断的原则是:如果p-值小于给定的 显著性水平α,则拒绝原假设;否则,接受原 假设。或者,更直观来说就是:如果p-值很 小,拒绝原假设,p-值很大,接受原假设。 请大家注意的是这里的p-值是指概率,不要 与成数指标相混淆。
5-38
(二)配对样本场合的符号检验
样本配对场合与单样本场合的符号检验,基 本原理是一致的。设从两个总体中分别抽出 一个容量相等的样本,然后将两样本的数据 进行一一配对,得到一组配对值。再将各对 配对值相减,记录下差数的符号,计算出“+” 的个数n+与“-”的个数n-。如果两个样本的总 体差异不显著,配对值之差的正负号出现的 概率各是1/2,则n+与n-应当非常接近;如果 n+、n-相差太大的话,说明两总体存在显著 差异。例子见书上的。
5-4
消费者协会实际要进行的是一项统计检验工 作。检验总体平均 =250是否成立。这就是一 个原假设(null hypothesis),通常用 H 0表示, 即: H 0 : =250
5-5
与原假设对立的是备选假设(alternative hypothesis) H 1,备选假设是在原假设被否定时 另一种可能成立的结论。备选假设比原假设 还重要,这要由实际问题来确定,一般把期 望出现的结论作为备选假设。
5-23
第四步:计算检验统计量的数值。 样本成数p=220/600=0.37,总体假设的成数ρ =0.3,代入z检验统计量得:
z p 0.37 0.3 0.3 1 0.3 / 600 3.5
1
n
5-24
第五步:判断。 检验统计量的样本取值z=3.5>1.645,落入拒 绝域。拒绝原假设,接受备选假设,认为样 本数据证明该企业声明属实。
1
上式中,ρ代表总体的成数,p代表样本的成 数。 以上的z统计量可以用作总体成数检验的检验 统计量。
5-20
例2:某企业声明有30%以上的消费者对其产 品质量满意。如果随机调查600名消费者,表 示对该企业产品满意的有220人。试在显著性 水平α=0.05下,检验调查结果是否支持企业 的自我声明。
5-21
解:第一步:作出假设。 H 0 :ρ =30%, H:ρ> 30%。 1 以上的备选假设是企业自我声明的结论,我 们希望该企业说的是实话。因此使用右侧检 :构造z检验统计量。 第三步:确定拒绝域。 显著水平α=0.05,查标准正态分布表得临界 值:z =1.645,拒绝域是z>1.645。
5-33
二、符号检验
该方法是建立在以正、负号表示样本数据与 假设参数值差异关系基础上的,因此称之为 符号检验。该方法既适用于单样本场合,也 适用于配对样本场合。
5-34
(一)单样本场合的符号检验
中位数检验 : H 0 : e =A M 样本每个数据都减去A,只记录其差数的符号。 n+与n-分别是正、负符号的个数,当原假设 为真是时 ,n+与n-应该很接近;若两者相差 太远,就有有理由拒绝原假设。
5-7
二、两种类型的错误
接受
H0
拒绝 H 0 弃真错误(第一 类错误或α 错误 )
H 0真实
判断正确
H 0 不真实
取伪错误(第二类 判断正确 错误或β错误)
5-8
三、检验功效
在犯第一类错误概率得到控制的条件下,犯 取伪错误的概率也要尽可能地小,或者说, 不取伪的概率1-β应尽可能增大。1-β越大,意 味着当原假设不真实时,检验判断出原假设 不真实的概率越大,检验的判别能力就越好; 1-β越小,意味着当原假设不真实时,检验结 论判断出原假设不真实的概率越小,检验的 判别能力就越差。可见1-β是反映统计检验判 别能力大小的重要标志,我们称之为检验功 效或检验力。
5-29
第五步:判断。 p-值小于给出的显著性水平(0.05),拒绝原假 设,接受备选假设,与例1的结论相同。
5-30
第三节 非参数检验
非参数检验是对总体的分布不作任何限制的 统计检验。故非参数检验又称为自由分布检 验。正因为如此,非参数检验成为管理科学 中应用较为广泛的一种统计检验方法。
5-9
第二节
总体参数检验
一、单侧检验与双侧检验
α/2 -Zα/2
1–α
α/2 Zα/2
α –Zα 0 0
α Zα
双侧检验
左侧检验
右侧检验
5-10
用单侧检验还是双侧检验,使用左侧检验还 是右侧检验,决定于备选假设中的不等式形 式与方向。与“不相等”对应的是双侧检验, 与“小于”相对应的是左侧检验,与“大于” 相对应的是右侧检验。
5-32
自由分布检验缺点: 由于它对原始数据中包含的信息利用得不够 充分,检验的功效相对较弱。当总体的分布 形式已知时,基于这种分布类型的参数方法, 一般说来比非参数方法为佳。例如,对于一 批资料,可同时适用于参数的t-检验、非参数 的符秩检验和符号检验。其检验功效是,t-检 验的最好,符秩检验次之,符号检验最差。 这主要是由于符号检验对信息的利用最不充 分。
e
5-37
第三步:确定拒绝域。 显著水平α= 0.10,由于进行双侧检验,拒绝域分布 在两边,每侧概率α/2=0.05,查二项分布临界值表, 得到拒绝域的临界值是13。 第四步:选择n+、n-较大者,再与临界值比较。 结果是15>13。 第五步:判断。 由于上一步的比较结果可知,样本落入拒绝域,所 以拒绝原假设,认为样本数据不能证明总体中位数 等于160件。
第五章 假设检验
第一节 假设检验概述 第二节 总体参数检验 第三节 非参数检验
5-1
第一节 假设检验概述
一、假设检验的基本概念 假设检验是统计推断的另一种方式,它与区 间估计的差别主要在于:区间估计是用给定 的大概率推断出总体参数的范围,而假设检 验是以小概率为标准,对总体的状况所做出 的假设进行判断。假设检验与区间估计结合 起来,构成完整的统计推断内容。假设检验 分为两类:一类是参数假设检验,另一类是 非参数假设检验。本章分别讨论这两类检验 方法。
5-2
小概率原理:即指概率很小的事件在一次试 验中实际上不可能出现。这种事件称为“实 际不可能事件”。
5-3
例1:消费者协会接到消费者投诉,指控品牌 纸包装饮料存在容量不足,有欺骗消费者之 嫌。包装上标明的容量为250毫升。消费者协 会从市场上随机抽取50盒该品牌纸包装饮品, 测试发现平均含量为248毫升,小于250毫升。 这是生产中正常的波动,还是厂商的有意行 为?消费者协会能否根据该样本数据,判定 饮料厂商欺骗了消费者呢?
5-35
例4:设有20个工人,他们一天生产的产品件 数,抽样结果如下: 168,163,160,172,162,168,152,153, 167,165,164,142,173,166,160,165, 171,186,167,170。 试以α=0.10的检验水平,判定总体中位数是 否是160。