当前位置：文档之家› 统计学概论05

统计学概论05

5-18

总体标准差未知时对总体均值检验经常用t统计量： X 0
t s n ~ t (n 1)

但是，在大样本场合(样本容量n大于30时)， t-统计量与标准正态分布统计量近似，通常用 z检验代替t检验。
5-19
总体成数的检验

当样本容量较大时，下列统计量服从标准正态分布：
z p n
5-26

z检验的p-值： z0 检验统计量为z统计量的p-值计算公式，表示检验统计量的抽样数据，则p-值的计算方法如下：如果：H 1 ， 0 p-值=2 pz z0 如果：H 1 ， 0 p-值= pz z 0 如果：H 1 ， 0 p-值= pz z 0
5-11
二、参数检验

参数检验都是先对样本所属总体的性质作出若干的假定，或对总体的分布形状加以限定，然后对总体的有关参数情况进行统计假设检验。因此，参数检验又称为限定分布检验。如在总体服从正态分布条件下，对其均值进行检验。下面通过具体例子来说明参数检验方法。
5-12

在例1中，按历史资料，总体的标准差是4毫升。我们通过检验总体均值是否等于250毫升，来判断饮料厂商是否欺骗了消费者。程序如下：
5-6

构造一个统计量来决定是“接受原假设，拒绝备选假设”，还是“拒绝原假设，接受备选假设”。对不同的问题，要选择不同的检验统计量。检验统计量确定后，就要利用该统计的分布以及由实际问题中所确定的显著性水平，来进一步确定检验统计量拒绝原假设的取值范围，即拒绝域。在给定的显著性水平α下，检验统计量的可能取值范围被分成两部分：小概率区域与大概率区域。小概率区域就是概率不超过显著性水平α的区域，是原假设的拒绝区域；大概率区域是概率为1-α的区域，是原假设的接受区域。
5-13

第一步：确定原假设与备选假设。： H 0 ： =250； H 1 <250 以上的备选假设是总体均值小于250毫升，因为消费者协会希望通过样本数据推断出厂商的欺骗行为(大于250毫升一般不会发生)。因此使用左侧检验。
5-14

第二步：构造出检验统计量。我们知道，如果总体的标准差已知，则正态总体(正常情况下，生产饮料的容量服从正态分布)的抽样平均数，也服从正态分布，对它进行标准化变换，可得到：
5-25
三、p-值检验

p-值检验就是通过计算p-值，再将它与显著性水平α作比较，决定拒绝还是接受原假设。所谓p-值就是拒绝原假设所需的最低显著性水平。p-值判断的原则是：如果p-值小于给定的显著性水平α，则拒绝原假设；否则，接受原假设。或者，更直观来说就是：如果p-值很小，拒绝原假设，p-值很大，接受原假设。请大家注意的是这里的p-值是指概率，不要与成数指标相混淆。
5-38
(二)配对样本场合的符号检验

样本配对场合与单样本场合的符号检验，基本原理是一致的。设从两个总体中分别抽出一个容量相等的样本，然后将两样本的数据进行一一配对，得到一组配对值。再将各对配对值相减，记录下差数的符号，计算出“+” 的个数n+与“-”的个数n-。如果两个样本的总体差异不显著，配对值之差的正负号出现的概率各是1/2，则n+与n-应当非常接近；如果 n+、n-相差太大的话，说明两总体存在显著差异。例子见书上的。
5-4

消费者协会实际要进行的是一项统计检验工作。检验总体平均 =250是否成立。这就是一个原假设(null hypothesis)，通常用 H 0表示，即： H 0 ： =250
5-5

与原假设对立的是备选假设(alternative hypothesis) H 1，备选假设是在原假设被否定时另一种可能成立的结论。备选假设比原假设还重要，这要由实际问题来确定，一般把期望出现的结论作为备选假设。
5-23

第四步：计算检验统计量的数值。样本成数p=220/600=0.37，总体假设的成数ρ =0.3,代入z检验统计量得：
z p 0.37 0.3 0.3 1 0.3 / 600 3.5
1
n
5-24

第五步：判断。检验统计量的样本取值z=3.5>1.645，落入拒绝域。拒绝原假设，接受备选假设，认为样本数据证明该企业声明属实。

1

上式中，ρ代表总体的成数，p代表样本的成数。以上的z统计量可以用作总体成数检验的检验统计量。
5-20

例2：某企业声明有30%以上的消费者对其产品质量满意。如果随机调查600名消费者，表示对该企业产品满意的有220人。试在显著性水平α=0.05下，检验调查结果是否支持企业的自我声明。
5-21

解：第一步：作出假设。 H 0 ：ρ =30%， H:ρ> 30%。 1 以上的备选假设是企业自我声明的结论，我们希望该企业说的是实话。因此使用右侧检：构造z检验统计量。第三步：确定拒绝域。显著水平α=0.05，查标准正态分布表得临界值：z =1.645，拒绝域是z>1.645。
5-33
二、符号检验

该方法是建立在以正、负号表示样本数据与假设参数值差异关系基础上的，因此称之为符号检验。该方法既适用于单样本场合，也适用于配对样本场合。
5-34
(一)单样本场合的符号检验

中位数检验 : H 0 ： e =A M 样本每个数据都减去A，只记录其差数的符号。 n+与n-分别是正、负符号的个数，当原假设为真是时，n+与n-应该很接近；若两者相差太远，就有有理由拒绝原假设。
5-7
二、两种类型的错误
接受
H0
拒绝 H 0 弃真错误(第一类错误或α 错误 )
H 0真实
判断正确
H 0 不真实
取伪错误(第二类判断正确错误或β错误)
5-8
三、检验功效

在犯第一类错误概率得到控制的条件下，犯取伪错误的概率也要尽可能地小，或者说，不取伪的概率1-β应尽可能增大。1-β越大，意味着当原假设不真实时，检验判断出原假设不真实的概率越大，检验的判别能力就越好； 1-β越小，意味着当原假设不真实时，检验结论判断出原假设不真实的概率越小，检验的判别能力就越差。可见1-β是反映统计检验判别能力大小的重要标志，我们称之为检验功效或检验力。
5-29

第五步：判断。 p-值小于给出的显著性水平(0.05)，拒绝原假设，接受备选假设，与例1的结论相同。
5-30
第三节非参数检验

非参数检验是对总体的分布不作任何限制的统计检验。故非参数检验又称为自由分布检验。正因为如此，非参数检验成为管理科学中应用较为广泛的一种统计检验方法。
5-9
第二节

总体参数检验
一、单侧检验与双侧检验
α/2 -Zα/2
1–α
α/2 Zα/2
α –Zα 0 0
α Zα
双侧检验
左侧检验
右侧检验
5-10

用单侧检验还是双侧检验，使用左侧检验还是右侧检验，决定于备选假设中的不等式形式与方向。与“不相等”对应的是双侧检验，与“小于”相对应的是左侧检验，与“大于” 相对应的是右侧检验。
5-32

自由分布检验缺点：由于它对原始数据中包含的信息利用得不够充分，检验的功效相对较弱。当总体的分布形式已知时，基于这种分布类型的参数方法，一般说来比非参数方法为佳。例如，对于一批资料，可同时适用于参数的t-检验、非参数的符秩检验和符号检验。其检验功效是，t-检验的最好，符秩检验次之，符号检验最差。这主要是由于符号检验对信息的利用最不充分。
e
5-37

第三步：确定拒绝域。显著水平α= 0.10，由于进行双侧检验，拒绝域分布在两边，每侧概率α/2=0.05，查二项分布临界值表，得到拒绝域的临界值是13。第四步：选择n+、n-较大者，再与临界值比较。结果是15>13。第五步：判断。由于上一步的比较结果可知，样本落入拒绝域，所以拒绝原假设，认为样本数据不能证明总体中位数等于160件。
第五章假设检验

第一节假设检验概述第二节总体参数检验第三节非参数检验
5-1
第一节假设检验概述

一、假设检验的基本概念假设检验是统计推断的另一种方式，它与区间估计的差别主要在于：区间估计是用给定的大概率推断出总体参数的范围，而假设检验是以小概率为标准，对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来，构成完整的统计推断内容。假设检验分为两类：一类是参数假设检验，另一类是非参数假设检验。本章分别讨论这两类检验方法。
5-2

小概率原理：即指概率很小的事件在一次试验中实际上不可能出现。这种事件称为“实际不可能事件”。
5-3

例1：消费者协会接到消费者投诉，指控品牌纸包装饮料存在容量不足，有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品，测试发现平均含量为248毫升，小于250毫升。这是生产中正常的波动，还是厂商的有意行为？消费者协会能否根据该样本数据，判定饮料厂商欺骗了消费者呢？
5-35

例4：设有20个工人，他们一天生产的产品件数，抽样结果如下： 168，163，160，172，162，168，152，153， 167，165，164，142，173，166，160，165， 171，186，167，170。试以α=0.10的检验水平，判定总体中位数是否是160。

e商务文档

统计学概论05

相关文档推荐：