当前位置：文档之家› 统计学第6章假设检验与方差分析

统计学第6章假设检验与方差分析

24
五、双侧检验和单侧检验
/2
–Z /2
1–
(a)双侧检验 Z / 2
/2

– Z
0 (b)左侧检验
0 Z (c)右侧检验
25
图6-1 双侧、单侧检验的拒绝域分配
表6-1 拒绝域的单、双侧与备择假设之间的对应关系
拒绝域位置双侧左单侧
P-值检验的显著性水平判断标准
原假设 H0:θ＝θ0 H0:θ≥θ0
40
例：已知初婚年龄服从正态分布。根据9个人的调查结果，样本均值为 X 23.5 岁，样本标准差s=3岁。问是否可以认为该地区初婚年龄数学期望以及超过20岁（ 0.05 ）
41
（四）总体分布未知，总体方差未知，大样本 • 来自总体的样本为(x1, x2, …, xn)。 • 对于假设： H0: = 0，在H0成立的前提下，如果总体偏斜适度，且样本足够大，近似地有检验统计量
29
• 在样本容量n不变的条件下，犯两类错误的概率常常呈现反向的变化，要使和都同时减小，除非增加样本的容量。 • 为此，统计学家奈曼与皮尔逊提出了一个原则，即在控制犯第一类错误的概率情况下，尽量使犯第二类错误的概率小。 • 在实际问题中，我们往往把要否定的陈述作为原假设，而把拟采纳的陈述本身作为备择假设，只对犯第一类错误的概率加以限制，而不考虑犯第二类错误的概率。
6
二、原假设与备择假设
• 原假设一般用H0表示，通常是设定总体参数等于某值，或服从某个分布函数等； • 备择假设是与原假设互相排斥的假设，原假设与备择假设不可能同时成立。 • 所谓假设检验问题实质上就是要判断H0是否正确，若拒绝原假设H0 ，则意味着接受备择假设H1 。
7
• 如在例6-1中，我们可以提出两个假设： • 假设平均袋装咖啡重量与所要控制的标准没有显著差异，记为H0: = 150； • 假设平均袋装咖啡重量与所要控制的标准有显著差异，记为H1: 150。
8
三、检验统计量
• 所谓检验统计量，就是根据所抽取的样本计算的用于检验原假设是否成立的随机变量。 • 检验统计量中应当含有所要检验的总体参数，以便在“总体参数等于某数值”的假定下研究样本统计量的观测结果。
9
• 检验统计量还应该在“H0成立”的前提下有已知的分布，从而便于计算出现某种特定的观测结果的概率。
33
第二节总体均值为某定值的显著性检验
34
• 注意：
• 总体指在随机试验中所观测的随机变量。
• 总体均值指的是随机变量的期望值。
35
总体均值的显著性检验包括：
• 双尾情况 • 左单尾 • 右单尾
36
• 如下就 • 总体分布的不同情况 • 总体方差是否已知的不同情况 • 样本大小的不同情况分别介绍检验统计量和检验规则。
第六章假设检验与方差分析
第一节第二节第三节第四节第五节第六节假设检验的基本原理总体均值的假设检验总体比例的假设检验单因子方差分析双因子方差分析 Excel在假设检验与方差分析中的应用
掌握要点
• 假设检验的基本原理和步骤，以及相关概念 • Z统计量、t统计量、F统计量的计算和应用 • 方差分析的基本概念 • 针对单因素、双因素的方差分析构造F统计量
37
（一）总体为正态分布，总体方差已知，样本不论大小 • 来自总体的样本为(x1, x2, …, xn)。 • 对于假设： H0: = 0，在H0成立的前提下，有检验统计量
Z
X 0

2
~ N (0,1)
n
38
（二）总体分布未知，总体方差已知，大样本 • 来自总体的样本为(x1, x2, …, xn)。 • 对于假设： H0: = 0，在H0成立的前提下，如果样本足够大（n≥30），近似地有检验统计量
4
• 所谓假设检验，就是事先对总体的参数或总体分布形式做出一个假设，然后利用抽取的样本信息来判断这个假设（原假设）是否合理，即判断总体的真实情况与原假设是否存在显著的系统性差异，所以假设检验又被称为显著性检验。
5
• 一个完整的假设检验过程，包括以下几个步骤：（1）提出假设；（2）构造适当的检验统计量，并根据样本计算统计量的具体数值；（3）规定显著性水平，建立检验规则；（4）做出判断。
• 至于小概率的标准是多大？这要根据实际问题而定。 • 假设检验中，称这一标准为显著性水平，用来表示。 • 在应用中，通常取 =0.01， =0.05。一般来说，犯第一类错误可能造成的损失越大，的取值应当越小。 • 对假设检验问题做出判断可依据两种规则： • 一是P-值规则； • 二是临界值规则。
10
例6-2
• 构造例6-1的检验统计量,并计算相应的样本观测值。
11
解： H 0 : 150， H 1 : 150 。由于咖啡的分袋包装生产线的装袋重量服从正态分布，所以其简单随机样本的均值 X 也服从正态分布。我们把 X 标准化成为标准正态变量
Z X E( X ) V (X ) ~ N (0 , 1)
15
（一）P-值规则
所谓P-值，实际上是检验统计量超过 (大于或小于)具体样本观测值的概率。如果P-值小于所给定的显著性水平，则认为原假设不太可能成立；如果P-值大于所给定的标准，则认为没有充分的证据否定原假设。
16
例6-3
• 假定 =0.05，根据例6-2的结果，计算该问题的P-值，并做出判断。
30
七、关于假设检验结论的理解
• 这就是说，在假设检验中，相对而言，当原假设被拒绝时，我们能够以较大的把握肯定备择假设的成立。而当原假设未被拒绝时，我们并不能认为原假设确实成立。
31
注意：显著性检验到底回答了什么样的问题？
• 显著性检验只是回答了所观察到的差异（样本数据与我们对总体所作的推测之间的差异）是纯属于机会变异，还是反映了真实的差异？
Z
X 0 s n
2
~ N (0,1)
42
例6-5
• 某厂采用自动包装机分装产品，假定每包产品的重量服从正态分布，每包标准重量为1000克，某日随机抽查9包，测得样本平均重量为986克，样本标准差是24克。 • 试问在α=0.05的显著性水平上，能否认为这天自动包装机工作正常？
18
• 例： • 某电视机厂声称其产品耐用时间超过 1200小时。随机抽取100件产品后测得均值为1251小时，标准差s=300小时。 • 问该厂产品耐用时间是否高于1200小时？ • （显著水平0.05）
19
（二）临界值规则
• 假设检验中，还有另外一种做出结论的方法： • 根据所提出的显著性水平标准（它是概率密度曲线的尾部面积）查表得到相应的检验统计量的数值，称作临界值。 • 直接用检验统计量的观测值与临界值作比较，观测值落在临界值所划定的尾部（称之为拒绝域）内，便拒绝原假设；
17
• 解：查标准正态概率表， • 当z=2.29时，阴影面积为0.9890，尾部面积为1-0.9890=0.011，由对称性可知，当z= – 2.29时，左侧面积为0.011。 0.011≤/2=0.025 0.011这个数字意味着，假若我们反复抽取 n=100的样本，在100个样本中仅有可能出现一个使检验统计量等于或小于–2.29的样本。该事件发生的概率小于给定的显著性水平，所以，可以判断μ=150的假定是错误的，也就是说，根据观测的样本，有理由表明总体的与150克的差异是显著存在的。
2
第一节假设检验的基本原理
一什么是假设检验
二原假设与备择假设
三检验统计量四显著性水平、P-值与临界值
五双侧检验和单侧检验六假设检验的两类错误七关于假设检验结论的理解
3
一、什么是假设检验
• 例6-1：假定咖啡的分袋包装生产线的装袋重量服从正态分布N(μ,σ2)。生产线按每袋净重150克的技术标准控制操作。现从生产线抽取简单随机样本n=100袋，测得其平均重量为 X =149.8克，样本标准差S=0.872 克。问该生产线的装袋净重的期望值是否为 150克（即问生产线是否处于控制状态）?
27
• 显著性检验中的第二类错误是指： • 原假设事实上不正确，而检验统计量的观测值却落入了不能拒绝域，因而没有否定本来不正确的原假设，这是取伪的错误。 • 发生第二类错误的概率是把来自 θ=θ1(θ1≠θ0)的总体的样本值代入检验统计量所得结果落入接受域的概率。
ቤተ መጻሕፍቲ ባይዱ28
• 根据不同的检验问题，对于和大小的选择有不同的考虑。 • 例如，在例6-1中，如果检验者站在卖方的立场上，他较为关心的是不要犯第一类错误，即不要发生产品本来合格却被错误地拒收这样的事情，这时，要较小。 • 反之，如果检验者站在买者的立场上，他关心的是不要把本来不合格的产品误当作合格品收下，也就是说，最好不要犯第二类错误，因此，要较小。
Z
X 0

2
~ N (0,1)
n
39
（三）总体为正态分布，总体方差未知，小样本 • 来自总体的样本为(x1, x2, …, xn)。对于假设： H0: = 0，在H0成立的前提下，有检验统计量
t
X 0
S
2
~ t ( n 1)
n • 若自由度(n-1)≥30，该t统计量近似服从标准正态分布。
20
• 观测值落在临界值所划定的尾部之外（称之为不能拒绝域）的范围内，则认为拒绝原假设的证据不足。这种做出检验结论的方法，我们称之为临界值规则。
21
• 显然，P-值规则和临界值规则是等价的。在做检验的时候，只用其中一个规则即可。 • P-值规则较之临界值规则具有更明显的优点。 • 这主要是： • 第一，它更加简捷； • 第二，在值规则的检验结论中，对于犯第一类错误的概率的表述更加精确。 • 推荐使用P-值规则。

e商务文档

统计学第6章假设检验与方差分析

相关文档推荐：

e商务文档

统计学 第6章 假设检验与方差分析

相关文档推荐：

统计学第6章假设检验与方差分析