概率论与数理统计第7章
第七章
假设检验
假设检验的基本概念 单正态总体的假设检验 双正态总体的假设检验
7.1假设检验的基本概念
数理统计的主要任务是从样本出发,对总体的分布 作出推断。作推断的方法,主要有两种,一种是上一章 讲的参数估计,另一种是假设检验。 在总体分布未知或虽知其类型但含有未知参数的 时候,为推断总体的某些未知特性,提出某些关于总 体的假设。再根据样本所提供的信息及运用适当的统 计量,对提出的假设作出接受或拒绝的决策,假设检 验是作出这一决策的过程。假设检验包括两类:参数 假设检验;非参数假设检验。 参数假设检验是针对总体分布函数中的未知参数 而提出的假设进行检验 ;非参数假设检验是针对总 体分布函数形式或类型的假设进行检验。
对于检验统计量的选择,故下面分两种情形进行讨论. 1、总体方差σ2已知,正态总体均值μ的检验 设总体 X ~ N ( , 2 ) ,其中 2 已知,X1,…,Xn是取自 总体X的一个样本. (1)检验假设H0:μ= μ0,H1:μ≠μ0; μ0已知常数 X 0 H 0为 真 时 , U ~ N (0, 1) n 故选取U作为检验统计量, 记其观察值为u,相应的检 验法称为u检验法.
因为X是的无偏估计量,当 H 0成立时, U 不应太大, 当H1成立时, U 有偏大的趋势,故拒绝 域形式为 x 0 u k(k待 定 ) 0 n
对给定的显著性水平α,查标准正态分布表有 k u / 2 P{| U | u / 2 } 使
x 0 u / 2 由此即得拒绝域为 | u | / n 即 W (,u 2 ) (u 2 ,) 根据一次抽样后得到的样本值x1,x2,…,xn计算出U的观 察值u,若| u | u / 2 , 则拒绝原假设H0,即认为总体均
2、总体方差σ2未知,正态总体均值μ的检验 (1)检验假设 H0:μ= μ0,H1:μ≠μ0; X 0
H0为真时
T
S
n
~ t (n 1)
故选取T作为检验统计量,其观察值记为t,相应的检验 法称为t检验法。
因 为X 是的 无 偏 估 计 量 , S 2是 2的 无 偏 估 计 量 。 当 H 0成 立 时, t 不应太大,当 H1成 立 时 , t 有 偏 大 的 趋 势 。 故 拒域 绝的 形式为
例7.1中取α=0.05,则有 (1)建立假设 H0:μ= μ0 =500, H1:μ≠ μ0 , (2)以H0成立为前提确定统计量及其分布 (3)对给定的显著性水平α=0.05 ,确定H0接受域 W 或拒绝 域W. 取临界点为 u 2 1.96 ,使 P{| U | u 2} , 故H0被 接受与拒绝的区域分别为 W [1.96, 1.96], W , 1.96 1.96,
值与 0有显著差异。若 | u | u / 2
,则接受原假设H0.
(2) H0:μ μ0,H1:μ>μ0;检验规则为 当 u x 0 u 时,拒绝H0 n 当 u x 0 u 时,接受H0 n
(3) H0:μ μ0,H1:μ<μ0;检验规则为
x 0 当 u u 时,拒绝H0 n x 0 当 u u 时,接受H0 n
例7.2 设某产品的某项质量指标服从正态分布,已知它的标准差 σ=150,现从一批产品中随机地抽取26个,测得该项指标的平均 值为1637。问能否认为这批产品的该项指标值为1600(α=0.05) ? 解 (1)提出原假设: H0:μ=1600,H1:μ≠1600; (2)选取统计量 U X 0
X 0 选取统计量 U n
查标准正态分布表
对于给定的显著性水平α=0.05 ,
u u0.05 1.65
已知n=9,σ=3, x 13.5 计算统计量观察值 x 0 13.5 15.5 u 2 n 3 9 由于 u 2 u 1.65 所以拒绝原假设H0,而接受H1, 即说明用新方法所需时间比用老方法所需时间短。
假设检验的步骤: (1)提出原假设H0和备择假设H1; (2)给定显著性水平α以及样本容量n; (3) 选取合适的统计量,当H0为真时其分布是确定的,且 其分布不依赖于任何未知参数; ; (4)由H1内容确定拒绝域的形式,通常在水平α下, 由 P{拒绝 H0| H0为真}= α 确 定拒绝域的临界值, 从而确定拒绝域; (5) 作一次具体的抽样, 根据得到的样本观察值和所得的 拒绝域,作出拒绝还是接受H0的判断。
认为总体均值与 有显著差异。 0
| x 0 | 当t t (n 1)时,接受 H0. s n 2
2
(2) H0:μ μ0,H1:μ>μ0;检验规则为 当 T X 0 t (n 1) 时,拒绝H0 1 S n X 0 当T t1 (n 1) 时,接受H0 S n
H 0 : 0 , H1 : 0 .
左侧(边)检验;
为检验提出的假设,通常需构造检验统计量,并取 总体的一个样本值,根据样本提供的信息来判断假 设是否成立。当检验统计量取某个区域W中的值时, 拒绝原假设H0,则称区域W为拒绝域,否则为接受 域,拒绝域的边界点称为临界点。
五、假设检验的一般步骤
(3) H0:μ μ0,H1:μ<μ0;检验规则为
X 0 当 T t1 (n 1) 时,拒绝H0 S n X 0 t1 (n 1) 时,接受H0 当T S n
例7.4 某地区青少年犯罪年龄构成服从正态分布,现随机抽取9 名罪犯,其年龄如下: 22,17,19,25,25,18,16,23,24 试在α=0.05下判断犯罪青少年的平均年龄是否为18岁。 解 (1)提出原假设: H0:μ=18,H1:μ≠18; (2)选取统计量 T
二、假设检验的基本思想
假设检验的基本思想实质上是带有某种概率性质的反 证法。为了检验一个假设H0是否正确,首先假定该假设H0 正确,然后由抽取到的样本对假设H0作出接受或拒绝的决 策。如果样本观察值导致了不合理的现象发生,就应拒绝 假设H0 ,否则应接受假设H0 。
假设检验中所谓“不合理”,并非逻辑中的绝对矛盾, 而是基于人们在实践中广泛采用的实际推断原理:“小概率 事件在一次试验中是几乎不发生的”。但概率小到什么程度 才能算作“小概率事件”?显然, “小概率事件”的概率越 小,否定原假设H0就越有说服力。常记这个概率值 0 1 为 ,称为检验的显著性水平。 的大小视具体情况 而定,通常取为0.1,0.05,0.01,0.005等值 。
问饮酒对工作能力是否由显著的影响?
两组工人完成工作的时间,可以分别看作是两个服 从正态分布的总体X~N(μ1,σ12)和Y~N(μ2,σ22) ,如 果饮酒对工作能力没有影响,两个总体的均值应该 相等。本例的假设检验问题可简记为:
H0:μ1= μ2, H1: μ1 ≠ μ2,
在实际问题中, 有时还需要检验下列形式的假设: H 0 : 0 , H1 : 0 . 右侧(边)检验;
一、引例
设一箱中有红白两种颜色的球共100个,甲说这里有98 个白球,乙从箱中任取一个,发现是红球,问甲的说法是否 正确? 先作假设H0:箱中确有98个白球。 如果假设H0正确,则从箱中任取一个球是红球的概率只 有0.02,是小概率事件。通常认为在一次随机试验中,概率 小的事件不易发生,因此,若乙从箱中任取一个,发现是 红球,即小概率事件竟然在一次试验中发生了,故有理由 拒绝假设H0 ,即认为甲的说法不正确。
对于给定的一对H0和H1,总可找出许多临界域W,
人们自然希望找到这种临界域W,使得犯两类错误的概率都 很小。
四、假设检验问题的一般提法
在假设检验问题中,提出要求检验的假设,称为原假设 或零假设,记为H0,把原假设的对立面称为备择假设或对立 假设,记为H1。
例7.1 某车间用包装机包装洗衣粉,洗衣粉包装机在 正常工作时,装包量X~N(500,152)。每天开工后,需 先检验包装机工作是否正常。某天开工后随机抽查9 袋,其重量为 497, 506, 518,524,498,511,520,515,512 试问这天包装机工作是否正常? 本例的假设检验问题可简记为: H0:μ= μ0 =500, H1:μ≠ μ0 , 形如“H1:μ≠ μ0”的备择假设表示μ可以大于μ0也可 以小于μ0 ,称为双边备择假设,而称形如此式的假 设检验为双边假设检验。
X 0 ~ t (n 1) 对给定的显著性水平α=0.05 , S n (3)确定k,使P{|T|>k}= α查t分布表 k t (n 1) t0.025 (8) 2.3060
2
即不能否定这批产品该项指标为1600。
例7.3 完成生产线上某件工作的平均时间不少于15.5分钟,标准 差为3分钟。对随机抽取的9名职工讲授一种新方法,训练期结束 后,9否说明用新方法所需时间比用老方法所需时间短?设α=0.05,并 假定完成这件工作的时间服从正态分布。 解(单边检验问题)提出原假设H0:μ 15.5,H1:μ<15.5;
511 500 2.2 1.96 (4)再由样本值算得 u 15 / 9 (5)由于u W (拒绝域), 于是拒绝H0 ,认为这天包装机
X 0 X 500 U ~ N (0,1) 15 3 n
工作不正常。
7.2
单正态总体的假设检验
一、总体均值的假设检验 当检验关于总体均值 (数学期望)的假设时, 该 2 总体中的另一个参数,即方差 是否已知,会影响到
例7.2 为了研究饮酒对工作能力的影响,任选19名工人 分成两组,一组工人工作前饮一杯酒,一组工人工作前 不饮酒,让他们每人做一件同样的工作,测得他们的完 工时间(单位:分钟)如下: 饮酒者 30 46 51 34 48 45 39 61 58 67
未饮酒者 28 22 55 45 39 35 42 38 20
| x 0 | t k (k待定) s n