当前位置:文档之家› 比率P的假设检验及其应用-2016.06.08一读

比率P的假设检验及其应用-2016.06.08一读

比率P的假设检验及其应用摘要:假设检验是统计推断的另一项重要内容,它与参数估计类似,但角度不同。

参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。

本文将主要介绍总体比率的假设检验的原理和方法,以及其在各种生活实例中的应用,从而更深的了解假设检验在各种统计方法中的重要作用。

关键词:假设检验;总体比率;检验统计量;拒绝域Hypothesis Testing and Its Application of Ratio P Abstract:Hypothesis testing is another important content to statistical inference, and it is similar to parameter estimation, but the Angle is different. Parameter estimation is use sample information to infer an unknown population parameter, and the hypothesis testing is a hypothesis is proposed first in the overall parameters, and then using the sample information to determine whether the hypothesis is established. This article mainly introduces the overall rate of the principle and method of hypothesis testing, and its application in all kinds of living examples, thus deeper understanding of the hypothesis testing plays an important part in all kinds of statistical methods.Key words:hypothesis testing;the overall rate;test statistics;rejection region目录一、假设检验的基本问题(一)假设检验的概述(二)假设检验的基本步骤(三)检验的P值二、总体比率的假设检验及其应用(一)单个总体比率的假设检验1.单个总体比率的精确检验及其应用2.单个总体比率的大样本检验及其应用(二)两个总体比率的假设检验1.两个总体比率之差的精确检验及其应用2.两个总体比率之差的大样本检验及其应用一、假设检验的基本问题(一)假设检验的概述假设检验是统计推断的一项重要组成部分,它在各种统计方法中都有极其重要的应用。

假设检验通过首先对总体参数提出的一个假设,然后利用样本信息推断这个假设是否成立这样一个过程,来判断承认还是拒绝该假设。

(二)假设检验的基本步骤1.建立假设在假设检验中,通常把被检验的假设叫做原假设,用H0表示,当原假设被拒绝时接受的假设叫做备择假设,用H1表示。

在任一假设检验中,原假设与备择假设都是相互对立的,且二者只能居其一。

2.选择检验统计量建立假设后,对于是否接受原假设则需要根据某一统计量出现的数值,从概率意义上判断来完成,这个统计量称为检验统计量。

3.显著性水平检验的结果不一定是真实的情况,所以说,检验是有可能犯错误的。

在假设检验中可能会犯的错误有两类:一是原假设为真却拒绝原假设,称这种错误为第一类错误,其发生的概率叫做犯第一类错误的概率,或称为拒真概率,在假设检验中把犯第一类错误的概率称为显著性水平,通常用α表示,即α=P(拒绝H0 | H0为真)=Pθ(X∈W)另一种错误是原假设为假却接受原假设,称这种错误为第二类错误,其发生的概率叫做犯第二类错误的概率,或称为受伪概率,通常用β表示,即β=P(接受H0 | H1为真) =Pθ(X∈W)这两类错误之间也存在着这样的关系:当α减小时,β会随之增大;当β减小时,α会随之增大。

这个现象不是偶然的,而具有一般性,也就是说,在样本容量不变的前提下,找到一个使α和β都减小的检验是不可能的,唯一能使α和β同时减小的方法是增大样本容量。

在假设检验中,发生哪一类错误的后果更为严重,就应首先减小哪类错误发生的概率,通常情况下允许犯第一类错误的概率,尽量减小犯第二类错误的概率,一般取α=0.05和0.01,表示发生的概率很小。

4.给出拒绝域拒绝域是指使原假设被拒绝的样本观测值所在的区域,用W表示。

若统计量的值落在拒绝域内,则拒绝原假设;反之,则接受原假设。

5.由样本值计算结果(三)检验的P值假设检验的判断还有另外一种形式,即计算检验的P值,检验的P值就是在一个假设检验中,可以利用样本观测值做出拒绝原假设的最小显著性水平。

将检验的P值与心目中的显著性水平α进行比较,就可以很容易的做出检验的结论。

判断如下:如果α≥p ,则在显著性水平α下拒绝原假设;如果α<p ,则在显著性水平α下接受原假设。

二、总体比率的假设检验及其应用(一)单个总体比率的假设检验1.单个总体比率的精确检验及其应用下文所提到的比例p 可将其看作某事件发生的概率,即为两点分布(按:即0-1分布)X ~B(1,p)中的参数。

做n 次独立试验,用x 标记事件发生的次数,则X ~B(n,p),(按:即二项分布)。

(1)设n 21x ,x ,x 为两点分布)p ,1(B ~X 的样本,考虑右侧假设检验:000p vsp p p :H >≤,给出拒绝域{}c x W ≥=,由于x 为整数,所以c 取非负整数值。

但是对于给定α的,不一定找到恰好的c ,使(1)设n 21x ,x ,x 为两点分布)p ,1(B ~X 的样本,考虑右侧假设检验:H 0:p≤p 0,H 1:p >p 0,给出拒绝域{}c x W ≥=,由于x 为整数,所以c 取非负整数值。

但是对于给定α的,不一定找到恰好的c ,使,)p 1(p i n )p 1(p i n i n 0i 0n 1c i i n 0i 0nc i 00-+=-=-⎪⎪⎭⎫ ⎝⎛>α>-⎪⎪⎭⎫ ⎝⎛∑∑对此情况比较常见的办法是,找一个c 0,使α=-⎪⎪⎭⎫ ⎝⎛=≥-=∑i n 0i 0nc i 0)p 1(p i n )p ;c x (P若取c=c 0,相当于提高检验的显著性水平,若取c=c 0+1,则相当于降低检验的显著性水平,由于取c=c 0+1可以保证α=-⎪⎪⎭⎫ ⎝⎛=≥-=∑i n 0i 0nc i 0)p 1(p i n )p ;c x (P 的左侧不大于α(按:对c 0+1,上面的小概率P 比c 0会更小≤α,设小c 自然检验更加明显,检验效率更高,但容易弃真),所以取c=c 0+1可得到水平为α的检验。

由此可以类似推出,对于假设检验问题H 0:p ≥p 0,H 1:p <p 0,检验的拒绝域可以为}{,c x W ≤=c 为满足α≤-⎪⎪⎭⎫ ⎝⎛-=∑i n 0i 0nc i )p 1(p i n 0的最大正整数。

对于假设检验问题H 0:p =p 0,H 1:p ≠p 0,检验的拒绝域为{},c x c x W 21≥≤=或其中1c 为满足2)p 1(p i n i n 0i 0c 0i 1α≤-⎪⎪⎭⎫ ⎝⎛-=∑的最大整数,2c 为满足2)p 1(p i n i n 0i 0n c i 2α≤-⎪⎪⎭⎫ ⎝⎛-=∑的最小整数。

(2)应用例1.1.1 在一次模拟考试后,某班级的班主任对这次的成绩做了一次统计,统计结果发现有%40的同学达到了80分以上,现从该班级随机抽取20名同学,其中有5位同学成绩在80分以上。

在显著性水平05.0=α下,能否认为这次的统计结果属实? 解:由题意可知:这是一个关于单个总体比率的双侧假设检验问题,由于3018n <=,故可用精确检验的方法进行检验。

设该班级学生成绩达到80分以上的比率为p ,x 表示20名学生中成绩达到80分以上的人数,则)p ,20(b ~x 。

现建立假设:4.0p :H ;4.0p :H 10≠=拒绝域为:}{21c x c x W ≥≤=或,下求1c 和2c由前面可知:1c 为满足2)p 1(p i n i n 0i 0c 0i 1α≤-⎪⎪⎭⎫ ⎝⎛-=∑的最大整数,2c 为满足2)p 1(p i n i n 0i 0n c i 2α≤-⎪⎪⎭⎫ ⎝⎛-=∑的最小整数,又因0510.0)4x (P 025.00160.0)3x (P =≤<<=≤故3c 1=,又有022.0)12x (P 025.00564.0)11x (P =≥>>=≥故12c 2=,所以拒绝域为}{12x 3x W ≥≤=或,由于观测值5不在拒绝域内,也就是说未落入拒绝域,即接受原假设,可以认为这次的统计结果属实。

例1.1.2 某工厂在一次对产品质量的调查中显示,该产生产的产品优质品率不低于%30,为了验证这一结论,该产随机从生产的产品中抽取了15件产品,其中发现有3件是优质品。

问:在显著性水平05.0=α下,能否认为这次的调查结果属实?并给出检验的P 值。

解:由题意可知:这是一个关于总体比例的左侧的假设检验。

设p 表示该工厂产品的优质品率,x 表示抽取的15件产品中的优质品数,则可有),15(~p b x 。

先建立假设:3.0p :H ;3.0p :H 10<≥检验的拒绝域为:}{c x W ≤=,下计算c 的值。

由于1269.0)2x (P 025.00352.0)1x (P =≤<<=≤,所以可取1c =,检验的拒绝域为}{1x W ≤=,因题中得到的优质品数为3,未落入拒绝域,故接受原假设,可以认为这次的调查结果属实。

本题也可通过计算检验的P 值得出结论,用X 表示服从二项分布)3.0,15(b 的随机变量,则检验的P 值为:2969.0)3.01(3.0x 15)3x (P p x 15x 30x =-⎪⎪⎭⎫ ⎝⎛=≤=-=∑ 由于检验的P 值05.02969.0=α>显著性水平,故接受原假设,所以可以认为这次的调查结果属实。

2.单个总体比率的大样本检验及其应用(1)设样本n 21x ,x ,x 取自两点分布总体),p ,1(B ~X 其中p ~表示样本比例,p 为对总体比率的某一假设值。

当n 很大,np 和)p 1(n -都大于5时,样本比例p ~近似服从均值为p ,方差为n /)p 1(p -的正态分布,而标准化检验统计量())p 1(p p p ~n u 000--=,则近似服从标准正态分布。

相关主题