第8章假设检验例题8.1由统计资料得知,1989年某地新生儿的平均体重为3190克,现从1990年的新生儿中国机抽取100个,测得其平均体重为3210克,问1990年的新生儿与1989年相比,体重有无显★解:从调查结果看,1990年新生儿的平均体重为3210克,比1989年新生儿的平均体重3190克增加了20克,但这20克的差异可能源于不同的情况。
—种情况是,1990年新生儿的体重与1989年相比没有什么差别,20克的差异是由于抽样的随机性造成的;另一种情况是,抽样的随机性不可能造成20克这样大的差异,1990年新生儿的体重与1989年新生儿的体重相比确实有所增加。
上述问题的关键点是,20克的差异说明了什么?这个差异能不能用抽样的随机性来解释为了回答这个问题,我们可以采取假设的方法。
假设1989年和1990年新生儿的体重没有显著差异,如果用卩o表示1989年新生儿的平均体重,□表示1990年新生儿的平均体重,我们的假设可以表示为卩=□或□心=0,现要利用1990年新生儿体重的样本信息检验上述假设是否成立。
如果成立,说明这两年新生儿的体重没有显著差异;如果不成立,说明1990年新生儿的体重有了明显增加。
在这里,问题是以假设的形式提出的,问题的解决方案是检验提出的假设是否成立。
所以假设检验的实质是检验我们关心的参数一1990年的新生儿总体平均体重是否等于某个我们感兴趣的数值。
例8.2某批发商欲从厂家购进一批灯泡,根据合同规定灯泡的使用寿命平均不能低于 1 000小时,已知灯泡燃烧寿命服从正态分布,标准差为200小时。
在总体中随机抽取了100个灯泡,得知样本均值为960小时,批发商是否应该购买这批灯泡?★解:这是一个单侧检验问题。
显然,如果灯泡的燃烧寿命超过了 1 000小时,批发商是欢迎的,因为他用已定的价格(灯泡寿命为1 000小时的价格)购进了更高质量的产品。
因此,如果样本均值超过1000小时,他会购进这批灯泡。
问题在于样本均值为960小时他是否应当购进。
因为即便总体均值为1000小时,由于抽样的随机性,样本均值略小于1000小时的情况也会经常出现。
在这种场合下,批发商更为关注可以容忍的下限,即当灯泡寿命低于什么水平时拒绝。
于是检验的形式为:100(1例8.3某种大量生产的袋装食品按规定重量不得少于250克。
今从一批该食品中随机抽取50袋,发现有6袋重量低于250克,若规定不符合标准的比例达到5%,食品就不得出厂,问该批食品能否出厂?★解:显然,不符合标准的比例越小越好。
在这个产品质量检验的问题中,我们比较关心次品率的上限,即不合标准的比例达到多少就要拒绝。
由于采用的是产品质量抽查,即使总体不合标准的比例没有超过5%,属于合格围,但由F抽样的随机性,样本中不合标准的比例略大于5%的情况也会经常发生。
如果采用右单侧检验,确定拒绝的上限临界点,那么检验的形式可以写为:右单侧检验如图8- 6所示(a=0. 05).也可以把右单侧检验称为上限检验。
例8.4某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度渐近服从正态分布,其总体均值为0.081mm,今另换一种新机床进行加工,取200个零件进行检验,得到椭圆度均值为0. 076mm,样本标准差为0.025mm,问新机床加工零件的椭圆度总体均值与以前有无显著差别?★解:在这个例题中,我们所关心的是新机床加工零件的椭圆度总体均值与老机床加工零件的椭圆度均值0. 081mm是否有所不同,于是可以假设宁八卜沁杯没有显著差别心申"加呦有显著差别这是一个双侧检验问题,所以只要卜二或. 二者之间有一个成立,就可以拒绝原假设。
由题意可知,怀"朋怖也“°砒血儿x = 因为2 30,故选用z统计量。
丘「“0 0,076-0,081z —----- = ----------------- =i 2.03S/x/n 0.025/血而通常把称为显著性水平。
显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这既是前面假设检验中犯弃真错误的概率,它是人们根据检验的要求确定的。
通常取- 或,这表明,当做出接受原假设的决定时,其正确的概率为95%或99%。
此时不妨取查表可以得到临界值:Z a/2=- I ®丘Z的下标表示双侧检验。
因为因为0>|蛊昨|,根据决策准则,拒绝心可以认为新老机床加工零件椭圆度的均值有显著差别。
例8.5★解:根据前面的分析,采用左单侧检验。
在该例中已知= S = 9(i00. <7 = 200. n = 100t,并假定显著性水平k ■- 由图8- 5可知拒绝域在左侧,所以临界值为负,即―'汩&,z的下标a表示单侧检验。
进行检验的过程为:云一佝960-1000Z_ a/<n _2OO/v ion __由于|z|>|力叫,即z的值位于拒绝域,所以拒绝⑷,即这批灯泡的使用寿命低于 1 000小时,批发商不应购买。
如果使用P值检验,按照前述方法,找到NORMSDISTBz值框录人样本统计量z的绝对值2,与之相对的承数值为0.97725,由于这是单侧检验,故P值为:P=1-0.977 250=0.022 75在单侧检验中,用P值直接与a比较,由于P(O. 022 75)<a(0. 05),故拒绝「』但如果在此例的假设检验中,取显著性水平a=0.02,则有P>a,这时就不能拒绝这进一步说明,检验的结论是建立在概率的基础上的。
不能拒绝H并不一定保证H为真,只是在规定的显著性水平上不能拒绝原假设。
上面的例子说明能在0.95的置信水平上拒绝原假设,却不能在0.98的置信水平上拒绝原假设。
例8.6其电子元件批量生产的质量标准为平均使用寿命1200小时,标准差为150小时。
某厂宣称它采用一种新工艺生产的元件质量大大超过规定标准。
为了进行验证,随机抽取20件作为样本,测得平均使用寿命为1245小时。
能否说该厂的元件质量显著高于规定标准?★解:首先需要规定检验的方向。
在本例中某厂称其产品质量大大超过规定标准1200小时,要检验这个宣称是否可信,因而是单侧检验。
从逻辑上看,如果样本均值低于1 200小时,则元件厂的宣称会被拒绝,即使略高于 1 200小时,也会被拒绝。
只有当样本均值大大超过1 200小时,以至于用抽样的随机性也难以解释时,才能认为该厂产品质量确实超过规定标准。
所以用右单侧检验更为适宜。
由题意可知,曲.- 」心瓷- - '::■-并规定注=工詞,虽然* 30,但由于已知,5cm 上下波动,过薄或过厚都不符合产品 t 统计量。
a =可以使用z 统计量。
进行检验的过程为: H 州壬1200^,^^1200_丘「旳_ 1245-1200 -(J/^n __150/嗣因为这是右单侧检验,由图8-6可知拒绝域在右侧,查表得到临界值由于Z=1.34在非拒绝域,所以不能拒绝’,即还不能说该厂产品质量显著高于规定标准。
若用P 值检验,方法与前面相同,在Z 值框输入1.34,得到函数值为0.9099,由于是单侧检 验,故P 值为:P= 1 - 0,9099 = 0.0901由于P M ,故不能拒绝lf o ,新产品与老产品质量未表现出显著差别。
8.7某机器制造出的肥皂厚度为5cm ,今欲了解机器性能是否良好,随机抽取10块肥皂作为样本,测得平均厚度为 5.3cm ,标准差为0.3cm ,试以0.05的显著性水平检验机器性能良好的 假设。
★解:如果机器性能良好,生产出的肥皂厚度将在 质量标准,所以,根据题意这是双侧检验问题。
由于总体 未知,且样本量n 较小,所以应采用 已知条件为."'-川—二」-'、:--f-・ 认—::匸 ”刊=5 "[屮丰5并一幽 5.3-5t 兰 -- —= ------- ■== = 3.1603/V10当=0.05,自由度n-1=9时,查表得J 疗込1匸出:・因为t> ,样本统计量落入拒绝域, 故拒绝"。
,接受"1,说明该机器的性能不好。
8.8一项统计结果声称, 某市老年人口(年龄在65岁以上)所占的比例为14.7%,该市老年人口 研究会为了检验该项统计是否可靠,随机抽选了 400名居民,发现其中有 57人年龄在65岁以上。
调查结果是否支持该市老年人口比例为 14. 7%的看法(a=0. 05)?★解147%57 r 「o = 一 = 0,1+25 = 14.25%这是一个双侧检验,当汕厂有I沁右由于|z|<| |,不能拒绝林」,可以认为调查结果支持了该市老年人口所占比例为14. 7%的看法。
思考与联系思考题8.1假设检验和参数估计有什么相同点和不同点?答:参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,然而推断的角度不同。
参数估计讨论的是用样本统计量估计总体参数的方法,总体参数□在估计前是未知的。
而在参数假设检验中,则是先对卩的值提出一个假设,然后利用样本信息去检验这个假设是否成立。
8.2什么是假设检验中的显著性水平?统计显著是什么意思?答:显著性水平是一一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率和风险。
统计显著等价拒绝H0指求出的值落在小概率的区间上,一般是落在0.05或比0.05更小的显著水平上。
8.3什么是假设检验中的两类错误?答:假设检验的结果可能是错误的,所犯的错误有两种类型,-.类错误是原假设HO为真却被我们拒绝了,犯这种错误的概率用a表示,所以也称a错误或弃真错误;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概论用B表示,所以也称B错误或取伪错误。
8.4 两类错误之间存在什么样的数量关系答:在假设检验中,a与B是此消彼长的关系。
如果减小a错误,就会增大犯B错误的机会,若减小B错误,也会增大犯a错误的机会。
8.5解释假设检验中的P值答:P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。
(它的大小取决于三个因素,一个是样本数据与原假设之间的差异,一个是样本量,再一个是被假设参数的总体分布。
)8.6显著性水平与P值有何区别答:显著性水平是原假设为真时,拒绝原假设的概率,是一个概率值,被称为抽样分布的拒绝域,大小由研究者事先确定,一般为0.05。
而P只是原假设为真时所得到的样本观察结果或更极端结果出现的概率,被称为观察到的(或实测的)显著性水平8.7 假设检验依据的基本原理是什么?假设检验的理论依据是概率论中的小概率原理 , 该原理认为小概率事件在一次观察中是不可能出现的。
换言之,如果在一次调查(即观察)中发现了小概率事件,就应当作出这样的判断 : 这种事件本身就不是一个小概率事件,而是一个大概率事件。