第八章1. 解:(1)假设检验的基本思想是,样本平均数与总体平均数出现差异不外乎两种可能:一是改革后的总体平均长度不变,但由于抽样的随机性使样本平均数与总体平均数之间存在抽样误差;二是由于工艺条件的变化,使总体平均数发生了显著的变化。
因此,可以这样推断:如果样本平均数与总体平均数之间的差异不大,未超出抽样误差范围,则认为总体平均数不变;反之,如果样本平均数与总体平均数之间的差异超出了抽样误差范围,则认为总体平均数发生了显著的变化。
根据样本平均数的抽样分布定理,有x Z σx μ±=或Z /σμx x ≤-。
当0=Z 时,表明样本均值等于总体均值,即μx =;当Z 很大时,表明样本均值离总体均值很远,即∆很大。
后一种情况是小概率事件。
在正常情况下,小概率事件是不会发生的,那么在一次抽样中小概率事件居然发生了,我们就有理由认为样本均值是不正常的,它与原总体相比,性质已经发生变化,应该拒绝接受原假设。
(2)假设检验的一般步骤包括:① 提出原假设和备择假设;对每个假设检验问题,一般可同时提出两个相反的假设:原假设和备择假设。
原假设又称零假设,是正待检验的假设,记为H 0;备择假设是拒绝原假设后可供选择的假设,记为H 1。
原假设和备择假设是相互对立的,检验结果二者必取其一。
接受H 0,则必须拒绝H 1;反之,拒绝H 0则必须接受H 1。
② 选择适当的统计量,并确定其分布形式;不同的假设检验问题需要选择不同的统计量作为检验统计量。
在例中,我们所用的统计量是Z ,在H 0为真时,N Z ~(0,1)。
③选择显著性水平α,确定临界值;显著性水平表示H 0为真时拒绝H 0的概率,即拒绝原假设所冒的风险,用α表示。
假设检验就是应用了小概率事件实际不发生的原理。
这里的小概率就是指α。
但是要小到什么程度才算小概率? 对此并没有统一的标准。
通常取α=0.1,0.05,0.01。
给定了显著性水平α,就可由有关的概率分布表查得临界值,从而确定H 0的接受区域和拒绝区域。
临界值就是接受区域和拒绝区域的分界点。
④作出结论。
根据样本资料计算出检验统计量的具体值,并用以与临界值比较,作出接受或拒绝原假设H 0的结论。
如果检验统计量的值落在拒绝区域内,说明样本所描述的情况与原假设有显著性差异,应拒绝原假设;反之,则接受原假设。
2. 解:(1)抽样估计和假设检验都是统计推断的重要内容。
如果总体分布形式已知,只是总体参数未知,则统计推断问题就归结为推断总体参数的问题。
抽样估计或称参数估计是根据样本资料估计总体参数的真值,而假设检验是根据样本资料来检验对总体参数的先验假设是否成立。
区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验不仅有双侧检验也常常采用单侧检验,视检验的具体问题而定。
区间估计立足于大概率,通常以较大的把握程度(可信度)1-α去估计总体参数的置信区间。
而假设检验立足于小概率,通常是给定很小的显著性水平α去检验对总体参数的先验假设是否成立。
区间估计和假设检验虽各有其特点,但也有着紧密的联系。
两者都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,推断结果都有一定的可信程度或风险;对同一实际问题的参数进行推断,使用同一样本、同一统计量、同一分布。
因而,两者可以相互转换,即区间估计问题可以转换成假设检验问题,假设检验问题也可以转换成区间估计问题。
这种相互转换形成了区间估计与假设检验的对偶性。
(2)根据置信区间进行假设检验的方法如下:以总体均值μ的区间估计和假设检验为例,当总体方差2σ已知时,n x /σσ=,由于统计量)/(00n σ/μx /σμx Z x -=-=~ N (0, 1)给定置信度1-α时,有αZ Z P α-=≤1)(2反之αα=>)(2Z Z P当总体均值μ可知时,可估计的μ置信度为1-α的置信区间为22/)-(αασμZ x Z x ≤≤-上式等价于Z 检验的接受区域:2αZ Z ≤若事先假设:0μμ=,可求出统计量Z 的具体值。
当2αZ Z ≤时,不属于小概率事件,应接受原假设;反之,当2αZ Z >时,小概率事件发生了,按假设检验的规则,应拒绝原假设。
可见,区间估计中的置信区间对应于假设检验中的接受区域,置信区间之外的区域就是拒绝区域。
对比率、方差等问题的区间估计和假设检验也同样存在这种对偶性。
3. 解:根据题意,提出假设:H 0:1000=μ,H 1:1000≥μ 检验统计量)//(/00n x x Z x σμσμ-=-=1.2)25/100/(1000-589==由α=0.02,查《正态分布分位表》(附录2表4)得临界值054.2=αZ由于Z = 2.1>αZ = 2.054,所以应拒绝H 0而接受H 1,即这批元件的使用寿命不低于1000小时,是合格品。
4. 解:根据题意,提出假设:H 0:500=μ,H 1:500<μ检验统计量)//(/00n x x Z x σμσμ-=-=5.2)100/20/(500-954==由α=0.05,查表得临界值645.1=αZ由于Z =2.5>Zα/2 =1.645,所以应拒绝H 0而接受H 1,即工艺改革后这批产品的使用寿命确有显著提高。
5. 解:第一类错误:当原假设H 0为真,但由于样本的随机性使样本统计量落入了拒绝区域,这时所作的判断是拒绝原假设。
这类错误称为第一类错误,亦称拒真错误,它实质上就是前面提到的显著性水平α,即P {拒绝H 0∣H 0为真}=α。
第二类错误:当原假设H 0为不真,但由于样本的随机性使样本统计量落入接受区域,这时的判断是接受原假设。
这类错误称为第二类错误,亦称取伪错误。
犯第二类错误的概率亦称取伪概率,用β表示,即P {接受H 0∣H 0不真}=β。
在一般场合,当n 固定时,减少α必然导致β增大;反之减少β必然会增大α。
以利用Z 统计量进行右侧检验的情况为例;α= P (Z >Z α∣H 0为真)β= P (Z≤Z α∣H 0为真)要使α小,则临界值 Z α增大,而 Z α增大必然导致β增大。
反之,要使β小,则必然导致α增大。
6. 解:正态分布是与自由度无关的一条曲线,t 分布是依自由度而变的一组曲线。
t 分布较正态分布顶部略低而尾部稍高。
在小样本情况下二者的区别较大,t 分布呈现尖峰后尾特征。
当自由度趋于无穷大时,t 分布曲线就成为标准正态分布曲线。
在总体方差未知的情况下,检验均值特征使用t 分布。
7. 解:根据题意,提出假设:H 0:800=μ,H 1:800≠μ 检验统计量)//(/00n x x Z x σμσμ-=-=333.1)16/60/(800208=-=由α=0.01,查表得临界值Z α=2.326由于Z =1.333<Z α=2.326,所以应拒绝H 0而接受H 1。
8. 解:假设H 0:0P =0.4,H 1:P <0.4。
样本比率P =m/n=76/200=0.38由于样本容量大,所以可近似采用Z 检验法,有331.20343.008.020062.038.03.038.0)1(0==⨯-=--=n p P P P Z给定α=0.05,查《正态分布分位表》(附录2表5)得645.1=αZ 。
由于αZ Z >,拒绝原假设,即认为报纸的订阅率显著降低了。
9. 解:已知250000=μ,10=n ,计算得25200=x ,666.332=S提出假设:H 0:25000=μ,H 1:25000≠μ检验统计量|t |=)//()(/)(00n S x x x μσμ-=-90.1)10/666.332/()2500025200(=-=由α=0.05,查《t 分布表》(附录2表5)得临界值2αt (n -1)= 025.0t (10-1)=2.262。
由于|t |=1.90<2αt (n -1) = 2.262,所以接受H 0,即认为该厂轮胎的耐用里程不存在显著差异。
10. 解:计算得00128.02=S假设H 0:20σ=0.03,H 1:20σ≠0.03统计量2χ=202/)1(σS n -=(6-1)0.00128/0.03=7.11α=0.1,查《2χ分布表》(附录2表6)得)5(205.0χ=2.015,故应拒绝H 0而接受H 1,即认为总体口径方差存在显著差异。
11. 解:(1)接受 (2)拒绝 (3)接受 (4)拒绝 (5)接受 (6)接受12. 解:(1)拒真错误 (2)没有错误 (3)取伪错误 (4)没有错误 (5)没有错误13. 解:对于甲乙厂放映时间方差的检验,首先建立假设:H 0:2221σσ=,H 1:2221σσ≠在n =5,m =7,α = 0.05时,025.0F (4, 6)=6.23,975.0F (4, 6)=0.161故拒绝域为{F ≤0.161或F ≥6.23}现由样本求得2x S =78.8,2y S =233.33,从而F =0.338,落入拒绝域,因而在α=0.05水平上可以认为两厂放映时间的方差存在显著差别。
对于甲乙厂放映时间均值的检验,首先建立假设:H 0:21μμ=,H 1:21μμ≠计算可得:甲厂:n =5,x =97.4,2x S =78.8;乙厂:m =7,y =100,2y S =233.33;α=0.05由于n 与m 都不大,且2x S 与2y S 又相差很大,故拟采用*t 统计量进行检验。
经计算,对应*t 分布的自由度为L =9.747,取整后为10。
在α=0.05时,)10(05.0t =1.8125,现由样本求得*t =-0.371<)10(05.0t ,故不拒绝H 0,认为甲乙厂放映时间的均值没有显著差别。
14. 解:对于A 、B 蛋白质含量方差的检验,首先建立假设:H 0:2221σσ=,H 1:2221σσ≠在n =10,m =5,α = 0.05时,)4,9(025.0F =8.9,212.0)9,4(1)4,9(025.0975.0==F F 故拒绝域为{F ≤0.212或F ≥8.9}由已知21S =1.621,22S =0.135,从而F =12.007,落入拒绝域,因而在α=0.05水平上可以认为A 、B蛋白质含量的方差存在显著差别。
对于A 、B 蛋白质含量均值的检验,首先建立假设:H 0:21μμ=,H 1:21μμ≠经计算,对应*t 分布的自由度为L =11.528,取整后为12。
在α=0.05时,)12(05.0t =1.782,现由样本求得*t =5.979>)12(05.0t ,故拒绝H 0,认为A 、B 蛋白质含量均值存在显著差别。