第四节 正态总体的置信区间与其他总体相比, 正态总体参数的置信区间是最完善的,应用也最广泛。
在构造正态总体参数的置信区间的过程中,t 分布、2χ分布、F 分布以及标准正态分布)1,0(N 扮演了重要角色.本节介绍正态总体的置信区间,讨论下列情形: 1. 单正态总体均值(方差已知)的置信区间; 2. 单正态总体均值(方差未知)的置信区间; 3. 单正态总体方差的置信区间;4. 双正态总体均值差(方差已知)的置信区间;5. 双正态总体均值差(方差未知但相等)的置信区间;6. 双正态总体方差比的置信区间.注: 由于正态分布具有对称性, 利用双侧分位数来计算未知参数的置信度为α-1的置信区间, 其区间长度在所有这类区间中是最短的.分布图示★ 引言★ 单正态总体均值(方差已知)的置信区间★ 例1 ★ 例2★ 单正态总体均值(方差未知)的置信区间 ★ 例3 ★ 例4★ 单正态总体方差的置信区间 ★ 例5 ★ 双正态总体均值差(方差已知)的置信区间 ★ 例6 ★ 双正态总体均值差(方差未知)的置信区间★ 例7 ★ 例8★ 双正态总体方差比的置信区间 ★ 例9 ★ 内容小结 ★ 课堂练习 ★ 习题6-4内容要点一、单正态总体均值的置信区间(1)设总体),,(~2σμN X 其中2σ已知, 而μ为未知参数, n X X X ,,,21 是取自总体X 的一个样本. 对给定的置信水平α-1, 由上节例1已经得到μ的置信区间,,2/2/⎪⎪⎭⎫⎝⎛⋅+⋅-n u X n u X σσαα二、单正态总体均值的置信区间(2)设总体),,(~2σμN X 其中μ,2σ未知, n X X X ,,,21 是取自总体X 的一个样本. 此时可用2σ的无偏估计2S 代替2σ, 构造统计量n S X T /μ-=,从第五章第三节的定理知).1(~/--=n t nS X T μ对给定的置信水平α-1, 由αμαα-=⎭⎬⎫⎩⎨⎧-<-<--1)1(/)1(2/2/n t n S X n t P ,即 ,1)1()1(2/2/αμαα-=⎭⎬⎫⎩⎨⎧⋅-+<<⋅--n S n t X n S n t X P因此, 均值μ的α-1置信区间为.)1(,)1(2/2/⎪⎪⎭⎫ ⎝⎛⋅-+⋅--n S n t X n S n t X αα三、单正态总体方差的置信区间上面给出了总体均值μ的区间估计,在实际问题中要考虑精度或稳定性时,需要对正态总体的方差2σ进行区间估计.设总体),,(~2σμN X 其中μ,2σ未知,n X X X ,,,21 是取自总体X 的一个样本. 求方差2σ的置信度为α-1的置信区间. 2σ的无偏估计为2S , 从第五章第三节的定理知,)1(~1222--n S n χσ, 对给定的置信水平α-1, 由,1)1()1()1()1(,1)1(1)1(22/12222/222/2222/1αχσχαχσχαααα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧--<<---=⎭⎬⎫⎩⎨⎧-<-<---n S n n Sn P n S n n P 于是方差2σ的α-1置信区间为⎪⎪⎭⎫ ⎝⎛-----)1()1(,)1()1(22/1222/2n S n n S n ααχχ而方差σ的α-1置信区间.)1()1(,)1()1(22/1222/2⎪⎪⎭⎫ ⎝⎛-----n S n n S n ααχχ四、双正态总体均值差的置信区间(1)在实际问题中,往往要知道两个正态总体均值之间或方差之间是否有差异,从而要研究两个正态总体的均值差或者方差比的置信区间。
设X 是总体),(211σμN 的容量为1n 的样本均值, Y 是总体),(222σμN 的容量为2n 的样本均值, 且两总体相互独立, 其中2221,σσ已知.因X 与Y 分别是1μ与2μ的无偏估计, 从第五章第三节的定理知),1,0(~//)()(22212121N n n Y X σσμμ+---对给定的置信水平α-1, 由,1//)()(2/22212121ασσμμα-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<+---u n n Y X P可导出21μμ-的置信度为α-1的置信区间为.,2221212/2221212/⎪⎪⎭⎫ ⎝⎛+⋅+-+⋅--n n u Y X n n u Y X σσσσαα五、双正态总体均值差的置信区间(2)设X 是总体),(21σμN 的容量为1n 的样本均值, Y 是总体),(22σμN 的容量为2n 的样本均值, 且两总体相互独立, 其中1μ,2μ及σ未知.从第五章第三节的定理知).2(~/1/1)()(212121-++---=n n t n n S Y X T w μμ其中.212122212212112S n n n S n n n S w -+-+-+-=对给定的置信水平α-1, 根据t 分布的对称性, 由,1)}2(|{|212/αα-=-+<n n t T P可导出21μμ-的α-1置信区间为.11))2()(,11))2()(21212/21212/⎪⎪⎭⎫+⋅-++- ⎝⎛+⋅-+--n n S n n t Y X n n S n n t Y X w w αα六、双正态总体方差比的置信区间设21S 是总体),(211σμN 的容量为1n 的样本方差, 22S 是总体),(222σμN 的容量为2n 的样本方差, 且两总体相互独立, 其中222211,,,σμσμ未知. 21S 与22S 分别是21σ与22σ的无偏估计, 从第五章第三节的定理知),1,1(~212221212--⎪⎪⎭⎫ ⎝⎛=n n F S S F σσ对给定的置信水平α-1, 由,1)}1,1()1,1({212/212/1ααα-=--<<---n n F F n n F P ,1)1,1(1)1,1(12221212/122212221212/ασσαα-=⎭⎬⎫⎩⎨⎧⋅--<<⋅---S S n n F S S n n F P 可导出方差比2221/σσ的α-1置信区间为.)1,1(1,)1,1(12221212/12221212/⎪⎪⎭⎫⎝⎛⋅--⋅---S S n n F S S n n F αα例题选讲单正态总体均值(方差已知)的置信区间例1(E01) 某旅行社为调查当地一旅游者的平均消费额, 随机访问了100名旅游者, 得知平均消费额80=x 元. 根据经验, 已知旅游者消费服从正态分布, 且标准差12=σ元, 求该地旅游者平均消费额μ的置信度为95%的置信区间.解 对于给定的置信度 ,95.01=-α ,05.0=α ,025.02/=α查标准正态分布表,96.1025.0=u 将数据,100=n ,80=x ,12=σ ,96.1025.0=u 代入nu x σα⋅±2/计算得μ的置信度为95%的置信区间为),4.82,6.77( 即在已知12=σ情形下, 可以95%的置信度认为每个旅游者的平均消费额在77.6元至82.4元之间.例2 设总体),,(~2σμN X 其中μ未知, .42=σ n X X ,,1 为其样本. (1) 当16=n 时, 试求置信度分别为0.9及0.95的μ的置信区间的长度. (2) n 多大方能使μ的90%置信区间的长度不超过1? (3) n 多大方能使μ的95%置信区间的长度不超过1? 解 (1) 记μ的置信区间长度为A, 则)/()/(2/2/n u X n u X σσαα⋅--⋅+=∆,22/n u σα⋅=于是当%901=-α时, ,65.116/265.12=⨯⨯=∆ 当%951=-α时, .96.116/296.12=⨯⨯=∆(2) 欲使,1≤∆ 即,1/22/≤⋅n u σα 必须,)2(22/ασu n ≥ 于是, 当%901=-α时,,)65.122(2⨯⨯≥n 即,44≥n 即n 至少为44时, μ的90%置信区间的长度不超过1. (3) 当%951=-α时,类似可得.62≥n注: ① 由(1)知, 当样本容量一定时, 置信度越高, 则置信区间长度越长, 对未知参数的估计精度越低.② 在置信区间的长度及估计精度不变的条件下, 要提高置信度, 就须加大样本的容量,n 以获得总体更多的信息.单正态总体均值(方差未知)的置信区间例3(E02) 某旅行社随机访问了25名旅游者, 得知平均消费额80=x 元, 子样标准差12=s 元, 已知旅游者消费额服从正态分布, 求旅游者平均消费额μ的95%置信区间.解 对于给定的置信度),05.0%(95=α,0639.2)24()1(025.02/==-t n t α将,80=x ,12=s ,25=n ,0639.2)24(025.0=t 代入计算得μ的置信度为95%的置信区间为,05.75(),95.84 即在2σ未知情况下, 估计每个旅游者的平均消费额在75.05元至84.95元之间, 这个估计的可靠度是95%.注: 与例1相比, 在标准差σ未知时, 用样本的标准差S 给出的置信区间偏差不太大.例4 (E03) 有一大批袋装糖果. 现从中随机地取16袋, 称得重量(以克计)如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496设袋装糖果的重量近似地服从正态分布, 试求总体均值μ的置信水平为0.95的置信区间.解 ,95.01=-α ,025.02/=α ,151=-n ,1315.2)15(025.0=t由给出的数据算得,75.03.5=x .2022.6=s 可得到均值μ的一个置信水平为0.95的置信区间为),16/2022.61315.275.503(⨯± 即).1.507,4.500(这就是说, 估计袋装糖果重量和均值在500.4克与507.1克之间, 这个估计的右信程度为95%. 若以此区间内任一值作为μ的近似值, 其误差不大于61.616/2022.61315.22=⨯⨯(克)这个误差估计的可信程度为95%.单正态总体方差的置信区间例5 (E04) 为考察某大学成年男性的胆固醇水平, 现抽取了样本容量为25的一样本, 并测得样本均值,186=x 样本标准差12=s . 假定所论胆固醇水平),,(~2σμN X μ与2σ均未知. 试分别求出μ以及σ的90%置信区间.解 μ的置信度为α-1的置信区间为./)1((2/n s n t x ⋅-±α按题设数据,1.0=α,186=x ,12=s ,25=n 查表得,7109.1)125(2/1.0=-t 于是,106.425/127109.1/)1(2/=⨯=⋅-n s n t α 即).11.190,89.181(σ的置信度为α-1置信区间为.)1()1(,)1()1(22/1222/2⎪⎪⎪⎭⎫ ⎝⎛-----n S n n S n ααχχ 查表得,85.13)125(,42.36)125(22/1.0122/1.0=-=--χχ 于是, 置信下限和置信上限分别为,74.942.36/12242=⨯,80.1585.13/12242=⨯所求σ的90%置信区间为).80.15,74.9(双正态总体均值差(方差已知)的置信区间例6 (E05) 2003年在某地区分行业调查职工平均工资情况: 已知体育、卫生、社会福利事业职工工资X (单位: 元));218,(~21μN 文教、艺术、广播事业职工工资Y (单位: 元)),227,(~22μN 从总体X 中调查30人, 平均工资1272元, 求这两大类行业职工平均工资之差的99%的置信区间.解 由于,99.01=-α 故,01.0=α 查表得,576.2005.0=u又,251=n ,302=n ,218221=σ ,227222=σ ,1286=x ,1272=y于是21μμ-的置信度为99%的置信区间为],96.168,96.140[- 即两大类行业职工平均工资相差在96.140-96.168~之间, 这个估计的置信度为99%.双正态总体均值差(方差未知)的置信区间例7 (E06) A , B 两个地区种植同一型号的小麦. 现抽取了19块面积相同的麦田, 其中9块属于地区A , 另外10块属于地区B , 测得它们的小麦产量(以kg 计)分别如下:地区A : 100, 105, 110, 125, 110, 98, 105, 116, 112;地区B : 101, 100, 105, 115, 111, 107, 106, 121, 102, 92. 设地区A 的小麦产量),,(~21σμN X 地区B 的小麦产量),(~22σμN Y , 1μ,2μ,2σ均未知. 试求这两个地区小麦的平均产量之差21μμ-的90%置信区间.解 由题意知所求置信区间的两个端点分别为.11)2()(21212/n n S n n t Y X w +⋅⋅-+±-α 由,1.0=α ,91=n ,102=n 查表得,7396.1)17(2/1.0=t 按已给数据计算得,109=x ,106=y ,8/55021=s ,9/60622=s,682)1()1(212222112=-+-+-=n n s n s n s w,246.8=w s于是置信下限为 ,59.310191246.87396.1)106109(-=+⨯⨯-- 置信上限为 ,59.910191246.87396.1)106109(=+⨯⨯+- 故均值差21μμ-的90%的置信区间为).59.9,59.3(-例8 为比较I, II 两种型号步枪子弹的枪口速度, 随机地取I 型子弹10发, 得到枪口速度的平均值为 )/(5001s m x =, 标准差)/(10.11s m s =, 随机地取II 型子弹20发, 得到枪口速度的平均值为)./(4962s m x = 标准差)./(20.12s m s =假设两总体都可认为近似地服从正态分布. 且由生产过程可认为方差相等. 求两总体均值差21μμ-的一个置信水平为0.95的置信区间.解 按实际情况, 可认为分别来自两个总体的样本是相互独立的, 且两总体的方差相等, 但数值未知, 由于,95.01=-α ,025.02/=α,101-n ,202=n ,28221=-+n n ,0484.2)28(025.0=t,28/)20.11910.19(222⨯+⨯=w s .12==w w s s ,1688故所求的两总体均值差21μμ-的一个置信水平为0.95的置信区间是),93.04(201101)28(025.021±=⎪⎪⎭⎫⎝⎛+⨯±-t s x x w 即).93.4,07.3( 注: 本题中得到的置信区间的下限大于零, 在实际中我们就认为1μ比2μ大,即Ⅰ型子弹的枪口速度大于Ⅱ型子弹的枪口速度.双正态总体方差比的置信区间例9(E07) 某钢铁公司的管理人员为比较新旧两个电炉的温度状况, 他们抽取了新电炉的31个温度数据及旧电炉的25个温度数据, 并计算得样本方差分别为7521=s 及10022=s . 设新电炉的温度),(~211σμN X , 旧电炉的温度),(~222σμN Y . 试求2221/σσ的95%置信区间.解 2221/σσ的α-1置信区间的两个端点分别是22211212/))1,1((s s n n F ⋅---α与,)1,1(2221122/s s n n F ⋅--α ,05.0=α ,311=n ,252=n查表得,21.2)24,30(2/05.0=F .14.2)30,24(2/05.0=F于是置信下限为,34.01007521.21=⨯ 置信上限为,61.11007514.2=⨯所求置信区间为).61.1,34.0(注: 在内容小结中分别总结了有关单正态总体参数和双正态总体参数的置信区间, 以方便查用.课堂练习1. 已知某地区农户人均生产蔬菜量为X (单位:kg), 且),,(~2σμN X 现随机抽取9个农户, 得人均生产蔬菜量为75, 143, 156, 340, 400, 287, 256, 244, 249问该地区农户人均生产蔬菜量最多为多少)05.0(=α?2. 为了考察温度对某物体断裂强度的影响, 在70℃与80℃时分别重复了8次试验,测试值的样本方差依次为,8266.0,8857.02221==s s假定70℃下的断裂强度),,(~211σμN X 80℃下的断裂强度),,(~222σμN Y 且X 与Y 相互独立, 试求方差比2221/σσ的置信度为90%的置信区间.。