第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==N nf又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8100181809 110 19 170 10 240 20 120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
解析:由已知得:200=N 20=n根据表中数据计算得:5.144201201==∑=i i y y()06842.827120120122=--=∑=i iy y s 21808.37)1(1)(2=-=s Nnn y V 10015.6)(=y V ∴ 该小区平均文化支出Y的95%置信区间为:])(y [2y V z α±即是:[132.544 ,156.456]故估计该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。
2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到y =1120(吨),225600S =,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。
解析:由题意知:y =1120 1429.035050n ===N f 225600S =⇒160=s 置信水平95%的置信区间为:]1y [2s nfz -±α代入数据得: 置信水平95%的置信区间为:[1079.872,1160.872]*3502.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差682=S ,是确定简单随机抽样所需的样本量。
若预计有效回答率为70%,则样本量最终为多少?解析:简单随机抽样所需的样本量22222122S Z Nd S NZ n αα+=%7012n n =由题意知:1000=N 2=d 682=S 96.12=αZ代入并计算得:613036.611≈=n87142.87%7012≈==n n故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为872.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到25=y ,这些企业去年的平均产量为22=x 。
试估计今年该地区化肥总产量。
解析:由题可知22x =,35.211002135===N X X ,25y =则,该地区化肥产量均值Y 的比率估计量为26.24242535.21===∧x y XY该地区化肥产量总值Y 的比率估计量为 242626.24*100ˆˆ===R Y N Y 所以,今年该地区化肥总产量的估计值为2426吨。
2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表:置信水平95%的置信区间,并比较比估计和简单估计的效率。
解析:由题可知1580130017002300201x n 1x n 1i i =+++==∑=)(5.144y =091.015805.144ˆ=≈===x y r R又329.14615805.144*1600x y y ===XR053.826)(11122=--=∑=ni i y y n S158.3463))((111=---=∑=ni i i xyx x y y n S579.8831)(11122=--=∑=n i ixx x n S故平均文化支出的95%的置信区间为,)ˆˆ2(1[2222x yx R S R S R S n f Z y +---α])ˆˆ2(12222xyx R S R S R S n f Z y +--+α代入数据得(146.329±1.96*1.892)即为[142.621,150.037]2.10某养牛场购进了120头肉牛,购进时平均体重100千克。
现从中抽取10头,记录重量,3个月后再次测量,结果如下:的结果进行比较。
解:由题可知,6.10210595101x n 1x n 1i i =++==∑=)(163170150101y n 1y n 1i i =+==∑=)(222.2121910*91)(11122==--=∑=n i iy y n S 333.1461317*91))((111==---=∑=n i ii xyx x y y n S933.1064.926*91)(11122==--=∑=n i i xx x n S 故有368.1933.106333.14620===xxy S S β所以总体均值Y 的回归估计量为443.159)6.102100(*368.1163)(0=-+=-+=x X y y lr β 其方差估计为:)2(1)(ˆ02202xyx lr S S S n f y V ββ-+-==)333.146*368.1*2933.106*368.1222.212(101201012-+-=1.097 而21y (ˆS nf V-=) =222.212*10120101- =19.454显然)(ˆ)(ˆy V y V lr< 所以,回归估计的结果要优于简单估第三单元习题答案(仅供参考) 1解:(1)不合适 (2)不合适 (3)合适 (4)不合适2.将800名同学平均分成8组,在每一组中抽取一名“幸运星”。
==20.1V()=-=9.7681-0.2962=9.4719=3.0777(2)置信区间为95%相对误差为10%,则有按比例分配的总量:n==185.4407185=n=56,=92,=37按内曼分配:n==175=33,=99,=43==0.924根据各层层权及抽样比的结果,可得()==0.000396981=1.99%估计量的标准差为1.99%,比例为9.24%按比例分配:n=2663=479,=559,=373,=240,=426,=586 内曼分配:n=2565=536,=520,=417,=304,=396,=392 5.解:由题意,有==75.79购买冷冻食品的平均支出为75.79元又由V()=+又n=V()=53.8086=7.335495%的置信区间为[60.63,90.95]。
7.解:(1)对(2)错(3)错(4)错(5)对8.解:(1)差错率的估计值=70%+30%=0.027 估计的方差v()==3.1967标准差为S()=0.0179。
(2)用事后分层的公式计算差错率为==0.03估计的方差为;v ()=-=2.5726(2)用分别比估计,有=0.4,=0.65,所以用分别比估计可计算得=6.4。
用联合比估计,有=0.5,=0.625,所以用联合比估计可计算得=6.5。
第四章习题4.1 邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个解:由题意得到400=N ,4=n ,10=M ,01.04004===N n f 故875.1410201620191ˆ1=⨯+++===∑=ni i y Mny Y (份)75.18875.110=⨯=⋅=y M y (份)750040010ˆ=⨯=⋅⋅=y N M Y(份)∑=--=ni iby yn M s 122)(1∑=---=-=ni ib y yn nM f s nM f y v 1222)(1111)(14)75.1820()75.1819(10401.01222--++-⨯⨯-=00391875.0=6270000391875.010400)()ˆ(2222=⨯⨯==y v M N Yv 于是由以上的计算结果得到平均每户的订报份数为 1.875,估计量方差为0.00391875。
该辖区总的订阅份数为7500,估计量方差为62700。
4.2 某工业系统准备实行一项改革措施。
该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允许误差不超过8%,则应抽取多少个单位做样本?解:题目已知87=N ,15=n ,8715==N n f 1)由已知估计同意改革的比例709.0911646ˆ11≈==∑∑==n i ini iMyp733.6011==∑=ni iMnM008687.0)ˆ(1111)ˆ(122=---=∑=ni i i M py n n f Mp v 此估计量的标准差为9321.0008687.0)ˆ()ˆ(===p v ps4.3 某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。