第2章2.3 解:首先估计该市居民日用电量的95%的置信区间。
根据中心极限定理可知,在大_y E y y -=近似服从标准正态分布, _Y 的195%α-=的置信区间为y z y z y y αα⎡⎡-+=-+⎣⎣。
而()21f V y S n-=中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间为,y y ⎡⎤-+⎢⎥⎣⎦由题意知道,_29.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得_21130050000()2060.6825300f v y s n --==⨯=。
将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192⎡⎤⎣⎦。
下一步计算样本量。
绝对误差限d 和相对误差限r 的关系为_d rY =。
根据置信区间的求解方法可知____11P y Y r Y P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭根据正态分布的分位数可以知道21P Z αα⎫⎪⎪≤≥-⎬⎪⎪⎭,所以()2_2r Y V y z α⎛⎫⎪= ⎪⎝⎭。
也就是2_2_222/221111r Y r Y S n N z S n N z αα⎡⎤⎛⎫⎢⎥⎛⎫⎪⎛⎫⎝⎭⎪⎢⎥-=⇒=+ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎢⎥⎣⎦。
把_29.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。
所以样本量至少为862。
2.4 解:总体中参加培训班的比例为P ,那么这次简单随机抽样得到的P 的估计值p 的方差()()111f N V p P P n N -=--,在大样本的条件下近似服从标准正态分布。
在本题中,样本量足够大,从而可得P 的195%α-=的置信区间为p z p z αα⎡-+⎣。
而这里的()V p 是未知的,我们使用它的估计值()()()^5119.652101fV p v p p p n --==-=⨯-。
所以总体比例P 的195%α-=的置信区间可以写为p z p z αα⎡-+⎣,将0.35,200,10000p n N ===代入可得置信区间为0.2844,0.4156⎡⎤⎣⎦。
2.5 解:利用得到的样本,计算得到样本均值为2890/20144.5y ==,从而估计小区的平均文化支出为144.5元。
总体均值_Y 的195%α-=的置信区间为2y z y z αα⎡-+⎣,用()21f v y s n-=来估计样本均值的方差()V y 。
计算得到2826.0256s =,则()2110.1826.025637.17220f v y s n --==⨯=,1.9611.95z α==,代入数值后计算可得总体均值的95%的置信区间为[]132.55,156.45。
2.6 解:根据样本信息估计可得每个乡的平均产量为1 120吨,该地区今年的粮食总产量Y 的估计值为_^53503501120 3.9210Y y ==⨯=⨯(吨)。
总体总值估计值的方差为()2^21N f V Y S n -⎛⎫= ⎪⎝⎭,总体总值的195%α-=的置信区间为^^Y z Y z αα⎡-+⎢⎢⎣,把^523.9210,25600,50,350,Y S n N =⨯===, 1.96nf z Nα==代入,可得粮食总产量的195%α-=的置信区间为377629,406371⎡⎤⎣⎦。
2.7 解:首先计算简单随机抽样条件下所需要的样本量,把21000,2,195%,68N d S α==-==带入公式2022/211d n N z S α⎛⎫=+ ⎪⎝⎭,最后可得061.362n =≈。
如果考虑到有效回答率的问题,在有效回答率为70%时,样本量应该最终确定为070%88.5789n n ==≈。
2.8 解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关系较为稳定,所以引入去年的化肥产量作为辅助变量。
于是我们采用比率估计量的形式来估计今年的化肥总产量。
去年化肥总产量为2135X =。
利用去年的化肥总产量,今年的化肥总产量的估计值为_^^_2426.14R y Y R X X x===吨。
2.9 解:本题中,简单估计量的方差的估计值为()21f v y s n-==37.17。
利用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为X 。
文化支出属于总支出的一部分,这个主要变量与辅助变量之间存在较强的相关关系,而且它们之间的关系是比较稳定的,且全部家庭的总支出是已知的量。
文化支出的比率估计量为_____^_R y y R X X x==,通过计算得到2890/20144.5y ==,而_1580x =,则_^_144.50.09151580yR x===,文化支出的比率估计量的值为_146.3R y =(元)。
现在考虑比率估计量的方差,在样本量较大的条件下,()()()22212R R x x f V y MSE y S R S S R S nρ-≈≈-⋅+,通过计算可以得到两个变量的样本方差为224826,9.95810xs s ==⨯,Y X 和之间的相关系数的估计值为^0.974ρ=,代入上面的公式,可以得到比率估计量的方差的估计值为_ 1.94R v y ⎛⎫= ⎪⎝⎭。
这个数值比简单估计量的方差估计值要小很多。
全部家庭的平均文化支出的195%α-=的置信区间为R R R R y z y z y y αα⎡⎡-+=-+⎣⎣,把具体的数值代入可得置信区间为[]143.57,149.03。
接下来比较比估计和简单估计的效率,()()__ 1.940.05237.17R R V y v y V y v y ⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭≈==,这是比估计的设计效应值,从这里可以看出比估计量比简单估计量的效率更高。
2.10 解:利用简单估计量可得1630/10163i y y n ===∑,样本方差为2212.222s =,120N =,样本均值的方差估计值为()21110/120212.22219.453710f v y s n --==⨯=。
利用回归估计的方法,在这里选取肉牛的原重量为辅助变量。
选择原重量为辅助变量是合理的,因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,相关系数的估计值为^0.971ρ=,而且这种相关关系是稳定的,这里肉牛的原重量的数值已经得到,所以选择肉牛的原重量为辅助变量。
回归估计量的精度最高的回归系数β的估计值为^^14.5680.971 1.36810.341x s s βρ==⨯=。
现在可以得到肉牛现重量的回归估计量为___^lr y y X x β⎛⎫=+- ⎪⎝⎭,代入数值可以得到_159.44lr y =。
回归估计量_lr y 的方差为()__2211lr lr f V y MSE y S n ρ-⎛⎫⎛⎫≈≈- ⎪ ⎪⎝⎭⎝⎭,方差的估计值为2_^211lr f v y s n ρ⎛⎫-⎛⎫=- ⎪ ⎪⎝⎭⎝⎭,代入相应的数值,2_^211 1.112lr f v y s n ρ⎛⎫-⎛⎫=-= ⎪ ⎪⎝⎭⎝⎭,显然有()_lr v y v y ⎛⎫< ⎪⎝⎭。
在本题中,因为存在肉牛原重量这个较好的辅助变量,所以回归估计量的精度要好于简单估计量。
第3章3.3 解:(1) 首先计算出每层的简单估计量,分别为___12311.2,25.5,20y y y ===,其中,123256,420,168,844N N N N ====,则每个层的层权分别为;值可以得到__20.07hh st y Wy ==∑。
此方差的估计值 22212194.4,302.5,355.556s s s ===其中12310n n n ===,代入数值可以求得方差的估计值为_9.4731st v y ⎛⎫= ⎪⎝⎭,则估计的标(2)由区间估计可知相对误差限满足___11st P y Y rY P αα⎫⎪⎧⎫-≤≥-⇒≤≥-⎨⎬⎩⎭_2z α=,()2_st r Y V y z α⎛⎫ ⎪= ⎪⎝⎭。
(提1/n 出去)从而可以得到在置信度为α,相对误差限为r 条件下的样本量为①对于比例分配而言,有hh W ω=成立,把相应的估计值和数值195%,10%r α-==代入后可以计算得到样本量为186n =,相应的在各层的样本量分别为1231256.457,92.693,18636n n n n n =≈=≈=--=。
②按照内曼分配时,样本量在各层的分配满足h h h h hW S W Sω=∑,这时样本量的计算把相应的数值代入后可得175n =,在各层中的分配情况如下:1231233,87,18666n n n n n ===--=。
3.5 解:总体总共分为10个层,每个层中的样本均值已经知道,层权也得到,从而可下一步计算平均支出的95%的置信区间,首先计算购买冷冻食品的平均支出的估计值的方差,其中10_2211h st hh h h f V y W S n =-⎛⎫= ⎪⎝⎭∑,但是每层的方差是未知,则样本平均支出的方差的估计值为10_2211h st hh h h f v y W s n =-⎛⎫= ⎪⎝⎭∑,每个层的样本标准差已知,题目中已经注明各层的抽样比可以忽略,计算可以得到10_221159.8254h hh st h h f v y W s n =-⎛⎫=≈ ⎪⎝⎭∑。
则这个开发区的居民购买冷冻食品的平均支出195%α-=置信区间为y z y z αα⎡-+=⎢⎢⎣y y ⎡-+⎢⎢⎣代入数值后,可得最终的置信区间为[]60.63,90,95。
3.6 解:首先计算简单随机抽样的方差,根据各层的层权和各层的总体比例可以得到总体的比例为310.28h hh P W P===∑,则样本量为100的简单随机样本的样本比例的方差为()21f V p S n -=,不考虑有限总体校正系数,()21V p S n ≈,其中()211NS P P N =--, 在1N N -≈的条件下,通过简单随机抽样得到的样本比例的方差为()()23111 2.01610f V p S P P n n --=≈-=⨯通过分层抽样得到的样本比例的方差为()221h st h h hf V p W S n -=∑,但是因为不考虑有 限总体校正系数,而且抽样方式是比例抽样,所以有h h h h N nW N nω===成立,样本比例的方差近似为()221h h st h h W S V p W S n n==∑∑。
对于每一层,分别有()211h h h h h N S P P N =--,在1h h N N -≈的条件下,近似的有()21h h h S P P =-成立,有2221230.09,0.16,0.24S S S ===样本量应该满足()2hhst W Sn V p =∑,同时这里要求分层随机抽样得到的估计的方差和简单抽样的方差是相同的,()()st V p V p =,层权分别为1230.2,0.3,0.5W W W ===,代入数值,可以计算得到最终的样本量为()230.18692.26932.01610hhst W S n V p -===≈⨯∑。