当前位置:文档之家› 抽样技术题目

抽样技术题目

一、 简单随机抽样1、在简单随机抽样中,试证明比估计R y 是总体均值Y 的渐近无偏估计,并求其方差。

证明:X R Y = X xyX R Y y R ===∧∧()⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫⎝⎛-+⎪⎪⎭⎫⎝⎛-+⎪⎪⎭⎫ ⎝⎛--=⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛-+=⎪⎪⎭⎫ ⎝⎛=2211X X x o X X x X Xx X y E X X X x X yE X X x y E y E R由于0−→−-PX x 即0→-X Xx 所以()()Y y E X y E X y E R ==⎪⎪⎭⎫ ⎝⎛= 得证。

()()2222⎪⎪⎭⎫ ⎝⎛-=⎪⎪⎭⎫ ⎝⎛-=-=R x yE X X R X x y E y E y E y Var RR R ()()⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫⎝⎛-+⎪⎪⎭⎫⎝⎛-+⎪⎪⎭⎫ ⎝⎛---=⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛-+-=222111X X x o X X x X X x X x R y X X x X xR y E X由于0−→−-PX x 即0→-XXx 所以()()()22221Z RS n f x R y Var x R y E X x R y E X y Var -=-=-=⎪⎪⎭⎫ ⎝⎛-= 其中:RX Y Z -=故()()()()[]()222212111XXY Y Ni i i RS R RS SnfX R Y RX Y N n f y Var +--=-----=∑= 2、对于简单随机抽样,总体均值Y 的回归估计量定义为:()lr y y X x β=+-,如β为常数(记为0β),证明20122200(y )11(y )[()()]11(2)lr Nlr i i i x xy E Yf V Y Y X X n N f S S S n βββ==-=-----=+-∑证明:00202022200(y )[y ()]()[()]11y [()]111[()()]11(2)lr Nlr i i iNi i i x xy E E X x E y X E x Y f V Y X X Y n N f Y Y X X n N f S S S nββββββ=+-=+-=-+----=-----=+-∑∑()=3、在简单随机抽样中,已知变量总体均值Y 的回归估计量定义为)(x X y y lr -+=β,若β为常数(记为0β),且有Y y E lr =)(, 求证:(1))2(1)(02202xy x y lr S S S nf y V ββ-+-=(2)使)(lr y V 最小的0β为xy xxy S S SS ρβ==20;其中yx xy S S S =ρ.证明:(1)[]∑=--+--=N i ii lr Y X X Y N n f y V 120)(111)(β []210)()(111∑=-----=Ni i i X X Y Y N n f β)2(102202xy x y S S S nf ββ-+-=(2)求)(lr y V 对0β的偏导数:0)22(1)())((200=--=∂∂xy x lr S S nf y V ββxy xxy S S SS ρββ=⇒=⇒02将0β的值代入)(lr y V ,验证其最小值存在,此时⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫ ⎝⎛-⎪⎪⎭⎫ ⎝⎛+-=xy X xy x X y y lr S S S S S S S n f y V 222221)(ρ )2(122222y y y S S S n f ρρ-+-=)1(122ρ--=y S nf4、研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。

解析:由已知得:200=N 20=n根据表中数据计算得:5.144201201==∑=i i y y()06842.827120120122=--=∑=i iy y s 21808.37)1(1)(2=-=s Nnn y V 10015.6)(=y V 因此该小区平均文化支出Y 的95%置信区间为:])(y [2y V z α±即是:[132.544 ,156.456],故估计该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。

5、某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到25=y ,这些企业去年的平均产量为22=x 。

试估计今年该地区化肥总产量。

解析:由题可知22x =,35.211002135===N X X ,25y =则,该地区化肥产量均值Y 的比率估计量为26.24242535.21===∧x y XY该地区化肥产量总值Y 的比率估计量为 242626.24*100ˆˆ===R Y N Y 所以,今年该地区化肥总产量的估计值为2426吨。

二、 分层随机抽样6、在分层随机抽样的分别比估计中:(1)试证明Y y E RS =)(;(2)求出其方差。

(1) 证明:根据题意: ∑∑∑======Lh hh h L h h h h Lh h h hh RS R E X W X R W E X x y W E y E 111)ˆ()ˆ()()( 又h h h X Y R E =)ˆ( Y Y W X Y E X W h Lh h L h h hh h ===∴∑∑==11)(上式 综上可得:Y y E RS =)((2) 解:由第一问可知)ˆ()ˆ()(121hh Lh h Lh h h h RS X R V W X R W V y V ∑∑==== 而)2(1)()ˆ(222x yx y S R RS S n f y V X R V +--==)2(1)(22212xh h yxh h yh hh Lh h RS S R S R S n f W y V +--⋅=∴∑= 8、调查某地区居民的奶制品年消费支出,以居民户为抽样单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽取10户,调查后各层样本户的奶制品年消费支出的中间结果如下表所示:请估计该地区居民奶制品的年消费总支出及其95%的置信区间。

解析:根据表中的数据可得4_^1209650()st h h h Y N y ===∑元;估计量方差^()st V Y 的无偏估计为^281()()/ 5.38610Lst h h h h h h v Y N N n s n ==-≈⨯∑,进而有23207.6()≈元。

^st Y 的95%的置信区间为^^0.025()st st Y z v Y ±,其中0.025z =1.96,经计算可得^^0.025()209650 1.9623207.6164163()st st Y z v Y -=-⨯=元 ^^0.025()209650 1.9623207.6255137()st st Y z v Y +=+⨯=元因此,可以有95%的把握认为该地区居民奶制品的年消费总支出在164163~255137元之间。

7、试述分别比估计和联合比估计的比较。

答:如果每一层都满足比率估计量有效的条件,则除非hRR ,都有分别比率估计量的方差小于联合比率估计量的方差。

但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。

实际使用时,如果各层的样本量都较大,且有理由认为各层的比率hR 差异较大,则分别比率佑计优于联合比率估计。

当各层的样本量不大,或各层比率hR 差异很小,则联合比率估计更好些。

三、 等概率整群抽样和多阶段抽样9、邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群10户,现随机抽取4个群,取得资料如下表所示:试估计平均每户家庭订报份数及总的订报份数,以及估计量的方差。

解:由题意得到400=N ,4=n ,10=M ,01.04004===N n f 故875.1410201620191ˆ1=⨯+++===∑=ni i y Mny Y (份)75.18875.110=⨯=⋅=y M y (份)7500875.140010ˆ=⨯⨯=⋅⋅=y N M Y (份)∑=--=ni iby yn M s 122)(1∑=---=-=ni i b y y n nMfs nMfy v 1222)(1111)( 14)75.1820()75.1819(10401.01222--++-⨯⨯-= 00391875.0= 6270000391875.010400)()ˆ(2222=⨯⨯==y v M N Yv 于是由以上的计算结果得到平均每户的订报份数为1.875,估计量方差为0.00391875。

该辖区总的订阅份数为7500,估计量方差为62700。

10、某高校学生会欲对全校女生拍摄过个人艺术照的比例进行调查。

全校共有女生宿舍200间,每间6人。

学生会的同学运用两阶段抽样法设计了抽样方案,从200间宿舍中抽取了10间样本宿舍,在每间样本宿舍中抽取3位同学进行访问,两个阶段的抽样都是简单随机抽样,试估计拍摄过个人艺术照的女生比例,并给出估计的标准差。

解:题目已知200=N ,10=n ,6M =,3=m ,05.0200101===N n f ,5.02==Mmf 3.03109ˆ1=⨯==∑=nm yp ni i005747.0)(1111)ˆ(12=⋅--⋅-⋅=∑=ni im p yn n f mp v0758.0005747.0)ˆ()ˆ(===p v ps 在置信度95%下,p 的置信区间为 ))ˆ(ˆ(2/p v t pα±=)0.448568,0.151432()0758.096.13.0(=⨯±。

四、 不等概抽样11、某公司欲了解职工上班交通所需的时间,该公司共有5个部门,根据每个部门的人数采用PPS 抽样出2个部门,并在2个部门中采用简单随机抽样分别抽出5名职工,调查结果试估计该公司职工上班交通评价所需的时间,并给出估计的标准差。

相关主题