抽样技术作业二(3.3,3.4,3.5,4.2,4.3,4.5)袁闪闪 2120502119邮箱:yuanshanshan.110@3.3 解:由数据可得:;hh N h n hh N W N=h h h n f N = 11hn h hi i hy y n ==∑ 2211()1hn h hi h i h s y y n ==--∑ 1 256 10 0.303 0.0391 11.2 94.4 2 420 10 0.498 0.0238 25.5 302.5 3168 100.199 0.0595 20 355.6 总计 844 301(1)求平均支出和标准差的估计。
由表中的数据及先赢得公式可得:3__120.068h h st h y W y ===∑3_22119.472h h h st h h f v y W s n =-⎛⎫== ⎪⎝⎭∑__ 3.077st st s y v y ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭所以:该小区购买彩票的平均支出为:20.068元,标准差估计为3.077.(2)由区间估计可知相对误差限满足()()____11st st st st y Y r Y P y Y r Y P V y V y αα⎧⎫-⎪⎪⎧⎫⎪⎪-≤≥-⇒≤≥-⎨⎬⎨⎬⎩⎭⎪⎪⎪⎪⎩⎭所以:()_2st r Y z V y α=,()2_2st r Y V y z α⎛⎫⎪= ⎪⎝⎭。
样本均值的方差为()2232221111h h h st hh hhh h h f W S V y WS W Sn n N ω=-==-∑∑∑,从而可以得到在置信度为α,相对误差限为r 条件下的样本量为:()22222_22211hh h h h h st h hh h WS W S n V y W S r Y z W S N Nαωω==⎛⎫++ ⎪⎝⎭∑∑∑∑。
方法一:比例分配:h h W ω= 则: 22_221hhhhW Sn r Y z W SNα=⎛⎫+ ⎪⎝⎭∑∑h h h n n nW ω==把相应的估计值和数值195%,10%r α-==代入后可以计算得到样本量和相应的在各层的样本量分别为:1231218656.457,92.693,18636n n n n n n ==≈=≈=--=,。
方法二:内曼分配: h h h hhW S W Sω=∑则:()22_221hhhhW S n r Y Z W SNα=⎛⎫+ ⎪⎝⎭∑∑h h h hhhn n nW S W Sω==∑把相应的估计值和数值195%,10%r α-==代入后可以计算得到样本量和相应的在各层的样本量分别为:12312175.3717633.7=34,99,17643n n n n n n ≈=≈==--=,3.4 解:由数据可得:N=165000,h=6hh Wh nh a1 0.18 27 0.92 0.21 28 0.933 3 0.14 27 0.9 4 0.09 26 0.8675 0.16 28 0.933 60.22290.97(1)求该市居民在家吃年夜饭的样本比例和标准差的估计:6192.4%st h h h p W p ===∑()()()()662211111h h st hh h h h h h p p v p W v p W f n ==-==--∑∑= 0.0003949379__0.0199st st s y v y ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭(2)由区间估计可知绝对误差限满足()()__11st st st st y Y d P y Y d P V y V y αα⎧⎫-⎪⎪⎧⎫⎪⎪-≤≥-⇒≤≥-⎨⎬⎨⎬⎩⎭⎪⎪⎪⎪⎩⎭所以:()2st d z V y α=,()22st d V y z α⎛⎫= ⎪ ⎪⎝⎭。
样本均值的方差为()2232221111h h h st hh hhh h h f W S V y WS W Sn n N ω=-==-∑∑∑,从而可以得到在置信度为α,绝对误差限为d 条件下的样本量为:()()2222222211h h h h h hst h h h hW S W S n V y W S d z W S N Nαωω==++∑∑∑∑ 这里的方差是()211h h h h h N S P P N =--,在1h h N N -≈的条件下,近似有()21hh h S P P =-。
方法一:比例分配:h h W ω=则: ()22221hhhhW Sn d z W SNα=+∑∑h h h n n nW ω==把相应的估计值和数值195%,1%d α-==代入后可以计算得到样本量和相应的在各层的样本量分别为:1234562658.32659479,558,372,239,426,585.n n n n n n n ≈=======, 。
方法二:内曼分配: h h h hhW S W Sω=∑则:()()22221h h h h W S n d Z W S N α=+∑∑ h h h hhhn n nW S W Sω==∑把相应的估计值和数值195%,1%d α-==,代入后可以计算得到样本量和相应的在各层的样本量分别为:1234562560.42561535,519,416,304,396,392.n n n n n n n ≈=======,3.5解:层数:10h =,每个层的样本均值_h y ,层权h W ,样本量h n ,样本标准差_h v 已知,可以计算该开发区居民购买冷冻食品的平均支出的估计值为:10175.79st h h h y W y ===∑。
在各层的抽样比可以忽略下,将相应的数据带入方差估计的公式,可得:10_221159.8254h h h st h hf v y W s n =-⎛⎫=≈ ⎪⎝⎭∑__7.74st st s y v y ⎛⎫⎛⎫== ⎪ ⎪⎝⎭⎝⎭则这个开发区的居民购买冷冻食品的平均支出195%α-=置信区间为__22,st st y z v y y z v y αα⎡⎤⎛⎫⎛⎫-+=⎢⎥ ⎪ ⎪⎝⎭⎝⎭⎢⎥⎣⎦__1.96, 1.96st st y v y y v y ⎡⎤⎛⎫⎛⎫-+⎢⎥ ⎪ ⎪⎝⎭⎝⎭⎢⎥⎣⎦=[75.79 1.967.74]±⨯=[]60.63,90,95代入数值后,可得最终的置信区间为[]60.63,90,95元。
4.2,解:由题目可得:87=N ,15=n ,8715==N n f (1)将表中的数据带入相应的公式可得:709.0911646ˆ11≈==∑∑==n i ini iMyp733.6011==∑=ni iMnM221111ˆˆ()()0.0005791ni i i f v p y pM M n n =-=-=-∑ 所以此估计量的标准差为:ˆˆ()()0.024s pv p == 所以同意改革人数的比例为70.9%,估计的标准误为:2%。
4.3,解:由题意可得:1048,10,48N n f === 由题意得7361=∑=n i i y ,3651=∑=ni i M ,则办公费用的总支出的估计为:8.35327361048ˆ1=⨯==∑=ni i y nN Y(元) 群总和均值:6.7373610111=⨯==∑=n i i y n y (元)总支出的方差估计为:221()7276( 5.41)ˆ()41nii y y N f v Ynn =--=⋅=-∑=()()ˆˆ269.75s Yv Y == 该集团办公费用总支出支出195%α-=置信区间为:()()()()22ˆˆˆˆˆˆˆ, 1.96, 1.96Y z v Y Y z v Y Y v Y y v Y αα⎡⎤⎡⎤-+=-+⎢⎥⎢⎥⎣⎦⎣⎦=[3532.8 1.96269.75]=[3004.098,4061502]±⨯ 可得最终的置信区间为[3004.098,4061502]元。
4.5,解:由题意可得:200=N ,10=n ,6M =,3=m ,10.05n f N==,5.02==M mf将相应数据带入公式,可得拍摄过艺术照的女生的比例估计为:3.03109ˆ1=⨯==∑=nmypni i估计的标准差为:221111ˆ()()0.0057471ni i f v p y p m m n n =-=⋅⋅-⋅=-∑ 0758.0005747.0)ˆ()ˆ(===p v ps 所以估计拍摄过个人艺术照的女生比例为30%,其估计的标准差为0.00758.Code:#######抽样技术作业第三章3.3income<-read.delim("book3.3.txt",=c('x1','x2','x3'));income#读入数据 attach(income)n1=length(x1);n1#求每层的抽样数 N1=256; N2=420; N3=168;NN=c(N1,N2,N3); N=sum(NN);NW=c(NN/N);W #求每层的层权 f=c(n1/NN);f #求每层的抽样比y=apply(income,2,mean);y#求每层的均值 s=apply(income,2,var);s#求每层的方差估计 y_st=W%*%y;y_st #求均值的简单估计 v_st=W^2%*%(((1-f)/n1)*s);v_sts_st=sqrt(v_st);s_st#求每层的标准差估计#(1)比率分配 r<-0.1;a=W%*%(s);ab=(0.1*y_st/qnorm(1-0.025))^2;b n_1=a/(b+a/N);n_1#总数 n1=n_1*W;n1#各分层样本数 #(2)内曼分配a1=W%*%sqrt(s);a1n_2=a1^2/(b+a/N);n_2 #总数估计n2=n_2*W*sqrt(s)/a1;n2 #各层样本数估计###############抽样技术作业第三章3.4X<-read.delim("book3.4.txt",=c('x1','x2'));X#读入数据attach(X)N=165*10^4;n1=30;n=length(x1);np=x2/n1;p #求每层样本的比率估计W=x1;p_st=W%*%p;p_st #求均值估计v_st=(W^2-n1/(N*W))%*%(p*(1-p)/(n1-1));v_st#求方差估计s_st=sqrt(v_st);s_st#(1)比率分配r=0.01;s=p*(1-p);a=W%*%s;ab=(r/qnorm(1-0.025))^2;bn_1=a/(b+a/N);n_1#总数n1=n_1*W;n1#各分层样本数#(2)内曼分配a1=W%*%sqrt(s);a1n_2=a1^2/(b+a/N);n_2 #总数估计n2=n_2*W*sqrt(s)/a1;n2 #各层样本数估计###############抽样技术作业第三章3.5X<-read.delim("book3.5.txt",=c('x1','x2','x3','x4'));X#读入数据attach(X);y_st=(x1/100)%*%x3;y_stv_st=(x1/100)^2%*%(x4^2/x2);v_sts_st=sqrt(v_st);s_std<-qnorm(1-0.025);d1=y_st-s_st*d;d1d2=y_st+s_st*d;d2###############抽样技术作业第四章4.2rm(list=ls(all=TRUE))#清楚变量X<-read.delim("book4.2.txt",=c('x1','x2'));Xattach(X);N=87;n=15;M_mean=mean(x1);M_meany_mean=mean(x2);y_meanp=sum(x2)/sum(x1);pv_st=1/(M_mean^2)*(1-n/N)*c(x2-p*x1)%*%c(x2-p*x1)/(n*(n-1));v_st s=sqrt(v_st);s###############抽样技术作业第四章4.3rm(list=ls(all=TRUE))#清楚变量X<-read.delim("book4.3.txt",=c('M','y'));Xattach(X);N=48;n=10;y_mean=N*mean(y);y_meanY=N/n*y_mean;Yv=N^2*(1-n/N)/n*var(y);vs=sqrt(v);sd<-qnorm(1-0.025);d1=y_mean-s*d;d1d2=y_mean+s*d;d2 #做置信区间###############抽样技术作业第四章4.5rm(list=ls(all=TRUE))#清楚变量X=read.delim("book4.5.txt");XN=200;n=10;M=6;m=3;f1=n/N;f2=m/M;p=sum(X/m)/n;pv_p=1/(m^2)*(1-n/N)*c(X[,1]-p*m)%*%c(X[,1]-p*p)/(n*(n-1));v_ps_p=sqrt(v_p);s_pd<-qnorm(1-0.025);d1=p-s_p*d;d1d2=p+s_p*d;d2。