实验报告实验思考题:1、某调查员欲从某大学所有学生中抽样调查学生平均生活费支出情况,假设该调查员已经完成了抽样,并获得样本情况(见样本文件),请根据此样本分别按性别、家庭所在地分层,并计算各层的样本量、平均生活费支出、生活费支出的方差及标准差。
(1)先对数据按照家庭所在地进行排序:【数据】→【排序】,选择“家庭所在地”(2)再对数据进行分类汇总:【数据】→【分类汇总】,“分类字段”选择“家庭所在地”,“汇总方式”选择“平均值”,“选定汇总项”选择“平均月生活费”,在对话框下方选择“汇总结果显示在数据下方”;再做两次分类汇总,“汇总方式”分别选择“计数”和“标准偏差”。
最后得到表1-1所示结果:表1-1家庭所在地平均月生活费大型城市平均值614.5348837大型城市计数86大型城市标准偏差300.0849173乡镇地区平均值529.4117647乡镇地区计数68乡镇地区标准偏差219.0950339中小城市平均值618.6440678中小城市计数118中小城市标准偏差202.5264159总计平均值595.0367647总计数272总计标准偏差243.4439223(3)在SPSS软件中得出的计算结果:选择————,然后在出现的对话框中分别在“Dependent list”框中选入“家庭所在地”,在“Independent List”框中选入“平均月生活费”,得到如表1-2所示结果:表1-2Report平均月生活费家庭所在地Mean N Std. Deviation大型城市614.5386300.085乡镇地区529.4168219.095中小城市618.64118202.526Total595.04272243.444选择——,在出现的对话框中选择“function”选择估计量,得到如图1-2所示结果:图1-1图1-2选择————,出现如下图所示对话框,并按照下图1-3中所选项进行操作:得到如下图表的结果:Case Processing Summary家庭所在地CasesValid Missing TotalN Percent N Percent N Percent平均月生活费大型城市86100.0%0.0%86100.0%乡镇地区68100.0%0.0%68100.0%中小城市118100.0%0.0%118100.0%Descriptives家庭所在地Statistic Std. Error平均月生活费大型城市Mean614.5332.35995% Confidence Interval for Mean Lower Bound550.20 Upper Bound678.875% Trimmed Mean592.51 Median500.00 Variance90050.958Std. Deviation300.085Minimum100Maximum2500Range2400Interquartile Range300.00Skewness 3.116.260Kurtosis17.407.514乡镇地区Mean529.4126.56995% Confidence Interval for Mean Lower Bound476.38 Upper Bound582.445% Trimmed Mean518.46Median500.00Variance48002.634Std. Deviation219.095Minimum200Maximum1000Range800Interquartile Range200.00Skewness.996.291Kurtosis.172.574中小城市Mean618.6418.64495% Confidence Interval for Mean Lower Bound581.72 Upper Bound655.575% Trimmed Mean612.34Median600.00Variance41016.949Std. Deviation202.526Minimum200Maximum1200Range1000Interquartile Range300.00 Skewness.686.223 Kurtosis.168.4422、教材129页第3.3题层样本1101020201001030202203510500405010202030200303050400300(1)数据结构、运用Excel的计算步骤及结果如下:层样本110102020100103020220351050040501020203020030305040030020.0678 9.47212 3.07768 1.04830.29614总样本量 比例分配 185.907 奈曼分配 175.381比例分配 奈曼分配 奈曼分配层权 n1 56.3888 33.659 w1 0.192 n2 92.5129 98.853 w2 0.564n3 37.0051 42.869 w3 0.244 sum185.907 175.381第h 层的层权:NN W hh =第h 层的样本均值:∑==hn i hihh yn y 11第h 层的样本方差: )1/()(122--=∑=h n i h hi hn y y s h总体均值方差:h 2Lhh h 2hn 1W )(ˆ)(s f y V Y V st ∑-===9.472 0483.1)96.10678.20*%10()()(222/==⋅=αu Y r y V st 下面计算两种分配方法的样本量及每层要抽的样本量:1.比例分配:比例分配的层权为:h h W w =故:n w n ⨯=21=56.3888 取整得1n =57n w n ⨯=22=92.5129 取整得2n =93 n w n ⨯=33=37.0051 取整得3n =382.奈曼分配:奈曼分配的层权为:∑==Lh hhh h h SW S W w 1/故:n w n ⨯=21=33.659 取整得1n =34n w n ⨯=22=98.853 取整得2n =99 n w n ⨯=33=42.869 取整得3n =43(2)在SPSS 中的计算均值与方差的结果如下:Descriptives3、教材130页第3.4题Wh ah0.18270.21280.14270.09260.16280.22291165 5.50.4522220.17820.50.0003970.25838总体比例估计0.924比例分配层权总体比例估计方差0.000396981w10.18总体比例估计标准差0.019924378w20.21V 2.60308E-05w30.14w40.09w50.16总样本量w60.22比例分配2662.655644奈曼分配2564.651673比例分配奈曼分配奈曼分配层权n1479.278016535.9991w10.208995n2559.1576853519.9509w20.202737n3372.7717902416.8882w30.162552n4239.639008303.6744w40.118408n5426.024*******.1531w50.154467n6585.7842418391.9861w60.152842 SUM2662.6556442564.6521公式:(1) 总体比例P 的简单估计量:P Y =,h h P Y =,h p y st =.按照总体均值估计量的公式,可推出总体比例(成数)P的估计量为:h hhh h h ˆˆp W P W P L Lst ∑∑===0.924(2) 总体比例P 的方差为∑---=Lst n p p f W P V h hh h h 2h 1)1()1()ˆ(ˆ=∑---L hh h h h h h 21)1()(1n p p n N N N(3) 第h 层的样本方差为:h h h h h hh q p def q p n n S 12-= (4) 样本总量:若h N 较大,则2h S ≈)1(h h P P -,此时可进一步求出估计P 时对给定的分配形式(h h nw n =)有:∑∑-+-=Lhh h h hh h h P P W N V w P P W n )1(1)1(2计算抽样的样本量:在此题中,总体数量N 非常大,故,0)1(11≈-∑=Lh hhhpP W N,因此:由公式(4)得:(比例分配的层权为:h h W w =)各层的样本量为:n w n ⨯=21=479.278016 取整得1n =480n w n ⨯=22=559.1576853 取整得2n =560 n w n ⨯=33=372.7717902 取整得3n =373=⨯=n w n 44239.639008 取整得4n =240 =⨯=n w n 55426.0249031 取整得5n =427 =⨯=n w n 66585.7842418 取整得6n =586(奈曼分配的层权为:∑==Lh hhh h h SW S W w 1/)各层的样本量为:n w n ⨯=21=535.9991 取整得1n =536n w n ⨯=22=519.9509 取整得2n =520 n w n ⨯=33=416.8882 取整得3n =417=⨯=n w n 44303.6744 取整得4n =304 =⨯=n w n 55396.1531 取整得5n =397 =⨯=n w n 66391.9861 取整得6n =392。