课件例题:
简单随机
1.随机数表:
例:N=1300, M=2000
2841——2841÷2000…841,抽中
3421——3421÷2000…1421,舍弃
6181——6181÷2000…181,抽中
6115——6115÷2000…115,抽中
9176——9176÷2000…1176,抽中
2. 例:下面是从N=6的总体抽取的n=3的全部可能样本情况,总体指标值为{6、7、10、12、25、30}。
S2=100.8
总体均值为15
总体总量为90
3. 例:一个房间有五个人,i = 1、2、3、4、5,N=5 , 每个人带的钱Yi=100元、80元、100元、120元、90元,Y=98元,(Yi-Y)2=880。
则全部可能样本情况表如下:
4. 例:为调查某城镇成年居民的服装消费水平,在全体N=5443个成年中,用简单随机抽样抽的一个n=36的样本,调查上一年中购买成衣件数xi与支出金额yi,样本资料如下,试估计该城镇居民成衣平均消费水平及消费总额
该城镇成人平均年成衣消费5.5件,95%置信度的近似置信区间为(5.5±1.96×0.66),即[4.21件,6.79件];
而人均用于成衣消费支出的金额为649.722元,95%置信度的近似置信区间为(649.722±1.96×91.71),即[469.97元,829.47元]。
该城镇成人年成衣总消费量估计 5.5×5443=29937件,95%置信度的近似置信区间为(29937±1.96×0.66×5443),即[22893件,36981件];
该城镇用于成衣的消费总金额估计为3536438.06元,95%的近似置信区间为:(3536438.06±1.96×91.71×5443)即[2558048.54元,4514827.58元]
若要求:成衣人均消费件数的估计绝对误差限为0.2件,人均消费成衣支出金额的估计的相
对误差限为5%,
求要求的样本量n,置信度仍取95%。
5. 成数例:对某问题进行调查,在总体中抽取一个n=200的简单随机样本,赞成、反对、不回答的人数分别为:n1=132,n2=51,n3=17,是给出赞成、反对、不回答比例P1、P2与P3的90%的近似置信区间。
设N很大,f可忽略。
6. 绝对误差限例:在人口普查中,根据以往数据,出生率估计为18‰,在95%的置信度下,实际调查估计P的绝对误差限为0.5‰和相对误差限为5%个需要多大的样本量?
分层
1.总体均值估计量置信区间
抽样均按简单随机抽样进行,求全市年平均户收入的估计及其90%的置信区间。
2.总体成数估计量的置信区间
3.各层样本量分配
某市进行家庭收入调查,分城镇居民及农村两层进行简单随机抽样固定样本量为n=550,调查资料及计算如下表。
试求城镇与农村两层比例分配与奈曼分配的样本量。
如不考虑费用因素,最优分配的结果有何变化?
4.成数估计量
不等概率抽样
1代码法:
例:设某总体有N=10个单元,欲用多项抽样从中抽取n=5个单元,入样概率及代码如下:
在[1,100]范围内产生5个随机数,04、73、25、49、82,则第1、第6、第3、第5、第8个单元即为抽中单元。
整群与多阶
1.整群抽样总体均值估计与置信区间还有群内相关系数与设计效应
2.对成数的估计
3. 二阶:例:续整群例题,为改进精度,该为二阶抽样作用。
用简单随机抽样抽取n=24个楼层,对每个抽中的楼层再用简单随机抽样抽取m=4户进行调查。
总的样本量仍为96户,具体资料如下表。
试估计该小区人均食品消费的户平均值。
所以二阶》一阶整群
也证明二阶更加精准
4. 二阶抽样对成数估计某部委对所属企事业单位就一项改革方案采取二阶抽样调查。
先在全部N=1250个单位(平均每个单位职工人数250)中按简单随机抽样抽取n=350个单位,然后,对抽中的每个单位再按简单随机抽取m=8个职工进行调查。
样本单位中赞成此项改革方案人数为k的单位频数nk(k=0,1,2,…,8)及赞成比例pk如下表所示。
系统抽样
1.不同方法的系统抽样某总体N=300,按有关标志排列,现欲抽取n=20的系统样本,采
取等距抽样的方法,则k=N/n=15,在1~15范围内抽取随机数r=3,试列出直线法、中点等距抽样法、层内对称抽样法和中心对称抽样法抽取得样本号。
(1) 直线法:3, 18, 33, 48, 63, 78, 93,108,123,138,153, 168, 183, 198, 213, 228, 243,
258,273,288 直接定起始点
(2)中点等距抽样法8, 23, 38, 53, 68, 83, 98, 113, 128, 143, 158, 173, 188, 203, 218, 233,
248, 263, 278, 293 直接取中位数
(3)层内对称抽样法上一个正数下一个倒数起始点数
3, 28, 33, 58, 63, 88, 93, 118, 123, 148,153, 178, 183, 208, 213, 238, 243, 268, 237, 298
(4)中心对称抽样法前一半正数后一半倒数起始点数
3, 18, 33, 48, 63, 78, 93, 108, 123, 138,163, 178, 193, 208, 223, 238, 253, 268, 283, 298 2.不等概率等距抽样
按职工(人)排队,职工总人数3360,欲抽20个企业作为样本,k=168,随机起点为r=99
3.无偏估计与有偏估计的修正
改变抽取起始单元方法在1~N范围内抽取随机数,用该数除以k的余数为起始单位。
构造估计量直接对估计量加以改造,构造无偏估计量
4.各种抽样方法的比较
一批产品共有N=4000件,每隔k=100件产品抽取一件,检查产品上的疵点数,共抽取n=40,样品的检查结果如下表所示。
试估计这批产品的平均疵点数及其方差。
比估计与回归估计
1.比估计量的期望方差,两种方法求方差mse 与公式,B不等于零说明有偏
一个N=6的人为总体,X为辅助变量,总量X=30已知,Y为调查指标,有关数据如总体数据表。
用简单随机抽样抽取n=4的样本,其全部可能样本数据及比估计数据如全部可能样本及比估计表。
5为x均值
2.3个比估计量,及其方差,置信区间;简单估计与比估计的比较
某企业有200名职工,月工资总额为10.2万元,现从中随机不重复抽取15名进行家庭储蓄存款调查,获得这15名职工的月工资收入xi及家庭储蓄存款yi资料如下表所示。
3.回归估计,b导致样本均值不是无偏估计,求估计量方差
如前例N=6人为总体数据,抽取n=4的简单随机样本,总体资料如下表:
(2)全部可能样本总体均值的回归估计的期望值
因为b来源于样本
小样本时,回归B较大,V并不总是最小4.用样本回归系数做回归估计,求总体总量的估计及其标准差。