当前位置:文档之家› 初级1 -第三章简单随机抽样

初级1 -第三章简单随机抽样

n
n
n 1 N 1 n N
n 1 N 1
二、实施方法 • 抽签 制作N个同质的签,充分混合。从中一次抽出n个签, 或者先抽出一个签但不放回,再抽下一个签直到抽 满n个签为止。抽出的这n个签对应的单元入选样本, 这是不放回简单随机抽样;若从充分混合的N个签 中抽取一个,记录后放回,再抽取下一个,如此进 行,直到抽满n个为止,则是放回简单随机抽样。 抽签法的实施起来比较麻烦,尤其是当总体单元数 N较大时,所以该方法的使用场合为当总体单元数 N比较小,签的制作比较方便时。
第三章 简单随机抽样

第一节
基本问题
一、什么是简单随机抽样
从 N个单元的总体中抽取 n个单元组成的样本。总体单元数为 N,
样本量为 n。 若抽样是放回的,每次都是从 个总体单元中随机抽取1个单元,独 立重复抽取n次,得到 个单元组成的样本,叫做放回简单随机抽样。 若抽样是不放回的,每次都是从剩下的总体单元中随机抽取1个单 元,相继依次抽取n次,得到n个单元组成的样本,叫做不放回简单 随机抽样。
精度margin of error
对精度的要求通常以允许最大绝对误差
差限)或允许最大相对误差 (相对误差限)来表 示。
r
d(绝对误
d 1 P
P r 1


样本量足够大时,可用正态分布近似
ˆ tS ˆ d t V
2
第三章 基本概念
N n N 1
N n N
为 修正系数
2
为 S 修正系数
n f ,称抽样比, N
2

N n 1 f 有限总体调整系数 故, N 2
S V ( y ) (1 f ) n
第三章 简单随机抽样
第三节 简单随机抽样中的估计
n 1 ˆ Y y yi n
2
合计
( y Y )
1000
第三章 简单随机抽样
样本分布
y
频数
100 1
105 2
110 3
115 4
120 3
125 2
130 1
0.0625
频率 0.0625 并且:
0.125 0.1875 0.25 0.1875 0.125
说明样本分布近似正态分布
E( y) Y
第三章 简单随机抽样

随机数表法
(1)定义:用随机数表查出样本号码的方法 (2)步骤: ● 随机决定所用数表页码(瞎子点点法或掷骰子法) ● 决定起点(瞎子点点法) ● 查样本号数:
﹡N≤10,查一位数字即可,取到n个样品为止,重复的数字取消 ﹡11≤n≤100,查两位数字,大于n的以n除之取余数,重复数字去掉 ﹡n>100,向下取三位,大于n的以n除之取余数,重复数字去掉
第三章 简单随机抽样
二、 总量估计
Y NY Yi
i 1 N
N ˆ Ny Y n
ˆ Y EY

y
n
i
2 ˆ V (Y ) V ( Ny ) N V ( y )
2 N (1 f ) 2 2 V Y N V y S n

N (1 f ) 2 2 v Y N v y s n
n
简单随机抽样下,总体各单元的入样概率 相等。
入样概率指的是总体某单元入选样本(即被抽中)的
概率。 对于放回简单随机抽样,根据概率的乘法法则,总体 各单元未被抽中的概率都为 ( NN 1) ,所以总体各单元 的入样概率相等,都为 1 ( NN1) 。 n 对于不放回简单随机抽样,可能的样本有CN 种,包 C 种,所以总体各单元的入样概 含某单元的样本有 C n 率都为 C ,即 N 。另一种计算方法是:相继依次 1 抽取了n次,总体某单元第1次被抽出的概率为 N , 1 第2次被抽出的概率也为 NN1 N11 N ,直到第n次被抽出 N 1 N 2 1 1 的概率也为 N N 1 N (n 1) N ,根据概率的加法法则,该 n 单元最终被抽中的概率为 N 。
1 f 2 1 0.1 ˆ vY s 19.1111 1.72 n 10
ˆ vY ˆ 1.3115 sY
由置信度95%对应的 t 1.96 ,因此,可以以95%的把

ˆ Y y 5

握说总体平均水平大约在 5 1.96 1.3115 之间,即2.4295和7.5705之间。
1. 调查费用确定样本量 先确定费用函数,如
费用

C c0 nc1
总费用 固定费用
设计费 分析费 办公费 管理费 场租费 等
可变费用 访问员费 交通费 礼品费 电话费 等
C 一定时,可得到样本量上限
C c0 n c1
STEPS
所需要的精度
找出样本量与精度之间的关系
估计所需的数值,求解 n 如超出预算,调整精度值重新计算
ˆ sY 131.1488 t 1.96 0.5141 51.41% ˆ 500 Y



第三章 简单随机抽样
三、比例估计 1,具有某种特征 令
总体比例 P 1
n 1 ˆ y P i n
yi 0,不具有某种特征
Y N
N i
n 1 样本比例 p yi n

2
【例2.3】续例2.2。估计总体总量,并给出在置 信度95%的条件下,估计的极限相对误差。
ˆ 100 5 500 Y
1 0.1 2 ˆ v Y 100 19.1111 17200 10
ˆ的极限相对误差为: 在置信度95%下,Y

ˆ vY ˆ 131 .1488 sY
p(1 p) ˆ v( P) (1 f ) n 1
例: N 500000, n 500 ,有425户家庭拥有彩 电,全市居民家庭彩电拥有率?
第三章 简单随机抽样
n 1 425 ˆ P yi 0.85 n 500
取 0.05
ˆ (1 p ˆ) p 500 0.85(0.15) ˆ v( P) (1 f ) (1 ) n 1 500000 500 1 0.000255
N=50n=10,编号:01—50
• 计算机抽取
计算器、计算机中的统计软件都有现成的产生随机
数的程序,虽然从本质上说这种随机数都是伪随机 数(遵循特定的计算法则),但基本可以保证数的 随机性。
如何利用SPSS产生伪随机数?
在SPSS中,产生一系列随机数方法是调用Transform
菜单下的Compute次级菜单 。菜单Compute 根据不 同的分布要求,可以选择以RV开头的函数进行计算 ,产生随机数字,注意待存放数据的数据格Cell必 须是已被激活或者说已填入空值的格子! me=RND(RV.UNIFORM(1,300)) me=RND(RV.NORM(1,300))
将分子,分母同除以 N2
Nt S n0 2 N
n0 N 2 t 2 S 2 1 2 N N
n0 故 n n0 1 N
Sample Size
n0 n n0为重复抽样条件下的样本量 n0 1 N ts 2 tc 2 t 2S 2 n0 ( ) ( ) n0 2 rY r
例题:A、B 、C 、D 4人,体重分别为 100,110,120,130斤 可知: Y 115
2 2 ( 100 115 ) ( 130 115 ) 2 4 125
现采用抽样方法估计 Y , n 2 ,放回抽样
第三章 简单随机抽样
样本 A,A A,C B,A B,C C,A C,C D,A D,C
r t ˆ V


变异系数

t S ˆ tCvˆ

第三章 简单随机抽样
2. 放回抽样

S t n0
2

t S n0 2
2
2
第三章 简单随机抽样
3. 不放回抽样 由
S N n t ( ) n N
2
2 2

Nt 2 S 2 n 2 2 2 N t S
第三章 简单随机抽样

三、符号说明 总体 单位数 N 总和 Y 均值 Y 比例 P 方差 2 及 S 2
N
样本
ˆ Ny Y
p
n
y
2
s
N 1

2
(Y Y )
i
N
2
S2
2 ( Y Y ) i
N
பைடு நூலகம்
s2
2 ( y y ) i
n
n 1
第三章 简单随机抽样
第二节 简单随机抽样的误差计算
抽样误差(标准差)
V ( y ) 1000 16 7.9
抽样误差计算公式
2 V ( y) 125 7.9 n 2
误差也可用方差形式表现
V ( y)
2
n
第三章 简单随机抽样
若采用不放回抽样
V ( y ) 500 12 6.45
计算公式
V ( y)

N n 125 4 2 ( ) ( ) 6.45 n N 1 2 4 1
y
100 110 105 115 110 120 115 125
( y Y )2
225 25 100 0 25 25 0 100
样本 A,B A,D B,B B,D C,B C,D D,B D,D
2
y
105 115 110 120 115 125 120 130
(y Y ) 100 0 25 25 0 100 25 225
相关主题