PPS抽样与户内抽样
=所抽取群的数目
样本规模 = 总体的规模
PPS操作步骤:
PPS的优劣势:
优势:
目的性原则
1.总体中含量大的部分被抽中的概率也大, 可以提高样本的代表性 2.使用了辅助信息,可以减少抽样误差
劣势:
可行性原则
1.对辅助信息要求较高,实践中较难获得 对所有群的规模的认识 2.方差的估计较复杂
1 2 3 4 5
1 1 1 1 1
1 2 3 4
1 1 1 1
5
6或以上
2
2
6或以上
1
Kish 选择表
B2 式选择表 如果家庭户中18 岁以上人口数为 被抽选人的 序号为
C 式选择表 如果家庭户中18岁 以上人口数为 被抽选人的 序号为
1 2 3 4 5 6或以上
1 1 1 2 2 2
1 2 3
PPS抽样 与户内抽样
户内抽样的方法
概念
◦ 户内抽样(within-household sampling),指的是 以家庭为分析单位时,从所抽中的家庭中抽取一个
成年人,以构成访谈对象的抽样方法。
方法:Kish选择法
具体做法:
1 、先将调查表编号,分为以下八种不同的表格。 每种表格所占数量比例不同。
序号 1 2 成员特征 爸爸50岁 儿子23岁
F 式选择表 如果家庭户中18岁以上 人口数为 被抽选人的 序号为
1 2 3
1 2 3
3
4 5
奶奶70岁
妈妈48岁 女儿27岁
4 5
6或以上
4 5
6
运动员抽取问题:
校运会将至,要求从人文与管理学院各班共抽 取12名同学代表学院出战校运会。出于某些原 因,现只考虑公管1班与公管2班的同学。已知 行公管1班有35人,公管2班有24人,请使用多 段抽样的方法对两班各自出战人数进行计算。
序号 1 2 „ n n+1 n+2 „ n+m 年龄和性别特征 最年长的男性 次年长的男性 „ 最年幼的男性 最年长的女性 次年长的女性 „ 最年幼的女性
序号 1 2 3 4 5
成员特征 爸爸50岁 儿子23岁 奶奶70岁 妈妈48岁 女儿27岁
4.根据调查表上的编号找出编号相同的那种 “选择表”查出中选个体的序号,进行调查
35
24 5 (35 24) 12
35 7 公管1: 12 12 59 12
=7
24 5 公管2: 12 12 =5 59 12
E2 式选择表 如果家庭户中18 岁以上人口数为 被抽选人的 序号为
F 式选择表 如果家庭户中18岁 以上人口数为 被抽选人的 序号为
1 2 3 4 5 6或以上
1 2 3 4 5 5
1 2 3
4 5 6或以上
1 2 3
4 5 6
3.给抽中家庭每个成年人进行编号并排序。
排序方法:男性在前女性在后,年级大的在前, 年龄小的在后。
解题步骤:
已知人文与管理院有公管1、公 管2、公管3、公管4等班级
从中抽出公管1、公管2两个班级
获取两个班体育成绩前十的同学名单
两个班明显规 模不一样,却 抽取了同样数 目的运动员
各从中随机取6个 同学作管院代表
你认为,这 合理吗?
多段抽样暗含的假定:
在进行每一个阶段的抽样时,其元素的规模大 小相同。也就是说,在进行多段抽样前,我们 已经人为地假定了每一个阶段中各个抽样单位 的规模是相等的,即各个抽样单位被抽中的概 率相等
原理:“对冲”
以阶段性的不等换取最终的相等。
实质:第一阶段中,大的群具有比小的群更大的概率,
而到了第二阶段,每个被抽中的群都抽取同样多 的元素,即小群中元素被抽中的概率大于大群的, 两相平衡。
PPS原理公式:
每个元素被抽取的概率=
所抽取群 的数目
群的规模 ( ) 总体的规模
平均每个群要抽取的元素 ( ) 群的规模
表编号 (不同类型)
A
B1
B2
C
D
E1
E2
F
表数量(N)
1/6
1/12 1/12
1/6
1/6
1/12 1/12
1/6
2.印制若干套选择卡(1套8种),给每个调查员发 一套(八张)。
Kish 选择表
A 式选择表 如果家庭户中18 岁以上人口数为 被抽选人的 序号为
B1 式选择表 如果家庭户中18岁 以上人口数为 被抽选人的 序号为
此假定显然与实 际不符,易造成 较大的误差
PPS
patch
bug
什么是PPS抽样:
定义:是一种通过使用辅助信息,使得每个抽样单位
都可以按照其规模大小及在总体中所占比例确 定各自被抽取的概率,从而确保各个抽样单位 被抽取的概率相等的一种抽样方式。 特点:概率与元素规模大小成比例,即不等概率。
4 5 6或以上
1 1 2
2 3 3
Kish 选择表
D 式选择表
如果家庭户中18 岁以上人口数为 被抽选人的 序号为
E1 式选择表 如果家庭户中18岁 以上人口数为 被抽选人的 序号为
1 2 3 4 5 6或以上
1 2 2 3 4 4
1 2 3
4 5 6或以上
1 2 3
4 5 5
Kish 选择表
小试
:
校运会将至,要求从人文与管理学院各班共抽取12 名同学代表管院出战校运会。出于某些原因,现只 考虑行公管1班与公管2班的同学。已知公管1班有 35人,公管2班有24人,请使用PPS抽样的方法对两 班各自出战人数进行计算。
参考解法:
公管1规模
35 7 (35 24) 12
公管2规模
24