当前位置:文档之家› 常用的抽样方法

常用的抽样方法

精品课件
精品课件
二、估计比例用的3种改进模型
1、模型I 把问题 B改为一个完全无关、答案 为“是”的概率是已知值的问题
将沃纳模型中与敏感性问题相对的具有特
征A的问题改为一个与敏感性问题不相关的
其它问题。
A
B
精品课件
例14-2: 欲调查某地已婚育龄妇女有无婚前
性行为的比例。
问题A:婚前有过性行为? 回答: ①是 ②否 问题B:你生日(月+日)除以3余数是0吗? 回答: ①是 ②否
(2)问卷中设A、B两个问题。 (3)备有一个口袋,里面装有黑白两种颜色的 球(也可用围棋的黑子和白子),两种球的比例不是 1:1,例如可以是60%和40%。
精品课件
(4)调查对象在填写答案前,先随机抽取一个球 (球的颜色对调查员保密),据球的颜色决定回 答两个问题中的哪一个。
(5)由于调查员不知道某一对象抽取的球是什么颜 色的,所以无法知道某一对象回答的是问题A还 是问题B,也无法知道调查对象的“秘密”。
随机化回答是指在调查中使用特定的随机化装置, 使得被调查者以预定的概率来回答敏感性问题。这一技术的 宗旨就是最大限度地为被调查者保守秘密,从而取得被调查 者的信任。
RRT技术的基本原理在于当被调查者确信调查者及 其他人无法从被调查者的回答中获知他们的真实行为时,能 更加真实地对敏感问题进行回答。并且RRT技术保护调查对 象的个人隐私,能充分得到调查对象的配合,最终可显著降 低无应答率和误答率,得到高质量的调查结果。
常用的抽样方法
精品课件
一、单纯随机抽样(simple random sampling)
1、抽样方法
根据研究目的选定总体,首先对总体中所有 的观察单位编号,遵循随机原则,采用不放回抽取 方法,从总体中随机抽取一定数量观察单位组成样 本。
具体方法 ①随机数字法 ② 抽签法
精品课件
2、优缺点
①对所有观察单位编号,当数量大时,有 难度
(1)若对同一批被调查者试验两次,他们两次回答的结果必具 有相关性,从而破坏了模型的随机性。但如果对两批被调查 者分别进行试验,又不容易保证两次的结构具有相似性,从 而产生较大误差。 (2)方差V(π)是两次试验产生的方差之和,在相同条件下, 它比西蒙斯模型的方差要大得多。 (3) P1和P2不能太接近。当p1=p2时,模型就没有意义了。要减 小方差V(π) ,就应该增大P1而减小P2 ,但当p1增得过大时, 又会减少被调查者的配合。
2、所调查总体标准差,若不了解,须通过 预试验的标准差S或前人的资料作出估计;
3、第一类错误的概率 4、对有限总体抽样时,还须了解总体观察 单位数。
精品课件
二、计算公式
均数的抽样:
u
2
n
2
,
X
u2 1
率的抽样 :
n
2
2
, p
精品课件
随机应答技术 Randomized Response Techniques (RRT)
红、黑、白球的比例是0.5、0.3和0.2。 最后问答“是”的比例为55%,要求估计婆婆 真正认为婆媳关系不好的比例。
ˆ 0.550.30.5
0.5 即 婆 婆 认 为 婆好 媳的 关比 系5例 不 0% 为
方差:
Vˆ1nnp(12(1p1p11))2
精品课件
敏感问题调查注意事项
调查者态度端庄、和蔼,通俗语言 向被调查者解释调查的目的与调查的意义,争取 得到其信任和支持 巧妙提问,避免转折太大
精品课件
3.模型III
本方法的优点是不需要设立非敏感问题。 但是球的颜色要有3种(红、黑、白)。每种球的 比例是已知的(P3=1-P1-P2),要求摸到红球者如 实回答问题,摸到黑球者全部回答“是”,摸到 白球者全部回答“否”。
精品课件
精品课件
例14-4 如调查一批与媳妇一起生活的婆婆, 问婆媳关系好不好。
0.0025
精品课件
西蒙斯模型的不足之处
(1)π 是预先已知或待估计的值, π 的 估计偏差会增加估计方差。
(2)要提高估计精度,应增大P值和减小π 值。但随着P值的增大和π 的减小,被 调查者的疑虑会增加。
精品课件
2、模型II 将模型I中设立无关联问题B的方法改为两
套抽取球的装置 优点:对问题B回答“是”的概率不必是已知的。 要求调查对象抽取两次彩球和回答问题两次。 装置中黑球的比例是P1和P2,有专家建议,两者都
精品课件
(1)两个相关联问题模式: 设计两个相对立的陈述。 例如 问题1:你曾经吸过毒吗?
①是 ②否 ①(2是)两②个否不相关联问题模问式题:2:你从未吸过毒吗?
第一陈述为敏感性问题,第二陈述是与第 一陈述无关的非敏感性问题,可以得到确切的答案。
例如 问题1:你曾经吸过毒吗? ① 是 ②否
问题2:你是工人吗? ①是 ②否
精品课件
精品课件
精品课件
解此方程组,得
ˆ ( 1 1-p2)2(1 p1)
课本上有误
p1 p2
如 果 装 1中置 黑 球 的p1比 0.例 8, :
装 置 2中 黑 球 的p2比 0.例 2 :
用 装1时 置调 查 对 象 回 的答 比“ 例 1是 : 0.3” 6
用 装2时 置调 查 对 象 回 的答 比“ 例 2是 : 0.0” 5
精品课件
2.设置一个随机装置进行调查
使用一个内装许多黑、白两色小 球的匣子,黑白球的比例接近1:1,但不 等于1:1,例如可以是60%和40%。
混合均匀后,被调查者从匣子中 随机摸取一球,摸取的是黑球还是白球只 有被调查者知道。若摸取的是黑球,则回 答第一个问题,否则,回答第二个问题。
答卷上只有答案选择,没有题号, 可按如下格式设计:“请将你的回答在相 应的编号处做上记号√:①是 ②否”。
精品课件
随机化应答模型
(一)沃纳模型(Warner model) 1965年由Warner提出的,其设计思想是向被调查
者显示两个与敏感性问题(具有特征A)有关,但完全对立 的问题,让调查者按预定的概率从中选一个回答,调查者 无权过问被调查者回答的是哪一个问题,从而起到了为被 调查者保密的效果。 (二)西蒙斯模型
精品课件
2、优缺点
(1)抽样方法简便 (2)易得到一个按比例分配的样本,抽样误差较小 (3)仍需对每个观察单位编号 (4)当观察单位按顺序有周期趋势或单调性趋势时, 产生明显偏性
精品课件
3、抽样误差
无固定的计算公式,常按单纯随机抽样方法 来计算,与总体的性质和被抽样个体间的间隔有关。
精品课件
三、整群抽样(cluster sampling) 1、抽样方法
精品课件
3.根据概率理论进行计算
(1) 问题1:你曾经吸过毒吗? ①是 ②否
问题2:你从未吸过毒吗? ①是 ②否
假设黑球所占的比例为P,白球所占的比
例为1-P,应答者中回答“是”的总比例为r,那
么对第一个问题回答“是”的比例RA可以由下式 推算:
0.50)
r=PRA+ (1-P)(1-RA) RA= r - (1-P)/(2P-1) (1>P>
(6)设立两个问题: 问题A:婚前有过性行为?回答: ①是 ②否 问题B:婚前没有性行为?回答: ①是 ②否
精品课件
(7)如果调查对象抽取的球是黑色的,则回答问 题A;如果调查对象抽取的球是白色的,则回 答问题B。
(8)计算调查对象中婚前有性行为者的比例。
精品课件
若调查200人,回答“是”的比例为λ=0.48,
精品课件
(2)
②否
问题1:你曾经吸过毒吗? ①是 ②否
问题2:你是工人吗?
①是
假设回答者中工人占的比例为RU,则r 与RA的关系为:
r =PRA+(1-P) RU RA=r – (1-P) RU/ P
精品课件
例14-1: 欲调查某地已婚育龄妇女有无婚
前性行为的比例。
(1)先把这项技术的意义、性质和方法,特别是 其保密功能,坦诚地告诉调查对象,以取得理解、 信任和合作。
精品课件
敏感问题(sensitive problem)
是指涉及个人(或单位)的隐私或 利益的问题以及大多数人认为不便在公开 场合表态或陈述的问题,在某些情况下, 还包括一些违法犯罪的行为。
精品课件
敏感问题的特点: 一般是社会舆论导向所不认同的或反 对的行为或观点 不同特征的人群有不同的敏感问题 不同敏感问题在敏感程度上存在差异
精品课件
有无性行为
精品课件
如果黑球比例为p=60%,同时回答问 题A和B均为是的比例π=0.24,生日(月+日) 除以3余数是0占π0=33.33%,则
ˆ0.2 -(41 -0. 60).33 03.3178
0.6
此 时 ,ˆ的 方 差 是
(1 )
V(ˆ )
np2
本 例 ,V(ˆ )
0.24(1 0.24) 2000.62
1、抽样方法
先将总体按某种特征分成若干层,再从每 一层内随机抽取一定数量的观察单位,合起来组 成样本。
精品课件
(1)按比例分配:按总体各层观察单位数的多少分配
ni Ni nN
(2)最优分配:按各层观察单位数多少及其变异大小
分配
均数 : ni n
Nii Nii
率:
ni n
Ni i1i Ni i1i
ˆ 0.36(1-0.2-)0.05(1-0.8)0.497
0.8-0.2
估 计 有 婚 前 性 行 例为 49.7的 %比 精品课件
对本例,
1 0.36(10.3)61(0.2)2 0.05(10.0)51(0.8)2
V(ˆ) (0.80.2)2
480
480
0.0012
相关主题