扩展专题(二)
参见教材:C 组第5题。
敏感性问题的调查方法
调查问卷中常常涉及到个人隐私或本人不愿正面回答的问题。
例如估计私生子的比数、吸海洛因人的比数、有不正当收入人的比数等。
对这类问题调查时采用通常使用的调查方法,不是无法调查就是难以获得真实结果。
设S 是一个社会敏感间题, 例如“你考试作过弊吗?”。
我们希望估计N 个人的总体中具有S 属性的人的比数p 。
通常时方法是从总体中用某种抽样方法(例如简单随机抽样法)抽取容量为n 的样本, 然后对所抽到的每个个体提问问题S , 例如“你考试作过弊吗?”则p 的估计为
ˆk p n
= (1) 其中k 为调查中回答“是”的个数。
但是对子这种类型的敏感问题, 被访人可能拒绝回答。
即使回答, 也不能期望回答是真实的。
所以(1)式的估什实称上是无意义的。
为避免被访人拒绝回答, 或不真实的回答,这里介绍一种简便的随机化选答方法。
一、随机化选答方法
社会敏感问题随机化选答抽样调查方法首先由沃纳在1965年提出。
这之后, 在方法和原理方而有不少深入的讨论, 并较成功地应用于社会敏感问题调查实践。
在向被访者提出敏感问题S 的同时,提出与S 不相关的问题, 记为S , 例如
S “你考试作过弊吗?”
S “你的生日在7月1日以前吗?”
要求被访者随机地选择其一回答。
这里的“随机”是指按照预先设计好的随机试验E 进行的。
E 有两个结果,记为1ω和2ω , 要使得:
1()P ωπ=, 2()1P ωπ=-
当试验结果出现1ω时,要求被访者回答问题S 。
当试验结果出现2ω时,要求被访者回答问题S 。
试验E 由被访者来作, 其结果是保密的, 仅有被访者一人知道。
这样, 调查人只知道被访者回答的结果是“是” 或“非”, 但不知道回答的是S 还是S 。
所以,即使真实地回答, 也无人能够知道被访个体究竟是否具有属性S 。
设被调查的n 个人中,具有属性S 的人的比数为p 。
而在这n 个人的随机化选答调查
中,有k 人回答“是”。
由全概率公式
1(1)2
k p n ππ≈+- 则p 的一个合理的估计为
122ˆk n p ππ
+-=
这样调查的关键在于,被调查者知道调查的过程和背景,没有正面回答的顾虑。
一、思考
1.随机试验E 的如何设计?
2.会不会调查失败?如何避免?
3.另一种设计是否更有效?
S “你考试作过弊吗?”
S “你考试没有作弊吗?”
由全概率公式
(1)(1)k p p n
ππ≈+-- 则p 的估计为
(1)ˆ21
k n p ππ--=- 4.如果需要回答的问卷不是“是,否”两个,而是多个,如作弊“0,1,2,更多”次,有没有相应的对策呢?
参考文献
[1] 张泮洲. 敏感问题调查技术新探[J]. 统计研究,2001,(11).
[2] 杨喜寿. 社会敏感问题抽样调查方法的误差计算[J]. 统计研究,1989,(2).
[3] 边重. 如何让人讲真话──谈敏感问题的抽样调查[J]. 数理统计与管理,1986,(5).
[4] Bernard G . Greenberg, Abdel-Latif A. Abul-Ela etc. Horvitz. The Unrelated Question Randomized Response Model: Theoretical Framework[J]. Journal of the American Statistical Association, V ol. 64, No. 326 (Jun., 1969), pp. 520-539。