当前位置:文档之家› 抽样论文

抽样论文

抽样调查中非抽样误差的研究
摘要:在统计实践中,由于调查经费和时间的限制,往往不可能采取全面调查,而只能采取抽样调查的方法,抽样调查过程中由于抽样总体的代表性及人为的因素的影响,必不可少地会产生误差。

因此从理论上讲非抽样误差应该使是可以避免的,但在实际工作中是很难做到的,本文主要分析了非抽样误差产生的原因和应对的方法。

关键词:抽样调查;分类;原因;对策
一、引言
抽样调查时目前我国搜集统计资料的一种主要方法,但是抽样调查的结果始终要受到抽样误差和非抽样误差的影响。

抽样误差是由于样本随机性引起的,根据样本数据计算的对总体目标量的估计是随样本而异的。

由此产生的误差即是抽样误差。

抽样误差是不可避免的,其大小可以通过调查样本容量,改变抽样方式等加以控制。

非抽样误差是指除抽样误差以外,由于各种原因引起的。

非抽样误差由于其产生的原因及其复杂且具有不易观测和非随机性等特点而难以控制。

两种误差构成了总方差,两者之间呈此消彼长的关系,一般情况下同时减少两类误差是很困难的。

非抽样误差占据了很大的一部分,怎样通过降低非抽样误差。

从而降低总方差,有着非常重要的现实意义。

二、非抽样误差的分类
非抽样误差可归为三类:抽样框误差.无回答误差和计量误差。

以下就这三类误差分别进行讨论:
1.抽样框误差:理想的抽样框是使目标总体和被抽样总体一致,但在实践中,难免存在目标单位和样本单位不完全对应的情况。

从而使得目标总体与被抽样总体不一致,产生误差。

这种误差不是来自于抽样的随机性,而是产生于不完善的抽样框。

称之为抽样框误差。

抽样框误差主要来源于以下几个方面:丢失目标总体单位、包含非目标总体单位、复合联接、不正确的辅助信息以及抽样框老化等。

当某些目标单位没有在抽样框中出现时,这些目标单位就构成丢失单位,对于这种情况,我们可通过其他途径将其纳入到抽样框中,或对抽样框的数据进行
调整;若抽样框包含某些非目标总体单位,应利用其他相关信息对抽样框进行调整.以此修正抽样框误差;对于复合联接问题,可通过先验信息进行调整;对于老化的抽样框。

则需要对抽样框进行及时更新。

2.无回答误差是指在调查过程中,由于各种原因没有能够对被选出的样本单位进行计量.因而无法获得所需要的信息。

无回答可分为有意不回答和无意不回答,主要表现为:遗漏、无法查找、社会参与意识薄弱、拒绝回答,前两种都属于无意不回答,后两种则属于有意不回答。

根据无回答的表现原因,我们可以采取相应的处理方法.比如:对无意不回答。

就要求调查人员在调查过程中认真仔细,对工作抱有负责的态度;对有意不回答,则要求调查单位事先做好宣传,尽量取得被调查者的支持和理解,同时也要尊重被调查者的隐私和自由。

3.计量误差产生的原因主要有:(1)调查问卷的设计不舍理引起的误差,这就要调查单位在设计调查问卷时考虑全面;(2)调查人员个人导致的误差,每个调查员的业务素质和能力相差很大,对调查项目中某些细节的理解也可能与问题的设计初衷有所出入;(3)被调查者引起的误差,被调查者可能因为某些顾虑而给出不符合自身实际的答案。

最后,某些利益相关群体可能会影响调查结果,使其向他们所希望的方向发展,这就使得数据结果完全背离事实,对实际毫无意义。

三、降低非抽样误差的方法
1、抽样框误差
(1)联接丢失单位。

这种方法主要适用于不能覆盖总体单位而引起的误差。

所谓联接丢失单位的意思就是抽样样本丢失的个体和抽样样本中某个值相联结。

联接丢失单位,最重要的基础是在抽样的过程中能发现被丢失的单位,如果不能发现,那么联接丢失单位也就无从谈起。

(2)采用辅导样框。

有许多时候,一个样框不能涵盖抽样的总体,其最大的问题是抽样目标会重叠,它可能既隶属于主样框又隶属于辅助样框,该目标总体选中的可能性就增大。

(3)及时更新样框。

这就是解决样框老化和辅助信息不准确最有效的方法。

当然样框更需要较大的资金投入。

所以一般样框更新可以采用分批更新,一年更新样框20%,分五年更新的方式。

(4)对复合联接的处理。

复合连接一般又可以分为两种情况,一是“多对一”,
就是一个目标单位与一个以上的抽样单位相连接.“一对多”的情况则相反。

最简单的方式就是利用复合联接的调查数据对目标总体单位数以及目标总体总量和均值进行估计。

另外一种方法就是确定惟一的联接规则,让多个抽样单位只有一个进入到抽样总体中。

2、无回答误差
(1)访问员。

访问员必须要有相当的责任心,有相应的学历背景,可以保证他们对于问卷的理解不出太大的偏差。

对于访问员的培训也显得非常重要,培训分为两个方面,一是沟通技巧的提高,二是责任心的培养。

咨询公司需要建立一个非常完善的质量控制体系,对访问员的访问进行及时的控制。

(2)加强与被访者的沟通。

加强与被访者的沟通就是所谓提高沟通技巧,这些方法可以分为两类,一是与消费者初次见面时的沟通技巧,二是某个专项问题的沟通技巧,比如如何询问消费者的收人情况等等。

(3)事先通知。

在访问员接触到被访者之前,先进行一定的沟通,比如打电话等,消除消费者的疑虑,然后再进行正式的访问,将会极大地降低拒访率。

(4)物质奖励。

物质奖励要适度,不要过高或过低。

(5)多次访问。

多次访问指第一次访问被拒绝后,进行第二次乃至第三次访问,直到被访者愿意接受采访为止。

(6)替换。

替换就是在某个抽样单位拒绝采访以后,放弃该单位,寻找与其背景相同的人作为替换,进入抽样总体。

替换有其优点,就是实际操作相对于多次访问要简单,但是如果不是随机替换,就需要事先了解被访问的背景,这一般是很难做到的。

纯粹随机替换会造成抽样总体与目标总体之间产生较大的差异。

而且使访问的随意性增加,最后影响到数据的真实性。

减少无回答误差的方法还有很多,比如二重抽样和加权法等等。

3、计量误差
计量误差可以分为三类:一是问卷设计阶段产生的误差;二是记忆误差;三是其他误差。

(1)问卷设计产生的误差。

一是主要来自于不同的措辞的不同表达。

包括文字表达本身产生歧义,文字表达不够简练等等。

一般问卷要求用词简单,不要用专用词。

二是在问卷中出现倾向性和诱导性的词汇。

对一个问题的两种提法往往导
致了两种不同的结果。

三是要注意措辞的平衡。

所谓的平衡指的是,“对于这个问题你同意还是不同意?”而不仅仅是“这个问题你同意吗?”四是问卷设计过长,导致访问者疲劳而产生的计量误差。

一是访问员有意或无意导致数据失真。

对于被访者误差的研究,主要集中在被访者无意使数据失实主要的原因包括:理解错误,即受访者因为各种各样的原因对于问卷本身没有很好的理解,他的所有回答就没有意义。

二是对于理解错误最简单的纠错方法就是在问卷中设置一些逻辑检查题,检查受访者在逻辑上是否有明显的错误,再决定这样的样本是否继续使用。

(2)记忆误差。

记忆误差是计量误差当中非常重要的组成部分。

记忆误差又可以包括调查事件间隔时间太长的误差和心理倾向的误差。

所谓心理倾向的误差,主要指的是消费对于某些数字有天然的倾向性。

对于记忆误差的纠正方法一般有两个,一是控制调查周期,二是对于记忆类的问题一般问“上次”比问”平均”要精确得多。

比如问“你上次饮用了几瓶啤酒”比“您平均一年饮用几瓶啤酒”要好许多。

(3)其他计量误差包括,随机数字表的编制和使用,数据处理过程中包括编码、录入发生的误差等等。

这些误差都可通过比较有效地质量控制来加以限制。

在抽样技术的理论和研究中,关于抽样误差的控制问题已经有了较为深厚的理论基础,但对于非抽样误差的估计问题没有比较综合的理论。

但是,非抽样误差产生于抽样调查的各个阶段,我们必须对非抽样误差进行全面系统的研究,找到有效的控制途径在一定范围内减少非抽样误差。

相关主题