第二章 抽样设计
2、编制抽样框
是将抽样单位进行编号排列而形成的一张清单。在这个 抽样清单中,每个抽样单位都有一个号码作为其标志,以便 对总体中的每个抽样单位进行识别,并能保证从总体中抽出 所需要的样本。
3、选择收集资料的方法
主要是指确定接触被访对象搜集原始资料的方法,目前主 要的方法包括:入户访谈、街道拦截访谈、电话访谈、邮寄 问卷等。
另外,在实践中通常需要进行多阶整群抽样,比如,全国城 市的抽样调查就是省中选城市—中选城市抽区—中选区抽街 道—中选街道抽家庭—中选家庭抽个人进行访问。
二、非随机抽样的基本方法
1、方便抽样:它是根据抽样者抽取样本的便利或方便性来 进行选样。实践中的以下几种情况可考虑用这种方法:调查 方案设计前的摸底调查;设计问卷前的调查以及问卷测试等。
99%
16589 4147 1843 1037 664 461 339
1、如果在你的路线中遇到死胡同,继续沿这条路或者街道 的另一面向相反方向走。在可能的地方右拐,每隔两户住 家访问一户。
2、如果你沿街区走了一圈,又回到了出发点而又没有完成 规定的4个访问目标,那么可以试着访问起点的那一家。
3、如果你调查了整个街区,还是没有完成所需要的访问目 标,则继续从街(或乡间小路)对面最近的第一个住户开 始。
(1)分层抽样的设计的基本原则: 在层的划分上:
A、总体划分为若干个层时,不能有遗漏,以免使个别“层” 被忽略,影响样本的代表性。
B、层与层之间不应当有相互重叠的现象,总体中的某一个 抽样单位被划分到某一个层之后,就不能再属于其他的层。
C、层与层之间的差异要尽可能大,从而提高样本对整体的 代表性。
D、同一层内各单位之间的差异要尽可能小。
5、在起始门牌号对面临近的街区绕一圈后,如果你没有完成 所需要的访问,就按照顺时针方向,在下一个街区访问。
6、如果第三个街区的住户数不够完成你的任务,就继续在几 个街区进行直到完成要求访问的户数为止。这些街区要按照 顺时针方向绕原有的街区来找。
第四节 样本量的确定
一、影响样本量大小的因素 (一)管理方面影响样本量大小的因素
在分层标准的选择上:除了人口统计特征之外(年龄、性别、 职业、收入、教育程度等),还可以根据消费产品的情况 (比如重度、中度、轻度及潜在消费者等),品牌知晓情况、 媒介接触情况等指标进行分层。
层数的确定:经验上的层数一般是3——10个精心划分的层 就可以了。
(2)分层抽样的基本步骤 第一、根据需要及对总体的了解情况,按一定标准将总体的 构成元素划分为若干个互不重叠的层,所有层的数量加起来 应当等于总体规模。
人口统计因素 地域因素 使用情况 信息认知程度
主要是指被调查对象的性别、年龄、 职业、收入、教育程度等
一定地域范围内的被调查对象,可能 是全国、一个城市或一个县等。
通常是通过在一定时间范围内是否使 用及使用的频率来对消费者产品或服 务的情况进行区分 主要是指消费者对商家传播出的有关 服务或产品信息知晓情况与理解记忆 的情况。
只要这个地址在你的访问单上的一个“×”旁边出现,就把它当 作你所在区域的街道中的另一个地址。并访问这一家。如果 不是,就访问这家右边的一家。永远遵循“右手原则”。
4、如果这一地区街对面从第一号开始都没有住户,则在第一 号对面的街区转一圈,并遵守“右手法则”(这意味着你将 按照顺时针方向在街区转一圈),然后沿着路线每隔两户访 问一户。
第二步、选择图表中第一行,从左向右的第三个数字 “2”开始,以四个数字为一组进行连续选择,那么就可以 得到下面标号的样本:2715,9986,7174,4511, 0215,1418……直到选够300个为止。
随机数表
63271 59986 71744 51102 15141 80714 58638 93108 13554 79945 88547 08986 95436 79115 08303 01041 20030 63754 08459 28364 55957 57243 83865 09911 19761 66535 40102 26646 60147 15702 ……
1、企业的调查经费预算 2、需要衡量调查的精度要求对企业的实际意义。 (二)统计方面影响样本量大小的因素 1、总体的构成情况 2、抽样误差的大小 3、抽样方法的差异 (三)调查实施方面影响样本量的因素 1、问题的回答率 2、问卷的回收率
二、确定样本量大小的方法 (一)经验确定方法 常用的经验样本量有200个、300个、400个、500个。抽样 调查中大样本与小样本的确定基本原则: 1、样本量达到或超过总体的5%,就称为大样本 2、样本量不到总体的5%,这样的样本称为小样本 3、样本量虽不足总体的5%,但是大于500个,也可算是大 样本 4、样本量不足总体的5%,且小于500个,就算是小样本。
表二:常用的置信度与相应的Z值表
置信度
Z值
99%
2.58
95%
1.96
90%
1.65
表三:简单随机抽样的样本量
置信度 最大允许误差
1% 2% 3% 4% 5% 6% 7%
90%
6765 1691 752 423 271 188 138
95%
9604 2401 1067 600 384 267 196
50
层在总体中所占的比
例相等。比如,从 1000个教师中按非比
副教授 35%
35
例分层抽100个样本。 300人
讲师 15% 15 500人
4、整群抽样 它是将总体划分为若干个群,以群作为抽样单位,从中选取 一部分群,然后对群内的全部元素进行调查的抽样方法。基 本步骤是:
第一、确定分群的标准,如自然行政区域。
第二章 抽样设计
要点:1、掌握抽样设计的几个基本概念 2、掌握抽样设计的基本方法 3、掌握确定样本量的方法
第一节 抽样设计的基本概念
1、总体——指研究对象的全部 2、样本和样本量——样本是指每一个被抽到的个体或单位。
样本中包含个体或部分的数量就是样本量。 3、抽样单元——为了便于实现随机抽样,常常将总体划分
第二、将总体划分为若干个互不重叠的部分,每个部分为一 个群。
第三、根据总样本量确定应该抽取的群数。
第四、采用简单随机抽样或系统抽样的方法抽取确定的群数。
分层抽样与整群抽样的区别:
1、分层抽样要求各层之间的差异大,层内个体差异小; 而 整群抽样则要求群与群之间的差异要小,群内的个体差异大。
2、分层抽样的样本是从每个层中抽取若干个样本,而整群 抽样则是要么某一个群被抽取,从而群内的样本都被调查, 要么某一个群不抽取,从而群内的样本都不调查。
第二节 抽样的基本方法
抽样方法有两大类:随机抽样和非随机抽样。 一、随机抽样(概率抽样)
1、简单随机抽样 (1)抽签法 (2)随机数表法,下面以10000个学生中抽取300个样
本进行调查为例说明其基本步骤: 第一步、对总体中的各抽样单位进行编号。在编号时
注意以“降位”的方式来进行,这样抽样的效率要高很多。 举例说明降位。 降位:比如总体规模是100,那么最好的编排方式是00— —99,那么,如果总体规模是10000,其编号方式呢?
2、判断抽样:是指研究人员依据一定的选择标准,通过其主 观判断来选择最合适的被访者的一种方法。它常适用于总体 内部构成差异较大而样本量较小的研究。
3、配额抽样:是根据一定标准或标志对总体分层或分类后, 从各层或各类中主观的抽取一定比例样本的方法。所谓“配 额”就是给划分出的总体各层或各类分配一定数量的名额, 从而组成一个配额样本。配额样本见图表。
4、滚雪球抽样:是指通过受访者推荐另外受访者的方法来获 得调查对象并对其进行调查的方法。
手机用户的配额样本构成表 单位:人
男 女 小计
现有手机用户 35 35 70
潜在手机用户 15 15 30
合计 50 50 100
如果还要考虑年龄的因素,则还给出年龄配额:20-29岁为 50%的配额,30-39岁为30%的配额,40岁以上为20%的 配额,则会有下列三个指标形成的配额样本。
对样本量的确定方法: 1、尽量使样本量达到总体的5%以上 2、若样本量在总体的5%以下,也最好在500个以上。
(二)样本量的理论计算方法 公式 :
其中,n为样本量,Z为一定置信度下对应的概率度(具体对应 情况见表二),E为可接受的抽样误差。
表三就给出了一些在不同置信度与允许误差条件下的简单随 机样本值。 (置信度:也称把握度,是指由抽样调查结果来推断总体情 况的可信程度,一般用百分比来表示。) 当 样本量大于总体的5%时,就要对上述公式计算出的样本 量进行调整,其调整公式为:n1=(n×N) ÷(N+n-1)。 其中, n1为调整样本量,N为总体数量,n为原来计算出的 样本量
2、由于抽样距离相等,这样就在总体的抽样号码链上形 成了一个具有周期性质的规律。这个周期规律如果与总体抽 样单位排列方式的周期吻合,那么就可能存在抽样的巨大偏 差,抽样的结果可能是完全没有代表性的。
3、分层抽样 分层抽样是在对总体有事先了解的前提下,按照一定的标准, 将总体划分成若干个互不重叠的层。然后再从每个层中按照 简单随机抽样或系统抽样方法抽取相应的样本。
三个指标的配额样本构成表 单位:人
现有手机用户
男女
20-29岁 18 18
30-39岁 10 10
40岁以上 7
7
小计
35 35
潜在手机用户
男女
8
8
44
3
3
15 15
合计
52 28 20 100
第三节 抽样设计的步骤
抽样设计的基本步骤: 1、界定总体(见表一)
表一:界定总体的指标详细描述
指标
详细描述
为若干个互不重叠的部分,每一个部分就叫做抽样单元。 4、抽样误差和Байду номын сангаас抽样误差