第七章抽样技术
随机数表法
随机数表法:又称乱数表法,其操作过程如下:先将 总体中的每个个体随机编号,然后从随机数表的任一 位置开始,或向左,或向右,或向上,或向下,或一 定间隔向一个固定方向顺序取数,选定的数字所对应 的单元即入样,重复的数字和没有对应单元的数字去 掉,直至抽足所需样本量为止。要注意的是,所有号 码的位数均应相同。
户转人表(KISH表)
1、确定户编号; 2、确定该户中符合调查对象条件的人数; 3、将符合条件的人按年龄大小的顺序排列; 4、查户转人随机抽样程序表,确定何人为被 调查的对象。
选择 户编号
尾数
1
2
3
4
5
6
7
8
9
0
符合条件数
1
2 3 4 5 6 7 8 9
1
2 1 3 4 5 6 7 8
抽样技术的类型 ★随机抽样与非随机抽样的涵义 ★随机抽样与非随机抽样的适用条件
抽样技术
随机抽样技术 非随机抽样技术 误差的来源
随机抽样技术 ★简单随机抽样 ★分层抽样 ★分群抽样 ★系统抽样 非随机抽样技术 ★便利抽样 ★判断抽样 ★配额抽样 ★滚雪球抽样
误差的来源 ★抽样误差
误差来源 与计算
抽样误差的计算 非抽样误差的计算
抽样技术的类型
抽样技术
随机抽样
简 单 随 机 抽 样 分 层 随 机 抽 样 分 群 随 机 抽 样
非随机抽样
系 统 抽 样
任 意 抽 样
判 断 抽 样ቤተ መጻሕፍቲ ባይዱ
配 额 抽 样
滚 雪 球 抽 样
随机抽样与非随机抽样的含义
随机抽样(probability sampling):也称概 率抽样,就是总体中的每一个体都具有相等的 机会被抽取为样本单位的抽样技术。 非随机抽样(non-probability sampling): 也称非概率抽样,指调研总体中的每一个体被 抽取的机会不平等。
多阶段抽样
对北京市低度白酒市场调查分了三阶段抽样: 第一阶段,在3664个居委会中采用简单随机抽 样法抽取了25个居委会; 第二阶段,在25个居委会中,以11为抽样间距, 采用系统抽样法,抽取1024个居民户; 第三阶段,在每一个居民户中,采用KISH表 (简单随机抽样的一种简便方法)抽取了一名 18周岁以上居民作为调查对象。
抽签法
抽签法的操作:即先把调查总体的每个个体依次编号, 并将这些号码分别标记在相互独立的、完全相同、匀质 物体上,然后将这些物体放入某一容器(如纸盒)搅拌 均匀,然后由调研人员从中任意抽取,将与抽到的号码 相对应的个体作为样本单位,如此重复数次,直到抽足 预定的样本数目为止。由抽中的号码所代表的个体组成 的就是一个简单随机样本。 抽签法的优点:操作简便,但当调查总体单位很多时, 编号的工作量很大,搅拌均匀也比较难以做到。 抽签法往往只适用于总体规模较小的市场调研。
分层随机抽样(stratified sampling)
分层随机抽样:亦称分类抽样或类型抽样,指把调查总体 按照其属性不同分为若干层次或类型,然后在各层或类型 按一定的比例关系随机抽取样本。 注意:(1)分层的标志必须可以把总体分隔为相互排斥 的次层,而层间不能有交叉重叠;(2)分层的标志必须 与关心的总体特征相关;(3)各层之间差异大,但层内 差异小;(4)各层单位数目和比例必须可获得;(5)分 层的层次数量不宜太多;(6)在各层抽取样本的方法依 然是简单随机抽样。 分层随机抽样的类型:通常包括比例分层抽样和非比例分 层抽样。比例分层随机抽样是指按各层的单位数量占总体 单位数量的比例分配各层的样本数量。
★非抽样误差
样本容量 的计算
平均数条件下样本量的计算
谢绝拷贝 成数条件下样本量的计算 宋思根
抽样调查的含义
普查:是对构成总体的每一个体都进行调查,并 从中得出有关总体特征的结论的一种调查方法。
抽样调查:是抽取具有代表性的样本,测算样本 结果,并以样本结果推断总体特征的一种调查方 法。
抽样调查的适用条件
个体编号
即对所确定的调查总体中的个体进行编号。 一般,只有当调查者选择随机抽样技术时,这一 步骤才是必要的,其目的是为了简化抽样工作。 当调查总体规模较大时,编号的工作量会增大, 调查者可能会采用分层抽样或分群抽样来简化编号 工作。
抽选样本
这一过程实施涉及两个方面的内容:
– 一是要明确所采取的抽样方法;
8
2
0
6
5
9
为什么采用分群抽样?
1、缺少基本单位的名单,但以由基本单位组 成的群体有现成的名单或有明显的空间界限时, 分群抽样就显得方便实用。 2、总体各个单位在空间上的分布面很广。 2、抽样调查本身目的的需要。例如人口普查 后的抽样复查。
分群随机抽样与分层随机抽样的区别
比较项目 分层标志 分层随机抽样 与研究的总体特征相关 分群随机抽样 与研究的总体特征无关 各群间同质或差异小
子集间差异 各层之间差异大
子集内个 体差异
抽样方式
层内个体同质或差异小
各群内个体差异大
各层内分别随机抽取适当 随机抽取一个或几个群 个体组成样本 作为样本
系统随机抽样(systematic sampling)
系统随机抽样:又称等距离抽样、间隔抽样、
SYS抽样,指先将总体中的个体按一定标志进
行排列编号,并根据总体单位数和样本单位 数计算出抽样距离,然后按照相同的距离或 间隔选取样本的一种抽样方法。
适用:对于总体单位很多的情形,通常采用随机数表
法来抽样。
随机数表法示例
某大学共有30000(五位数)学生,要求采用随机数表法从 中抽取1000人作为样本进行关于大学生消费态度的调查。首 先,调研人员要将总体中的每个个体从l到30000进行编号; 然后从随机数表的任意一行和任意一列的某一个五位数开 始,按照从左到右的顺序,或者从下到上的顺序,以30000 为标准,对随机数表中依次出现的每个五位数进行取舍: 凡小于或等于30000的编码就选出来,凡大于30000的数以及 已经选出的数字则抛弃。直到选够1000个编码为止;最后按 照所抽取的数码,从总体名单中找到它们所对应的l000个个 体。这l000个个体就构成一个随机样本。
任意抽样(convenience sampling)
任意抽样:也称便利抽样或方便抽样,指调研人 员从工作方便出发,在调研对象范围内随意抽选 一定数量的样本进行调查,通常没有严格的标准。 如在超级市场和车站等进行的街头拦截调查,都 属于任意抽样的范畴。 任意抽样的优点:操作简单、节约时间和费用。 适用:非正式的探索性调研。
适合大总体 费用更低 时效更好 满足特殊要求
抽样调查的步骤
定义调查总体
个体编号 抽选样本 实施调查 测算结果
定义调查总体
定义总体的因素 因素 举例
抽样调查的地域范围——顾客活动的范围,可以是 地理因素 一个国家,一个城市,一个县。 根据调查目的和产品的目标市场,从人口统计的角 人口统计 度确定对调查结果起重大影响的那些个体。如年龄 因素 阶段、收入层次、职业群体等。 对于一些市场调查来说,它们的调查总体通常可以 产品/服务 根据消费者对企业产品或者服务的使用情况来定义 使用情况 ,包括是否使用以及使用频率等。
比例分层抽样
例:根据某产品的销售统计数据,家庭用户总体为4万户, 其中,低收入家庭为1.2万户,中等收入家庭为2万户,高收 入家庭为8千户。为进一步研究该产品用户使用状况,需对 300户进行抽样调查,如采用比例分层抽样,低、中、高收 入家庭用户的样本容量分别为多少?抽样结果如下: 户数(万) 1.2 2 0.8 4 所占比例(%) 30 50 20 100 各层样本容量 90 150 60 300
1
2 2 1 3 4 5 1 6
1
1 3 2 3 6 7 4 2
1
1 2 3 1 2 4 5 7
1
2 1 1 5 3 2 6 4
1
1 2 4 5 6 1 3 9
1
1 3 4 2 1 7 2 1
1
2 1 2 1 4 3 8 5
1
1 2 3 4 3 6 7 3
1
2 3 1 2 5 4 1 6
10
4
3
5
1
第七章 抽样技术
本章学习目标
了解抽样调查的相关概念、过程和适用条件;
理解抽样技术的含义;
掌握抽样技术的种类; 理解非随机抽样和随机抽样的含义和实际应用; 理解抽样误差的来源; 掌握平均数和成数条件下误差和样本量计算方法。
学习导航
抽样调查的含义
抽样调查的 概念与步骤
抽样调查的适用条件 抽样调查的步骤 抽样技术的类型
家庭收入分层 低 中 高 总计
非比例分层抽样
非比例分层抽样:也称最佳抽样法,是指根据其 他因素,如各层的标准差来分配各层所应抽取的 样本数目。这种方法的优点在于可以降低各层的 差异,提高样本的可信度。其计算公式为:
ni n
NS
NiSi
i i
式中,ni:第i层应抽取的样本数目;n:应抽取 的样本总数;Ni:第i层的包含的单位总数;Si: 第i层的标准差。
随机抽样与非随机抽样的适用条件
抉择考虑方面 非随机抽样 随机抽样
研究的性质
误差 变异程度
探索性
非抽样误差大 同质(低)
归纳性
抽样误差大 异质(高)
统计
操作
不利
有利
有利
不利
简单随机抽样(simple random sampling)