第6章 市场研究抽样设计
28 20 04 55 72
46 67 36 01 58
53 42 28 26 43
35 15 19 64 57
74 20 26 98 89
92 57 64 56 64
13 80 37 71 27
45 90 15 49 54
如要从94家上市公司中抽取12家作为调查样本,可 将94家公司由1至94编号,然后从随机数表的任一行一 列作为起点, 如从第二排第三列的数组起从上而下、自左而右抽 取,则顺序取得的样本号为: 42、28、26、43、35、 15、19、64、57、74、20、26、89、92
(一)随机抽样方法 1.简单随机抽样(Simple Random Sampling)
定义: 简单随机抽样(Simple Random Sampling) 是指按照等概率的原则直接从含有N个元素 的总体中抽取n个元素组成样本。(N>n)
方法:
抽签法/摸号法
随机数表法
随机数表是将0-9十个数字用完全随机顺序排列编成的表。
(二)非随机抽样方法
1.方便抽样(Convenience Sampling)
方便抽样考虑是抽样的便利,选择容易接触的个体作为 调查研究对象; – 在入户调查中,调查员选择家中有人的住户; – 没有认定被调查者身份的拦截式访问; – 利用客户的名单进行调查; – 将问卷登在宣传媒体上,被调查者自填后寄回。 • 特点 – 方便选样 – 样本的信息不适用于总体参数的推断。 – 这种方法偏差大,但有时也比较有效务实。
2.系统抽样(Systematic Sampling)
定义: 在总体中按一定的标志顺序排列,并根据总体单位数和 样本单位数计算出抽样距离,然后按相同的距离抽 选样本。所以又称为等距抽样。
按标志排序 计算抽样距离
抽选样本
例:某地区有居民110户,采用系统抽样法抽选11户。
①将总体单位进行编号,即从1至110号; ②确定抽样距离=
ni
N i Si
(N S )
i 1 i i
m
n
Si
(x
j 1
Ni
ij
xi )
2
Ni 1
式中:Si表示第i层的标准差;m表示所分层数目;xij表 示第i层第j个样本的观察值。
例如:在上例中 则:
S高 300 S中 200 S低 50 ; ;
n高
2000 300 200 50(户) 2000 300 6000 200 12000 50
2.制定抽样框
3.决定抽样方案 4.确定样本容量 5.实际抽取样本 6.评估样本质量
随机抽样与非随机抽样
对样本的质量、代表性、偏差等进行初 步的检验和衡量,以防止由于样本的偏 差过大而导致失误。
编制抽样框
• 在编制抽样框架时常见的问题如下:
– – – – 遗漏-遗漏部分样本单位; 聚堆-缺乏个体样本单位信息; 重复-同一样本单位重复出现; 混杂-抽样框架中包括部分非样本总体成员。
总体数N N 110 10 样本数n n 11
③确定起抽号数:从1——10号中随机抽取,如2; ④确定被抽取的单位:2,12,22,32,42,……,102。
3.分层抽样(Stratified Sampling)
定义: 将总体单位按某种特征 A 分成两个或两个以上相 互独立的组,从每一组 中再简单随机抽样,样 本相互独立, 使得:组间特征差异大, 组内特征差异小,增加 样本对总体的代表性。 适用情况: C D BFra bibliotek (N
N i S i / ci
i
S i / ci )
n
分层抽样小结: 适用于总体单位数较多,情况复杂,且单位之间 差异较大的调查对象。
其不足表现在须对总体单位的情况有较多了解。
4.整群抽样(Cluster Sampling)
定义: 先将总体分成许多小群组,将各群组编号, 随机抽选,对被抽取的群组进行普查。 适用情况: ①对总体的构成资料难以全面了解; ②组内各单位的差异大,而组间差异小。
n高
N高 N
n
2000 200 20 20000
n中 60 (户), 低 120 n (户)
(2)最佳分层抽样(牛曼分层抽样)
根据各层样本的标准差的大小,调整各层的样本数目。 即考虑各层在总体中所占的比例,又考虑到各层标准差的差 异程度,有利于降低各层的差异,以提高样本的可信程度。
【例】中国女性减肥品市场细分研 究:定义总体
目标总体:2003年中国大中城市女性减肥品的现有消 费者和潜在消费者 抽样总体:十个代表城市中,A公司销售人员在其产品 销售终端可以接触到的年龄在18-50周岁之间的女性减 肥品现有消费者和潜在消费者
甄别问卷
访问员提问,被访者回答 0-1【出示卡片1】请问你本人或你家中是否有人在卡片上列举的地方工作呢? 市场研究公司, 广告公司 ................................ X 社情民意调查机构, 咨询公司 ............................ X -->终止访问 减肥产品的生产/批发/销售部门 .......................... X 以上均无 .............................................. 1 0-2 请问在过去半年内您有没有接受过有关减肥产品的市场调查呢? 有 ........................................................ 1-->终止访问 没有 ...................................................... 2 0-3 【出示卡片2】请问您的年龄属于如下哪一个年龄段呢? 20岁以下 .................................................. 1-->终止访问 20-25岁 ................................................... 2 26-30岁 ................................................... 3 31-40岁.................................................... 4 41-50岁.................................................... 5 50岁以上................................................... 6-->终止访问 0-4 请问您过去1年有没有使用过有关减肥方面的产品呢? 使用过............................................. 1跳问1-1(检查配额) 没有使用过...................................... .. 2继续问0-5 0-5 请问您未来一年内是否可能会使用有关减肥方面的产品呢? 可能会使用......................................... 1检查配额,继续问1-1 肯定不会使用....................................... 2终止访问
n中 100 户);n低 50 ( (户)
结果对比分析: 高收入层增加了30户,中收入层增加了40户,低收 入层减少了70户。 购买电器与收入成正比,高收入层相对大于低收入 层,更加吻合,提高了准确性。
(3)分层最低成本抽样(德明分层抽样或经济抽样)
兼顾了各层的差异程度与调查费用
ni
主要内容
• • • • • 一、抽样设计的基本概念 二、抽样设计的步骤 三、抽样方法 四、样本大小的确定 五、有关抽样设计的几个问题
一、抽样设计的基本概念
抽样调查:是指从符合调查要求和目的的全部个体中选取部 分个体进行调查,并根据调查所得的结果推断总体的一种专门 性的市场调查活动。 总体的界定:凡符合调查研究目的所需的研究对象的集合。 样本:从总体中按一定程序抽得的那部分个体或抽样单元组 成的集合。 样本容量:样本中包含的单位数目。 抽样和抽样框:抽样是指从总体中按一定的方式选取样本的 过程。抽样框(sampling frame)是用来抽取样本的工具。是总 体的数据名录或单位的名单。 参数值(总体值)与统计值(样本值)
• 例:调查广州市所有的西饼店,用黄页 的工商业名单作抽样框
过滤问题
• 为了确定某一个体是否属于抽样总体, 常有必要使用过滤问题。 • 除了某项研究的特殊要求以外,营销 研究通常要求研究对象: – 过去3个月内没有接受任何产品或广 告调查; – 本人及家庭成员不在有关的公司工 作。
调研实践:抽样框失误
A
B
C
D
5.多阶段抽样(Multistage Sampling)
• 在许多情况下,特别在复杂的、大规模的调研中, 调查单位一般不是一次性直接地抽取到的,而是 多阶段抽取的办法,即先抽大的调查单元,在大 单元中抽小单元,再在小单元中抽更小的单元, 这种抽样组织方式称为多阶段抽样。 • 多阶段抽样在抽取样本及组织调查时很方便,但 在设计抽样调查方案、计算抽样误差和推断总体 上比较复杂。
总体分布不均匀,各总体单 位之间标志变异程度比较大。
(1)比例分层抽样 即按各层中的单位数占总体的比例分配各层样本量。
ni Ni n N
ni表示第i层要抽取的样本数;Ni表示第i层目标总体数;
N表示目标总体数;n表示要抽取的样本总数。
例如:某公司要预测某地区家用电器的潜在用户,这种商品的消费同 收入水平有关,因而以家庭收入为分层基础。已知总体单位数为 20000户,已确定的样本数为200户。家庭收入分为高、中、低三层, 其中高收入层2000户,中收入层6000户,低收入层12000户。则: 高收入层要调查的户数为: