市场调查抽样设计
与缺点 • 非随机抽样的优
点与缺点
第二节 抽样误差与样本量
一、抽样误差的概念和种类 抽样误差是由于抽样造成的误差,即用样本 估计总体而产生的误差。抽样误差无特定偏 向,误差大小主要受以下三个因素影响:总 体变异情况,样本量大小,抽样调查的组织 方式。非抽样误差是基于抽样之外的许多其 他原因而产生的误差。
• 不等比例抽样就是不同的层的抽样比例并不等。 如何分层需要考虑研究问题的情况,如在进行关 于图书购买的调查中,如果认为教育程度是一个 重要的影响因素,就可以根据教育程度进行分层 。分层随机抽样,既可以对一个总体进行推断, 也可以就分层后的子总体进行推断。分层抽样是 一种经常使用的抽样技术,特别是将分层抽样和 系统抽样结合使用,更是改善抽样的效果。
四、抽样方案设计
抽样方案设计的基本内容: 1、确定抽样调查的目的、任务和要求 2、确定调查对象的范围和抽样单位 3、确定容许误差 4、确定抽取样本的方法 5、确定置信水平 6、确定必要的样本量 7、制定实施总体方案的办法和步骤 五、抽样设计原则
经济、有效、可操作。
定义总体及 抽样单位
确定抽样框 选择抽样技术
从总体分布到样本分布到样本平均值的抽样分布
1、无限总体简单随机抽样
2、有限总体简单随机抽样样本容量确定 总体规模N 有放回抽样,计算公式同无限总体。
无放回抽样
总体标准差的确定 利用以前的调查结果 进行实验性调查 利用二手资料 运用判断
影响样本量的因素 调查对象总体的差异程度 容许误差的大小 调查结果的可靠程度(置信水平) 抽样方法 抽样组织形式
市场调查抽样设计
2020年4月26日星期日
第一节 抽样调查的基本概念
一、抽样调查的特点
抽取样本
经济,高效,准确。 总体 二、抽样调查的作用 三、常用术语
推断总体
样本
1、总体和样本
2、总体指标和样本指标(参数 和统计量)
3、重复抽样和不重复抽样
4、总体规模和样本规模 5、抽样框和抽样单元 6、抽样误差和非抽样误差 7、显著性水平和置信水平 8、绝对容许误差和相对容许误差
抽样间隔等于10000除以200等于50,在1-50 之间随机产生一个数作为随机抽样的起点 ,例如采取抽签的方法得到随机起点是18 ,则编号为18的就是第一个被抽取的样本 单位,依次为18、68、118…,一直到抽取 200个样本单位为止。系统抽样可以编抽样 编组建抽样框,而且可以提高抽样的代表 性,减少抽样的总体误差,是一种常用的 比较有效的抽样方法。
• 随机抽样可以采用抽签法和随机数表法。抽 签法是将每个电话号码编号,或者直接将电 话号码制成卡片,每个卡片代表一个电话号 码,然后搅拌均匀,从中任意抽取,直到完 成样本为止。随机数表是一系列随机产生的 无规则排列的数字构成的表格。利用随机数 表法进行抽样,也就是将调查总体进行编号 ,如果共有10000个个体,则每一个个体就 可以对应一个五位数,从00001—10000, 只需准备一张多于5位的随机数表,如有一 张8位数的随机数表,我们可以利用其后5位 。
二、系统抽样 系统抽样也叫等距抽样或机械抽样,是先
在总体中按照一定的标志把个体顺序排列,并 根据总体规模和样本容量计算出抽样间隔,在 随机地确定抽样起点,就是第一个被抽取的个 体,然后按照相同的距离或间隔顺序地抽取样 本单位,直到完成样本为止。例如,要对全国 的零售书店进行抽样调查,假设共有10000家零 售书店,可以按照其销售收入多少进行排列顺 序,如果选择200家做调查,则样本容量为200 ,
起点r
r+k
r+2k
r+3k
分层抽样
分层抽样是将总体单位按照一定的特征进行分层, 然后在每一层里按照等比或不等比的方式采用简单 随机抽样或系统抽样抽取样本单位,构成一个调查 的样本。分层的原则是使层间的差异大、层内的差 异小,通过分层抽样可以提高样本的代表性,减小 抽样误差,提高了抽样的效率。分层抽样有等比抽 样和不等比抽样两种。等比例抽样就是每一层的抽 样比例都相等,因此都等于总体的抽样比例。
• 现在随机地确定行数和列数作为随机的起 点,如通过产生随机数,确定从第5行第3 列为起点,从随机数表上找到第5行第3列 的数,看其后5位,假设是07381,则编号 为07381的就被抽取,然后在看下一行的数 字的后5位数字,如果在00001—10000之 间,就被抽取,否则继续,直到完成样本 抽取为止。
第三节 随机抽样方法
一、简单随机抽样 简单随机抽样,又称单纯随机抽样,是在总体单位中
不进行任何有目的的选择,而是按照随机原则,纯 粹偶然的方法抽取样本的技术。简单随机抽样是随 机抽样方法中最简单的一种,适应总体规模不大, 总体抽样框比较容易组建的调查项目。简单随机抽 样的操作方法是根据调查的要求,确定调查对象的 总体,根据总体的性质确定抽样框,如实行电话调 查,假设总体中每一个个体都有一个唯一的电话号 码,而我们又可以得到些电话号码,这时所有的电 话号码就构成了调查对象总体的一个对应物,通过 对电话号码进行抽样就可以确定我们的调查样本, 这时电话号码就是一个可以进行抽样的抽样框。
非抽样误差
非观测偏误
观测偏误
无回答
覆盖不周
被访问者责任 访问员责任
不在家 拒答
故意错答 误解错答 过失 作弊
三、样本容量确定
正态分布 正态分布的特征 正态分布在市场调查中的重要性 根据中心极限定理,对于任何总体,不论其分布
如何,随着样本容量的增加,样本平均值的分 布趋近于正态分布.
标准正态分布 标准正态分布的平均值 标准正态分布的标准差 正态分布的标准化 总体分布\样本分布和抽样分布 总体分布:总体中所有单位的概率(频率)分布 样本分布:是单个样本中所有单位的频率分布 样本平均值的抽样分布:所有可能样本平均值的分布
实施抽样
确定必要的样本量
如何定义总体与抽样单位
• 同质总体 地域因素 人口统计因素 使用情况 认知度 过滤性问题筛选
抽样框问题
• 有些情况下并没有一 一对应的抽样框
• 电号码本作为抽样 框可能存在的偏差
• 电话随机拨号技术的 应用
选择抽样方法
• 随机抽样方法 • 非随机抽样方法 • 随机抽样的优点