抽样调查原理与方法
第二章 基本概念
六、方差、偏差与均方误差 • 方差反映随机因素
ˆ 为 u 的估计值 u
• 偏差反映系统因素
2 ˆ ˆ E[u E (u )]
u为总体真值
ˆ) u E (u
第二章 基本概念 均方误差 MSE
ˆ u) MSE E (u 2 ˆ E (u ˆ ) E (u ˆ) u] E[u
2
ˆ E (u ˆ )] [ E (u ˆ u )] E[u ˆ E (u ˆ )][ E (u ˆ) u] 2 E[u
2
2
ˆ) B V (u
2
第二章 基本概念
七、估计量的优良性准则
1. 一致性
ˆ u ) 1 lim P( u
n 越大时, u 的概率越大 ˆ 接近于 当 u
2
n
第三章 简单随机抽样 若采用不放回抽样
V ( y ) 500 12 6.45
计算公式
V ( y)
N n 125 4 2 ( ) ( ) 6.45 n N 1 2 4 1
2
第三章 基本概念
N n N 1
N n N
为 修正系数
2
为 S 修正系数
n f ,称抽样比, N
第一节 基本问题
一、什么是简单随机抽样 1. 放回抽样 2. 不放回抽样 二、实施方法 • 抽签 • 随机数表 • 计算机抽取
第三章 简单随机抽样
三、符号说明 总体 单位数 N 总和 Y 均值 Y 比例 P 方差 2 及 S 2
N
样本
ˆ Ny Y
p
n
y
2
s
N 1
2
(Y Y )
• 有些现象不可能进行全面调查 • 实际操作有困难
• 检查、核查作用
第一章 绪论
3. 抽样调查优点
• 费用低 • 速度快
• 有助于提高数据质量
第一章 绪论
三、抽样调查的历史
1. 国际上抽样调查的进展
1802年法国数学家拉普拉斯进行人口抽样估 计,这是文字记载最早的抽样案例。 目前抽样方法用于各个领域: 人口调查,经济领域调查,社会问题研究, 电视收视率调查,民意调查,等。
第一章 绪论
2. 我国情况
不同的发展阶段 目前,政府调查,社会调查,市场调查, 收视率调查等,都有长足进展。 与国外差距:热情有余,科学性不够,对 抽样理论缺乏了解。
第一章 绪论
四. 调查步骤
一个完整的调查包括几个阶段性的工作。 1. 调查目标确定 属于调查策划。明确通过调查所要获取的信息,确定 调查内容,决定向谁进行调查(确定调查对象) 2. 调查问卷设计 3. 抽样方法确定 4. 调查方式(数据收集)确定 5. 数据编码与录入
第二章 基本概念
2. 无偏性
3.有效性 令u ˆ 2为 u 的两个无偏估计量 ˆ1 , u
ˆ) u E (u
若
ˆ1 ) V (u ˆ2 ) V (u
ˆ1 是较 u ˆ 2 有效的估计量 则u
第二章 基本概念
八、精度与费用
精 度
100% 95%
.…………..
…….
60%
20%
40%
费用
第三章 简单随机抽样
第一章 绪论
6. 数据审核与插补 7. 数据估计(包括权数确定,计算置信区间) 8. 调查结果表述(调查报告)
第二章 基本概念
一、总体与样本 1. 总体 2. 样本 二、目标总体与抽样总体 1. 目标总体 2. 抽样总体 3. 抽样框
良好抽样框的标志
第二章 基本概念
三、概率抽样与非概率抽样 1. 概率抽样
2
令
N n 1 f 有限总体调整系数 故, N 2
尼克松(50%) 尼克松(62%)
实际
尼(50.3%) 尼(61.8%) 卡(51.1%) 里根(52%) 里(55.3%) 里根(59%) 里( 布什(56%) 布(
2. 数据的间接来源 3. 数据的直接来源 试验数据 调查数据
本课程是对调查而言。
第一章 绪论
二、抽样调查的作用
1. 抽样调查的概念 2. 抽样调查的作用
第一章 绪论
一、数据的来源
1. 统计数据的重要性 量化研究的需要 抽样调查是数据来源的重要途径 样本的有效性问题
第一章 绪论
美国总统竞选预测:
民主党候选人
1968 汉佛莱(50%) 1972 1976 卡特(51%) 1980 19811984 59.2%) 19821988 53.9%)
共和党候选人
0.125 0.1875 0.25 0.1875 0.125
说明样本分布近似正态分布
E( y) Y
第三章 简单随机抽样
抽样误差(标准差)
V ( y ) 1000 16 7.9
抽样误差计算公式
2 V ( y) 125 7.9 n 2
误差也可用方差形式表现
V ( y)
特点与作用
2. 非概率抽样
(1)方便选样 (2)目的选样 (3)自愿样本 (4)配额选样 特点
第二章 基本概念
四、 等概抽样与不等概抽样
1. 等概抽样
2. 不等概抽样
第二章 基本概念
五、抽样误差与非抽样误差 1. 抽样误差
• 可以计算 • 可以控制
2. 非抽样误差
(1)抽样框误差 (2)无回答误差 (3)计量误差
i
N
2
S2
2 ( Y Y ) i
N
s2
2 ( y y ) i
n
n 1
第三章 简单随机抽样
第二节 简单随机抽样的误差计算
例题:A、B 、C 、D 4人,体重分别为 100,110,120,130斤 可知: Y 115
2 2 ( 100 115 ) ( 130 115 ) 2 4 125
现采用抽样方法估计 Y , n 2 ,放回抽样
第三章 简单随机抽样
样本 A,A A,C B,A B,C C,A C,C D,A D,C
y
100 110 105 115 110 120 115 125
( y Y )2
225 25 100 0 25 25 0 100
样本 A,B A,D B,B B,D C,B C,D D,B D,D
2
y
105 115 110 120 115 125 120 130
(y Y ) 100 0 25 25 0 100 25 225
2
合计
( y Y )
1000
第三章 简单随机抽样
样本分布
y
频数
100 1
105 2
110 3
115 4
120 3
125 2
130 1
0.0625
频率 0.0625 并且: