当前位置:文档之家› 统计学原理第5章

统计学原理第5章

2、样本的单位数
3、抽样方法
4、抽样调查的组织形式
三、抽样平均误差
抽样平均误差是抽样
平均数或抽样成数的标准 差,反映了抽样指标与总
体指标的平均误差程度。
假设总体包含1、2、3、4、5,五 个数字。 则:总体平均数为
1+2+3+4+5 =3 x = 5 现在,采用重复抽样从中抽出 两个,组成一个样本。可能组成的 样本数目:25个。 如: 1+3 =2 1+4 =2.5 2+4 =3 2 2 2 3+5 = 4 …….. 2
n
N
计算结果表明:根据部分产品推断全部产品的平均使用寿命 时,采用不重复抽样比重复抽样的平均误差要小。
抽样成数平均误差的计算方法
采用重复抽样:
p

p p 1 n
p 1 p n 1 n N
采用不重复抽样: p
例题三: 某校随机抽选400名学生,发现戴眼镜的学
x x
p
抽样成数极限误差: Δ p =│p - P│
p -Δ p ≤P≤ p+Δ
五、抽样误差的概率度
抽样误差的概率度是测量抽样估计可靠 含 义 程度的一个参数。用符号“ t ”表示。
公式表示: t= Δ μ
(t 是极限误差与抽样平均误差的比值)
上式可变形为: Δ =tμ
(极限误差是 t 倍的抽样平均误差)
三、总体参数区间估计的方法
(一)根据给定的抽样误差范围, 求概率保证程度
分析步骤: 1、抽取样本,计算抽样指标。
2、根据给定的极限误差范围估 计总体参数的上限和下限。 3、计算概率度。 4、查表求出概率F(t),并对 总体参数作出区间估计。
(二)根据给定的概率F(t),推算 抽样极限误差的可能范围
因V乙<V甲 故乙品种具有较大稳定性,宜于推广。
第五章
抽样估计
教学目的与要求
抽样估计是抽样调查的继续,它提供 了一套利用抽样资料来估计总体数量特征 的方法。通过本章的学习,要理解和掌握 抽样估计的概念、特点,抽样误差的含义、 计算方法,抽样估计的置信度,推断总体 参数的方法,能结合实际资料进行抽样估 计。
1.2 1.1 1.0 0.9 0.8
600 495 445 540 420
1.5 1.4 1.2 1.0 0.9
840 770 540 520 450
要求:
⑴分别计算两品种的单位面积产量。
⑵计算两品种亩产量的标准差和标
准差系数。
⑶假定生产条件相同,确定哪一品 种具有较大稳定性,宜于推广。
产量 x f x 面积 f
生有80人。根据样本资料推断全部学生中戴 眼镜的学生所占比重时,抽样误差为多大?
例题四: 一批食品罐头共60000桶,随机抽查300桶
,发现有6桶不合格,求合格品率的抽样平 均误差?
例 题 三 解:
已知:
n 400
n1 80
n1 80 则:样本成数 p 20 % n 400
p

x x
n
2
样本标准差
x
x x
f
2
f
研究品 质标志
样本成数 p = 成数标准差
n n
p
p1 p
(三)样本容量和样本个数
样本容量:一个样本包含的单位数。用 “n”表示。 一般要求 n ≥30 样本个数:从一个全及总体中可能抽取的样本数目。
(四)重复抽样和不重复抽样
本章主要内容
•抽样推断的一般问题
•抽样误差
•抽样估计的方法 •抽样组织设计
第一节
概 念
抽样推断的一般问题
一、抽样推断的概念和特点
抽样推断是按随机原则从全部 研究对象中抽取部分单位进行观察, 并根据样本的实际数据对总体的数 量特征作出具有一定可靠程度的估 计和判断。 它是由部分推断整体的一种认识方法。 抽样推断建立在随机取样的基础上。 抽样推断运用概率估计的方法。
300 1 0.806 (%) 60000
p
p1 p n
p
p 1 p n 1 n N
0.98 0.02 300
计算结果表明:不重复抽样的平均误差小于重复抽样,
但是“N”的数值越大,则两种方法计算 的抽样平均误差就越接近。
多数样本指标与总体指标都
有误差,误差有大、有小,有正、
有负,抽样平均误差就是将所有
的误差综合起来,再求其平均数,
所以抽样平均误差是反映抽样误 差一般水平的指标。
抽样平均误差的计算公式
抽样平均数 的平均误差
x
x X
M
2
抽样成数 平均误差
p
p P 2
M
(以上两个公式实际上就是第四章讲的标准差。 但反映的是样本指标与总体指标的平均离差程度) 实际上,利用上述两个公式是计算不出抽样平均误差的。
第三节
抽样估计的方法
无偏性
一、总体参数的点估计
总体参数点估计的特点: 总体参数优良估计的标准 一致性
有效性
二、总体参数的区间估计
总体参数区间估计的特点: 估计值 区间估计三要素 抽样误差范围
x, p x , p
x , p
抽样估计的置信度
F t
什 么 是 抽 样 估 计 的 置 信 度? 抽样估计的置信度就是表明抽 样指标和总体指标的误差不超过一
则: x

1.5n

1 0.8165 1.5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。
采用不重复抽样:
x

n 1 n N
2
公式表明:抽样平均误差不仅与总体变异程度、 样本容量有关,而且与总体单位数的多少有关。
例题一:随机抽选某校学生100人,调查他们的体
1 n
③可通过调整样本单位数来控制抽样平均误差。
例题:假定抽样单位数增加 2 倍、0.5 倍时,抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍 则: x
1 0.577 3n 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。 抽样单位数增加 0.5倍,即为原来的 1.5倍
(1)以95.45%的可靠性推断该农 场小麦平均亩产可能在多少斤之间? 若概率保证程度不变,要求抽样允许 误差不超过1斤,问至少应抽多少亩 作为样本?
AD
BD CD DD
Nn = 42
=16 (个样本)
不重复抽样
N(N-1)(N-2)……. 4×3 = 12(个样本)
第二节
抽 样 误 差
一、抽样误差的含义
由于随机抽样的偶然因素使样本
各单位的结构不足以代表总体各单位 的结构,而引起抽样指标和全及指标 之间的绝对离差。
二、影响抽样误差大小的因素
1、总体各单位标志值的差异程度
四、抽 样 极 限 误 差
含义: 抽样极限误差指在进行抽样估计时,根据研究 对象的变异程度和分析任务的要求所确定的样 本指标与总体指标之间可允许的最大误差范围。 计算方法: 它等于样本指标可允许变动的上限 或下限与总体指标之差的绝对值。
x x X
抽样平均数极限误差:
x x ≤ X ≤

n

10 1(公斤) 100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例题二解: 已知: N=2000 n=400 σ=300 则: x=4800
400 2000
x
3002 400 2 n 1 13.42(小时) 1
正态概率分布图
因为扩大或缩小以后 的平均误差,就是极 限误差: Δ=tμ 所以,抽样平均误 差的系数就是概 率度t。
68.27%
数理统计已经证明,抽样 误差的概率就是概率度的 函数,二者对应的函数 关系已编成“正态分布 概率表”。
95.45% x+1μ x+2μ X 由此可知,误差范围愈大,抽样估计的置信度愈高,但抽样估计 的精确度愈低;反之,误差范围愈小,则抽样估计的置信度 愈低,但抽样估计的精确度愈高。 x-2μ x-1μ
(一)总 体 和 样 本
总体: 又称全及总体。指所要认识的 研究对象全体。总体单位总数用“N” 表示。 样本: 又称子样。是从全及总体中随 机抽取出来,作为代表这一总体的 那部分单位组成的集合体。样本单 位总数用“n”表示。
(二)参 数 和 统 计 量
参 数 反映总体数量特征的全及指标。
总体平均数


抽样推断的误差可以事先计算并加以控制。
二、抽样推断的内容
参数估计 参数估计是依据所获 得的样本观察资料,对所研究现 象总体的水平、结构、规模等数 量特征进行估计。 假设检验 假设检验是利用样本 的实际资料来检验事先对总体某 些数量特征所作的假设是否可信 的一种统计分析方法。
三、有关抽样的基本概念
x甲
xf f
2500 500(公斤) 5
x乙
3120 520 (公斤 ) 6

55.3公斤
(x x) f
2
f
15275 5
甲 55.3 V甲 100% 11.06% x甲 500

9900 40.6公斤 6
40.6 V乙 100 % 7.8% 520
p1 p n
0.2 0.8 0.02 400
即:根据样本资料推断全部学生中戴眼镜的学
生所占的比重时,推断的平均误差为2%。
例 题 四 解:
已知: N 60000
相关主题