第七章 抽样推断 优质课件
5
8
7
4
5
5
6.5
6
4.5
8
6.5
8
7.5
6
7
6
7.5
7
5.5
4
4.5
6
5.5
4
抽样平均误差
抽样平均误差是反映抽样误差一般水平的指标,其
实质是抽样指标的标准差。
例如: (不重复抽样) 一个总体5,8,7,4。对该总体进行容量为2的不重复抽样
,则样本个数有12个,如下表所示:
5
8
7
4
5
-
6.5
6
4.5
重复抽样
每次从总体中抽取一个样本单位进行登记后,再 放回原总体。
1.2抽样分布
抽样分布
某个样本统计量的抽样分布,从理论上说就是在 抽取容量为n的样本时,由每一个样本算出的该统计 量数值的频数分布或概率分布。
重复抽样分布
样本均值的分布
一个总体5,8,7,4。对该总体进行容量为2的重复抽样,则样本 个数有16个,如下表所示:
正态总体、方差已知,或非正态总体、大样 本
1.假设:
(1)总体服从正态分布,且已知总体方差 2 ;
或者 总体不服从正态分布,但样本容量 n> =30。
2.置信区间:
x Z/2. n
课堂练习
某商店抽出36名顾客组成一个随机样本,调查他们在一 段时间内对某种商品的需求量。根据以往的经验,这种商品 的需求量服从正态分布,标准差为2,从调查结果算出样本 平均数为20,试求总体平均数为95%的置信区间。 ( z0.025 1.96 )
1.1抽样推断的基本概念
抽样推断
在很多实际问题中,由于各种原因,我们不能收 集全面数据,只能从中收集部分数据。依据这种部分 观测取得的数据对总体的数量特征或数量规律进行推 断称为抽样推断。
抽样组织方式
简单随机抽样
按随机原则直接从总体中抽取样本,从而保证总 体中的每个单位被抽中的机会相等。
类型抽样
4
4.5
6
5.5
-
样本均值的频数分布表
样本均值的直方图
中心极限定理
中心极限定理
不论总体服从何种分布,只要样本容量足够大,样
本均值 x 的分布都大致服从正态分布:
x ~ N (, 2 ) n
抽样误差
样本指标与总体指标的数量差异。
例如: 一个总体5,8,7,4。对该总体进行容量为2的重复抽样,
n
xi
x i1 1113 n
所以,该天生产灯泡平均寿命的矩估计量为1113小时。
区间估计
区间估计
依据样本把总体的未知参数确定在某一范围内,要 求它以足够大的概率包含待估参数真值。
总体未知参数
区间
区间下界
区间上界
区间估计的内容
待估参数
均值
比例
大样本
小样本
方差
2.1单一总体均值的区间估计
求解过程
1. 已知 n=36, =2 ;
2. 样本均值 x =20 ;
3. 由1- =0.95,查标准正态分布概率表得: z0.025 1.96
4. 在95%的置信水平下的置信区间为:
2
x Z/2.
5
8
7
4
5
5
6.5
6
4.5
8
6.5
8
7.5
6
7
6
7.5
7
5.5
4
4.5
6
5.5
4
样本均值的频数分布表
样本均值的直方图
不重复抽样分布
样本均值的分布
一个总体5,8,7,4。对该总体进行容量为2的不重复抽样,则样 本个数有12个,如下表所示:
5
8
7
4
5
-
6.5
6
4.5
8
6.5
-
7.5
6
7
6
7.5
-
5.5
又称分层抽样,是先将总体单位按某项标志分组 ,然后再按随机原则从每组之中进行抽样。
等距抽样
将总体中的单位按照某项标志排列,然后按照固 定顺序或间隔进行抽样。
整群抽样
先将总体中的单位划分为若干群,然后随机抽取 一些群,对被抽中群的所有单位进行全面调查。
抽样方法
不重复抽样
每次从总体中抽取一个样本单位进行登记后,不 再放回原总体。
则样本个数有16个,如下表所示:
5
8
7
4
5
5
6.5
6
4.5
8
6.5
8
7.5
6
7
6
7.5
7
5.5
4
4.5
6
5.5
4
抽样平均误差
抽样平均误差是反映抽样误差一般水平的指标,其
实质是抽样指标的标准差。
例如:(重复抽样) 一个总体5,8,7,4。对该总体进行容量为2的重复抽样,
则样本个数有16个,如下表所示:
2.参数估计
引例
某企业某天生产了6000个灯泡,从中抽取10个进行 寿命测试,得到的数据如下:(单位:小时)
1050 1080 1100 1030 1120 1200 1210 1130 1170 1040 问:该天生产的灯泡平均寿命大约是多少?
定义
根据样本统计量估计总体的未知参数,这类问题称 为参数估计。
两种方法
点估计:以样本的某一函数值作为总体中未知参数 的估计值。
区间估计:依据样本把总体的参数确定在某一范围 内,要求它以足够大的概率包含待估参数真值。
点估计-矩估计法
定义
利用样本的数字特征作为总体数字特征的估计,即 用样本的均值 x估计总体的均值 ,用样本的方差 S 2估 计总体的方差 2 ,其中:
应用统计学 -Applied Statistics
北京理工大学珠海学院 吴浩然
第七章 抽样推断
1
抽样推断概述
2
参数估计
3
假设检验
4
方差分析
引例
某饮料生产企业用自动罐装机罐装橙汁饮料,每罐标 准含量为500ml,为保证产品的稳定性,需要每隔一定时 间检查机器工作情况。现抽得10罐,测得其含量为(单 位:ml) 495, 510, 498, 503, 492, 502, 505, 512, 497, 506, 假定含量服从正态分布,试问机器工作是否正常?
8
6.5
-
7.5
6
7
6
7.5
-
5.5
4
4.5
6
5.5
-
抽样平均误差的计算
重复抽样
样本平均数
xn
样本成数
p(1 p)
p
n
不重复抽样
2
x
(1 n ) nN
p
p(1 p) (1 n )
n
N
抽样极限误差
因为平均误差反映抽样的可能误差范围,而实际 上每次抽样推断中只抽一个样本,因此实际上的抽样误 差可能大于抽样平均误差,也可能小于抽样平均误差。 因而在抽样估计时,应根据分析任务的要求,确定可允 许误差的范围,这一允许范围称极限误差。
n
(xi x)2
S 2 i1 n 1
课堂练习
例 某企业某天生产了6000个灯泡,从中抽取10个进行寿命测试, 得到的数据如下:(单位:小时)
1050 1080 1100 1030 1120 1200 1210 1130 1170 1040 请用矩估计法估计该天生产灯泡的平均寿命。 解:样本的平均寿命: