第五章 抽样估计
【F(t)】
允许误差 0.38 0.68 0.90 0.95 0.95 0.9 的置信度 29 27 00 00 45 973
第三节 抽样估计的方法
一、抽样估计概述 抽样估计是指利用抽样调查取得的样本ห้องสมุดไป่ตู้ 际资料,采用一定的估计方法,去估计和推 断相应总体未知的指标的一种统计分析方法。 由于总体指标是表明总体数量特征的参数, 因此抽样估计又称参数估计。
四、抽样极限误差 抽样极限误差是指样本指标和总体指标之 间抽样误差的可能范围。
1.平均数极限误差: x x X , x x X x x 2. 成数极限误差: p P ; p P p p p p
3. 置信区间: x
x
; x x
1、计算样本平均数或成数作为总体的估
计值。
给定误 差范围 ,求 保证程 度:F (t)
2、计算样本标准差和抽样平均误差。 x 或 p 3、根据给定的极限误差范围 估
计总体的置信区间: x 下限 x : 上限
x
x
p x :t 4、计算概率度 :t ux up 5、根据概率度“t”值,求出相应的保证程度
② 代表性误差,这种误差是排除登记性误 差以后,在用样本指标推断总体指标时所产 生的误差。 代表性误差的产生又可以分为两种情况: ① 是由于没有遵守随机原则而造成的误差, 称为偏差或系统性误差; ② 是遵守了随机原则,但样本指标不可能 完全代替总体指标,属于抽样推断本身固有 的一种误差,我们称随机性误差。
(二)抽样推断的特点 1. 抽样推断是由部分推算整体的一种认识 方法; 2. 抽样推断是建立在随机取样的基础上; 3. 抽样推断是运用概率估计的方法; 4. 抽样推断的误差可以事先计算并加以控制 5. 抽样调查是一种非全面调查
二、抽样推断的内容: (一)参数估计 运用于不知道总体的数量特征时 (二)假设检验 运用于对总体的变化情况不了解时
五、抽样误差的概率度 抽样误差的概率度是表明抽样指标和总体 指标的误差不超过一定范围的概率保证度, 用“t”表示. x 1. 平均数的概率度: t x t x
x
2. 成数的概率度:
t
p
p
p
t p
最常用的概率度,值及相应概率F( f )值 概率度(t) 0.5 3.0 1.00 1.65 1.96 2.00 0
2. 统计量 根据样本各单位标志值或属性标志计算的 综合指标称为统计量.
1、样本平均数:
xf x f
xx f f
2
2、样本方差:
2
3. 成数方差:
P1 P
2 p
4. 成数平均数:
xp P
xx f f
5. 样本标准差:
2
(三)样本容量和样本个数 样本容量是指一个样本所包含的单位数.通 常将样本个数不少于30个的样本称为大样本; 不及30个的称为小样本. 样本个数又称样本可能数目,指从一个总体 中可能抽取的样本个数.一个总体有多少样本, 则样本统计量就有多少种取值,从而形成该统 计量的分布,此分布是抽样估计的基础.
备注: 前者系统性误差和登记性误差都是 抽样工作组织不好而导致的,应该采取预防 措施避免发生;而后者偶然性的代表性误差 是无法避免的,只能够运用数学公式加以精 确地计算,并通过抽样设计加以控制。因此 这种误差也称为可控制的误差。
思考题:
1. 抽样误差是( ) A. 由于样本数目过少引起的 B. 由于观察、测量、计算的失误引起的 C. 抽样过程的偶然因数引起的 D. 调查中产生的系统性误差 E. 随机性的代表性误差
1、计算样本平均数或成数,作为总体的估计值。 给定置 信度F 3、根据给定的置信度F(t)的要求,求出概率 (t)求 度“t”值。 极限误 差的可 4、计算抽样极限误差的可能范围,找出总体估 能范围 计值的上限和下限。 2、计算样本标准差和抽样平均误差。
5、对总体参数作出区间估计
例1、对某型号的电子元件进行耐用性能检查,抽查的资料分 组列表如下,要求耐用时数的允许误差范围 10.5 小时, x 试估计该批电子元件的平均耐用时数。
1. 重复抽样:
p
2. 不重复抽样:
P1 P n p 1 n N
例题:某电子元件厂生产某种型号的电子 管,按以往正常的正常的生产经验,产品的 一级品率为60%。现从10 000件电子管中抽取 100件来检验其一级品率,试求一级品率的抽 样平均误差。
解题过程:
3. 抽样的组织形式和抽样的方法 在其他条件不变的情况下,不重复抽样下 的样本比重复抽样下的样本代表性强,其抽 样误差相应也要小。在不同的抽样组织方式 下,抽样误差也不同。 在上述影响抽样误差的三个因素中,总体 标志的变异程度是客观存在的因素,是调查 者无法控制的,但样本数目和抽样方式及抽 样的组织形式却是调查者能够选择和控制的。
x
Xf
根据上述资料: (1) 试计算样本灯泡的平均耐用时间. (2) 在95.45%的概率保证程度下,推断10万 只灯泡平均耐用时间的区间范围. (3) 假设耐用时间不及800小时的灯泡为不合 格品,试计算样本的合格率,并按95%的概 率保证程度,推断10万只灯泡的合格概率 区间范围.
(一)抽样估计的数理标准: 对于样本的某一指标而言,它有许多可能 的取值,它与其总体相应指标间总有着或大 或小的误差。因此,据以估计和推断出来的 总体指标,不可能是绝对准确的,实际中允 许有一定的误差。 判断抽样估计是否合理的数理标准: ⒈ 无偏性 无偏性就是指任意一个样本的某项指标来
说,其可能取值围绕与之相应的总体的同 一指标随机摆动,它的期望值,即所有可能 样本该指标的算术平均数等于总体相应指标。 ⒉ 一致性 ⒊ 有效性
6、做出区间估计:以概率为95.45%的保证程度, 该
x
批电子元件的耐用时数在1045—1066小时之间.
例2、对某城市进行居民家计调查,随机抽取400户居民,调查结 果得出年平均每户耐用消费品支出为850元,标准差为200元,要 求以95%的概率保证程度,估计该城市居民每户年平均耐用消费 品的支出额。
三、抽样的基本概念 (一)全及总体和样本总体 1. 全及总体又称母体,简称为总体。它是指 所要调查研究对象的全部单位构成的整体。 2. 抽样总体简称样本,又称小样本,它是指 从全及总体中按随机原则抽取的部分单位 组成的总体。
(二)总体参数和样本统计量 1、它是反映总体综合数量特征的指标。 2、总体平均数用“ X ”表示。 2 ” 表示 总体方差:“
下限 x x 1055.5小时 10.5小时 1045 小时 上限 x x 1055.5小时 10.5小时 1066 小时
5、计算“t”值,求得置信度F(t)
10.5 t 2;当t 2时.F t 95.45% x 5.191
第五章 抽样估计
本章要点:
1. 理解抽样推断的概念及特点 2. 对抽样误差、抽样平均差、抽样极限误差 加以区别 3. 重点掌握简单随机抽样组织形式的区间估 计方法 4. 掌握必要样本单位数的确定方法 5.明确抽样调查的组织形式及其误差的计算
第一节 抽样推断的一般问题
一、抽样推断的意义 ( 一 )抽样推断的概念: 所谓抽样推断是指按照随机原则从被研究 现象的总体中抽取部分单位进行调查,并根 据调查结果对所研究现象总体的数量特征做 出具有一定可靠性的估计和推断,从而认识 现在总体的一种统计方法。
xf 105550 1055.5小时 解:1、计算样本平均数 x f 100
2、计算标准差
xx f 269474 51.91小时 f 100
2
3、抽样平均误差
51.91 x 5.191 小时 n 100
4、根据给定的误差范围 x 10.5小时 ,计算置信区间:
xf 875 1850 5850 35875 46225 10125 3525 1225 105550
x x
x x
2
f
-180.5 -130.5 -80.5 -30.5 19.5 69.5 119.5 169.5 —
32580.1 34060.1 38881 32558.7 16350.8 43472.3 42840.7 28730.3 269474
(四)重复抽样和不重复抽样 1. 重复抽样也称为回置抽样; 2. 不重复抽样也称为不回置抽样;
第二节 抽样误差
一、抽样误差的含义及意义 在抽样调查中,用样本指标推断总体指标, 总会存在一定的误差,其误差的来源主要由 以下两个方面:① 登记性误差,它是指在收 集资料的过程中,由于测量、记录、计算或 抄录的错误,以及被调查者所报不实等原因 产生的误差。
根据题意,可用历史资料作为本批产品的 合格率,即成数P=60%,则总体成数的方 差为:
P1 P =0.6(1-0.6)=0.24
2 p
此外,N=10 000 n=100
1.如果是重复抽样,一级品的抽样平均误 差为:
P1 P p n 2. 如果是不重复抽样,一级品的抽样平均差为: =√0.24/100× P1 P n √(10 000-100)/10 000 p 1 n N ≈4.9%
Í Ã ±Ê é Ð µ ¨ © ª þ ý ¨ © Ä Ó Ê ý ×Ö Ö £ x£ Ô ¼ Ê £ f£ 900Ò Ï Ô Â 875 1 900— 950 925 2 950— 1000 975 6 1000— 1050 1025 35 1050— 1100 1075 43 1100— 1150 1125 9 1150— 1200 1175 3 1200Ò É Ô Ï 1225 1 Ï Æ º ¼ ª ¡ 100