当前位置:文档之家› 第五章 抽样估计

第五章 抽样估计


【F(t)】
允许误差 0.38 0.68 0.90 0.95 0.95 0.9 的置信度 29 27 00 00 45 973
第三节 抽样估计的方法
一、抽样估计概述 抽样估计是指利用抽样调查取得的样本ห้องสมุดไป่ตู้ 际资料,采用一定的估计方法,去估计和推 断相应总体未知的指标的一种统计分析方法。 由于总体指标是表明总体数量特征的参数, 因此抽样估计又称参数估计。
四、抽样极限误差 抽样极限误差是指样本指标和总体指标之 间抽样误差的可能范围。
1.平均数极限误差: x x X , x x X x x 2. 成数极限误差: p P ; p P p p p p
3. 置信区间: x
x
; x x
1、计算样本平均数或成数作为总体的估
计值。
给定误 差范围 ,求 保证程 度:F (t)
2、计算样本标准差和抽样平均误差。 x 或 p 3、根据给定的极限误差范围 估
计总体的置信区间: x 下限 x : 上限
x
x
p x :t 4、计算概率度 :t ux up 5、根据概率度“t”值,求出相应的保证程度
② 代表性误差,这种误差是排除登记性误 差以后,在用样本指标推断总体指标时所产 生的误差。 代表性误差的产生又可以分为两种情况: ① 是由于没有遵守随机原则而造成的误差, 称为偏差或系统性误差; ② 是遵守了随机原则,但样本指标不可能 完全代替总体指标,属于抽样推断本身固有 的一种误差,我们称随机性误差。
(二)抽样推断的特点 1. 抽样推断是由部分推算整体的一种认识 方法; 2. 抽样推断是建立在随机取样的基础上; 3. 抽样推断是运用概率估计的方法; 4. 抽样推断的误差可以事先计算并加以控制 5. 抽样调查是一种非全面调查
二、抽样推断的内容: (一)参数估计 运用于不知道总体的数量特征时 (二)假设检验 运用于对总体的变化情况不了解时
五、抽样误差的概率度 抽样误差的概率度是表明抽样指标和总体 指标的误差不超过一定范围的概率保证度, 用“t”表示. x 1. 平均数的概率度: t x t x
x
2. 成数的概率度:
t
p
p

p
t p
最常用的概率度,值及相应概率F( f )值 概率度(t) 0.5 3.0 1.00 1.65 1.96 2.00 0
2. 统计量 根据样本各单位标志值或属性标志计算的 综合指标称为统计量.
1、样本平均数:
xf x f
xx f f
2
2、样本方差:


2
3. 成数方差:
P1 P
2 p
4. 成数平均数:
xp P
xx f f
5. 样本标准差:

2
(三)样本容量和样本个数 样本容量是指一个样本所包含的单位数.通 常将样本个数不少于30个的样本称为大样本; 不及30个的称为小样本. 样本个数又称样本可能数目,指从一个总体 中可能抽取的样本个数.一个总体有多少样本, 则样本统计量就有多少种取值,从而形成该统 计量的分布,此分布是抽样估计的基础.
备注: 前者系统性误差和登记性误差都是 抽样工作组织不好而导致的,应该采取预防 措施避免发生;而后者偶然性的代表性误差 是无法避免的,只能够运用数学公式加以精 确地计算,并通过抽样设计加以控制。因此 这种误差也称为可控制的误差。
思考题:
1. 抽样误差是( ) A. 由于样本数目过少引起的 B. 由于观察、测量、计算的失误引起的 C. 抽样过程的偶然因数引起的 D. 调查中产生的系统性误差 E. 随机性的代表性误差
1、计算样本平均数或成数,作为总体的估计值。 给定置 信度F 3、根据给定的置信度F(t)的要求,求出概率 (t)求 度“t”值。 极限误 差的可 4、计算抽样极限误差的可能范围,找出总体估 能范围 计值的上限和下限。 2、计算样本标准差和抽样平均误差。
5、对总体参数作出区间估计
例1、对某型号的电子元件进行耐用性能检查,抽查的资料分 组列表如下,要求耐用时数的允许误差范围 10.5 小时, x 试估计该批电子元件的平均耐用时数。
1. 重复抽样:
p
2. 不重复抽样:
P1 P n p 1 n N
例题:某电子元件厂生产某种型号的电子 管,按以往正常的正常的生产经验,产品的 一级品率为60%。现从10 000件电子管中抽取 100件来检验其一级品率,试求一级品率的抽 样平均误差。
解题过程:
3. 抽样的组织形式和抽样的方法 在其他条件不变的情况下,不重复抽样下 的样本比重复抽样下的样本代表性强,其抽 样误差相应也要小。在不同的抽样组织方式 下,抽样误差也不同。 在上述影响抽样误差的三个因素中,总体 标志的变异程度是客观存在的因素,是调查 者无法控制的,但样本数目和抽样方式及抽 样的组织形式却是调查者能够选择和控制的。
x
Xf
根据上述资料: (1) 试计算样本灯泡的平均耐用时间. (2) 在95.45%的概率保证程度下,推断10万 只灯泡平均耐用时间的区间范围. (3) 假设耐用时间不及800小时的灯泡为不合 格品,试计算样本的合格率,并按95%的概 率保证程度,推断10万只灯泡的合格概率 区间范围.
(一)抽样估计的数理标准: 对于样本的某一指标而言,它有许多可能 的取值,它与其总体相应指标间总有着或大 或小的误差。因此,据以估计和推断出来的 总体指标,不可能是绝对准确的,实际中允 许有一定的误差。 判断抽样估计是否合理的数理标准: ⒈ 无偏性 无偏性就是指任意一个样本的某项指标来
说,其可能取值围绕与之相应的总体的同 一指标随机摆动,它的期望值,即所有可能 样本该指标的算术平均数等于总体相应指标。 ⒉ 一致性 ⒊ 有效性
6、做出区间估计:以概率为95.45%的保证程度, 该
x
批电子元件的耐用时数在1045—1066小时之间.
例2、对某城市进行居民家计调查,随机抽取400户居民,调查结 果得出年平均每户耐用消费品支出为850元,标准差为200元,要 求以95%的概率保证程度,估计该城市居民每户年平均耐用消费 品的支出额。
三、抽样的基本概念 (一)全及总体和样本总体 1. 全及总体又称母体,简称为总体。它是指 所要调查研究对象的全部单位构成的整体。 2. 抽样总体简称样本,又称小样本,它是指 从全及总体中按随机原则抽取的部分单位 组成的总体。
(二)总体参数和样本统计量 1、它是反映总体综合数量特征的指标。 2、总体平均数用“ X ”表示。 2 ” 表示 总体方差:“
下限 x x 1055.5小时 10.5小时 1045 小时 上限 x x 1055.5小时 10.5小时 1066 小时
5、计算“t”值,求得置信度F(t)
10.5 t 2;当t 2时.F t 95.45% x 5.191
第五章 抽样估计
本章要点:
1. 理解抽样推断的概念及特点 2. 对抽样误差、抽样平均差、抽样极限误差 加以区别 3. 重点掌握简单随机抽样组织形式的区间估 计方法 4. 掌握必要样本单位数的确定方法 5.明确抽样调查的组织形式及其误差的计算
第一节 抽样推断的一般问题
一、抽样推断的意义 ( 一 )抽样推断的概念: 所谓抽样推断是指按照随机原则从被研究 现象的总体中抽取部分单位进行调查,并根 据调查结果对所研究现象总体的数量特征做 出具有一定可靠性的估计和推断,从而认识 现在总体的一种统计方法。
xf 105550 1055.5小时 解:1、计算样本平均数 x f 100
2、计算标准差
xx f 269474 51.91小时 f 100

2
3、抽样平均误差
51.91 x 5.191 小时 n 100

4、根据给定的误差范围 x 10.5小时 ,计算置信区间:
xf 875 1850 5850 35875 46225 10125 3525 1225 105550
x x
x x
2
f
-180.5 -130.5 -80.5 -30.5 19.5 69.5 119.5 169.5 —
32580.1 34060.1 38881 32558.7 16350.8 43472.3 42840.7 28730.3 269474
(四)重复抽样和不重复抽样 1. 重复抽样也称为回置抽样; 2. 不重复抽样也称为不回置抽样;
第二节 抽样误差
一、抽样误差的含义及意义 在抽样调查中,用样本指标推断总体指标, 总会存在一定的误差,其误差的来源主要由 以下两个方面:① 登记性误差,它是指在收 集资料的过程中,由于测量、记录、计算或 抄录的错误,以及被调查者所报不实等原因 产生的误差。
根据题意,可用历史资料作为本批产品的 合格率,即成数P=60%,则总体成数的方 差为:
P1 P =0.6(1-0.6)=0.24
2 p
此外,N=10 000 n=100
1.如果是重复抽样,一级品的抽样平均误 差为:
P1 P p n 2. 如果是不重复抽样,一级品的抽样平均差为: =√0.24/100× P1 P n √(10 000-100)/10 000 p 1 n N ≈4.9%
Í Ã ±Ê é Ð µ ¨ © ª þ ý ¨ © Ä Ó Ê ý ×Ö Ö £ x£ Ô ¼ Ê £ f£ 900Ò Ï Ô Â 875 1 900— 950 925 2 950— 1000 975 6 1000— 1050 1025 35 1050— 1100 1075 43 1100— 1150 1125 9 1150— 1200 1175 3 1200Ò É Ô Ï 1225 1 Ï Æ º ¼ ª ¡ 100
相关主题