当前位置:
文档之家› 统计学 第6章 抽样和抽样分布(不讲概率)
统计学 第6章 抽样和抽样分布(不讲概率)
第6章 抽样与抽样分布
第6章
6.1 6.2 6.3 6.4
抽样与抽样分布
抽样的基本概念 抽样分布基本理论 样本抽样分布 抽样误差的计算
学习目标
1. 2. 3. 4. 5. 了解抽样中的概率抽样方法 理解抽样分布的意义 了解抽样分布的形成过程 理解中心极限定理和大数定理 理解抽样分布的性质
例题分析
[例] 一个汽车电池的制造商声称其最好的电池 寿命的分布均值为54个月,标准差为6个月。 假设某一消费组织决定购买50个这种电池作为 样本来检验电池的寿命,以核实这一声明。 (1)假设这个制造商所言真实,试描述这50 个电池样本的平均寿命的抽样分布 (2)假设这个制造商所言真实,则消费组织的 样本寿命均值小于或等于52个月的概率是多少?
⒈ 重复抽样考虑顺序的可能样本数目:
P N N N N
n N
n
共n个
⒉ 不重复抽样考虑顺序的可能样本数目:
m N N 1 N n 1
n N
3 不重复抽样不考虑顺序的可能样本数目:
C
Байду номын сангаас
N! n !( N n)
6.1 抽样的基本概念
6.1.1 抽样推断 6.1.2 抽样的方法 6.1.3 本容量和样本个数 6.1.4 参数和样本统计量 6.15 抽样框 6.1.6 抽样的组织形式 6.1.7 抽样误差
6.1 抽样的基本概念
6.1.1 抽样推断 6.1.2 抽样的方法 6.1.3 样本容量和样本个数 6.1.4 参数和样本统计量 6.15 抽样框 6.1.6 抽样的组织形式 6.1.7 抽样误差
抽样推断的含义
从研究现象总体的所有单位中,按照随机原 则抽取部分单位作为样本,然后以样本的观 测结果对总体的数量特征作出具有一定可靠 程度和精度的估计或推断的一种统计调查方 法。
68260 43880 82290 61467 98294
79820 08133 95922 51683 64512
91123 09898 96329 43833 19201
注意: 必须先对总体中的每一个单位进行编码或编号, 确定抽样框。 简单随机抽样适合于调查标志在各单位分布较均 匀的总体,一般情况下,简单随机抽样的效果相 对差些。
6.1.3 样本容量和样本个数
样本容量:样本中的单位数,通常用字母n 表示。
通常,n≥30的样本称为大样本, n<30的样 本称为小样本。
样本个数:从总体中可能抽得的样本的数目
从总体N中随机抽取n个样本单 位共有多少种可能的抽选结果 样本的可能数目 与抽样方法和是否考虑顺序有 关。有以下四种组合: ⒈ 重复抽样考虑顺序 ⒉ 不重复抽样考虑顺序 3. 不重复抽样不考虑顺序 4 重复抽样不考虑顺序(不常用)
6.1 抽样的基本概念
6.1.1 抽样推断 6.1.2 抽样的方法 6.1.3 本容量和样本个数 6.1.4 参数和样本统计量 6.15 抽样框 6.1.6 抽样的组织形式 6.1.6 抽样误差
6.1.6 抽样的组织形式
一、简单随机抽样 二、分层抽样 三、系统抽样 四、整群抽样 五、多阶段抽样
随机起点 半距起点 对称起点
·· ·· ··
(总体单位按某一标志排序) 按无关标志排队,其抽样效果相当于简单随机抽样; 按有关标志排队,其抽样效果相当于类型抽样。
整群抽样 (cluster sampling)
—— 将总体全部单位分为若干“群”,然后 随机抽取一部分“群”,被抽中群体的所有 单位构成样本 例:总体群数R=16 样本群数r=4
总体
随机样本
抽样推断方法的特点 1.在调查单位的抽取上遵循随机原则 2.以样本的数量特征去推断总体的数量特征 3.存在抽样误差,可计算并加以控制
抽样推断的作用
一、了解不能或难以采用全面调查的总体的 数量特征 二、与全面调查相结合,修正和补充全面调 查 三、在生产过程中进行质量控制 四、可以对总体的某种假设进行检验
6.15抽样框
抽样框:全部抽样单位的名单框架。抽样框的好坏通 常会直接影响到抽样调查的随机性和调查效果。有如 下几种抽样框形式: 名单抽样框:列出全部总体单位的名录一览表。如职 工名单,企业名单。 区域抽样框:按地理位置将总体范围划分为若干小区, 以小区为单位进行抽样。如市住房调查划分为街道、 区片。 时间抽样框:将总体全部单位按时间顺序排列,每隔 一定时间抽样。如流水线抽样进行产品质检。
解: (1) 尽管对电池寿命的总体分布状态不知,仍可以根据中 心极限定理推断,电池平均寿命的抽样分布近似正态分布。
6 E(x)= =54(个月) x 0.85(个月) n 50 52 54 (2) P 52) P( z (x ) P( z 2.35) 1 0.990613 0.85 0.009387 答:消费组织的样本寿命均值小于或等于52个月的概率是0.94%。
6.1 抽样的基本概念
6.1.1 抽样推断 6.1.2 抽样的方法 6.1.3 本容量和样本个数 6.1.4 参数和样本统计量 6.1.5 抽样的组织形式 6.1.6 抽样误差
抽样中的误差
抽 样 中 的 误 差 登记性误差, 也叫调查误差 系统性误差 代表性误差 偶然性误差
(抽样误差的计算在后边讲)
6.1.4 参数和统计量 参数(parameter)
来描述总体数量特征的指标,又称总体指标。即对总体特征的 数量描述。参数已知,总体的分布特征就已知。
所关心的参数主要有总体均值()、标准差()、总体比例 (P/ )等
用 表示 参数的特点:参数的数值是客观存在的,总体一定,参数就唯
表示
总体
样本
参数
统计量
平均数 标准差 比例 x s p
( P)
6.1 抽样的基本概念
6.1.1 抽样推断 6.1.2 抽样的方法 6.1.3 本容量和样本个数 6.1.4 参数和样本统计量 6.15 抽样框 6.1.6 抽样的组织形式 6.1.7 抽样误差
抽样推断的内容
(一)参数估计 (二)假设检验
6.1 抽样的基本概念
6.1.1 抽样推断 6.1.2 抽样的方法 6.1.3 样本容量和样本个数 6.1.4 参数和样本统计量 6.15 抽样框 6.1.6 抽样的组织形式 6.1.7 抽样误差
6.1.2 抽样的方法
抽样的方法
重复抽样
一确定,但却是未知的。
f ( x)
1 e 2
( x )2 2
2
( x )
统计量(statistic)
又称样本指标或估计量,是根据样本数据计算出来的一 些量,用以推断总体参数(总体指标)的综合指标。 特点:是随样本不同而不同的随机变量,不含未知参数。 所关心的样本统计量有:样本均值(x)、样本标准差(s)、 样本比例(p)等 用
简单随机抽样
(simple random sampling)
——对总体单位逐一编号,然后按随机原 则直接从总体中抽出若干单位构成样本
应用
仅适用于规模不大、内部各单位 标志值差异较小的总体
是最简单、最基本、最符合随机原则, 但同时也是抽样误差最大的抽样组织形式
抽签、随机数字表法
59079 48391 67072 86050 84426
第一阶段:从该省所有县中抽取5个县 第二阶段:从被抽中的5个县中各抽4个乡 第三阶段:从被抽中的20个乡中各抽5个村 第四阶段:从被抽中的100个村中各抽10户
样本n=100×10=1000(户)
抽样组织方式的选择 在实际工作中,选择适当的抽样组 织方式主要应考虑: 调查对象的性质特点 对调查对象的了解程度 抽样误差的大小 人力、财力和物力等条件的限制
x
中心极限定理
x 的分布趋 于正态分布 的过程
6.2.2正态分布的再生定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数 学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)
=10
n=4 x 5 n =16 x 2.5
6.2.3 大数定律
大数定律是阐述大量同类随机现象的平均结果 的稳定性的一系列定理的总称。 1. 独立同分布大数定律 2. 贝努里大数定律
独立同分布大数定律
——设X1, X2, …是独立同分布的随机变量 序列,且存在有限的数学期望E(Xi)=μ和方 差D(Xi )=σ 2(i=1,2,…),则对任意小 的正数ε, 有:
注意:
1、随机性 2、分层抽样要求事先对总体有较多的了解。 3、分层抽样对层而言是全面调查,对层内单位而 言是非全面调查。 4、能避免明显的偏高或偏低情况。 5、适合于调查标志在各单位间的分布差异大的总 体。
系统抽样 (systematic sampling)
等距抽样/机械抽样 ——将总体单位按某一标志排序,而后按一 定的间隔抽取样本单位。
46755 76486 33693 07331 40439
72348 60421 81976 89994 57595
69595 69414 68018 36265 37715
53408 37271 89363 62934 16639
92708 89276 39340 47361 06343
67110 07577 93294 25352 00144
= 50
X
x 50
x
总体分布
抽样分布
例题分析
[例]某酒店电梯中质量标志注明最大载重为18人, 1350kg。假定已知该酒店旅客及其携带行李的平均重 量为70kg,标准差为6kg。试问随机进入电梯18人, 总重量超重的概率是多少?