当前位置:
文档之家› 第5章 抽样分布与抽样方法.
第5章 抽样分布与抽样方法.
样本k阶原点矩 样本k阶中心矩
它反映了总体k 阶 中心矩的信息
1 k Ak X i n i 1
1 n Bk ( X i X )k n i 1
n
k=1,2,…
它们的观察值分别为: 1 n 样本均值 x xi n i 1
样本方差
n n 1 1 2 2 2 2 s ( x x ) [ x n x ] i i n 1 i 1 n 1 i 1
2 ( x x ) s n 1 2
第5章 抽样分布与抽样方法
gongwei@
本章主要内容
• 随机抽样和统计推断 • 抽样分布 • 抽样设计方法
教学基本要求
• 通过本章的学习,掌握抽样的概念,简单随机 抽样的方法;掌握重置抽样的抽样分布,不重 置抽样的抽样分布;识记抽样其他组织形式, 抽样设计的基本原则,掌握各种抽样组织形式 的抽样平均误差的计算方法,了解抽样方案的 设计内容。
抽样的基本概念
• 抽样涉及的基本概念有: – 总体与样本 – 样本容量与样本个数 – 总体参数与样本统计量 – 重复抽样与不重复抽样 • 这些概念是统计学特有的,体现了统计学的基本 思想与方法。
总体和样本(回顾)
• 1.总体:又称全及总体、母体,指所要研究对象的 全体,由许多客观存在的具有某种共同性质的单位 构成。总体单位数用 N 表示。 • 2.样本:又称子样,来自总体,是从总体中按随机 原则抽选出来的部分,由抽选的单位构成。样本单 位数用 n 表示。 • 3.总体是唯一的、确定的,而样本是不确定的、可 变的、随机的。
• 计算有限总体参数的公式中要使用总体的所有单 位的标志值,(有限总体的单位总数N),而计 算样本统计量的公式中只使用抽取到的样本(其 个数是样本量n)。
总体参数和样本统计量
• 总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。 • 样本统计量:根据样本分布计算的指标。是随机变量。
总体 样本
常用统计量
n
它反映了总体均值 的信息
样本均值
1 X Xi n i 1
它反映了总体方差 的信息
n 1 2 样本方差 S 2 ( Xi X ) n 1 i 1
n 1 2 样本标准差: S S2 ( X X ) i n 1 i 1
它反映了总体k 阶矩 的信息,当k=1时, 就是X ~ N ( , 2 ) 的一个样本, 其中未知 , 2已知, 问下列随机变量中那些是统计 量
X1 X n X1 X n ; ; 2 n 2 ( X 1 X n ) ( X 1 X n ) n . ; . 2 n
2、同时,有1500人参加了公司培训, 则参加公司培训计划的比例为: P=1500/2500=0.60 参数是总体的数值特征(A parameter is a numerical characteristic of a population.)。 如:例3中的中层干部平均年薪,年薪标准差 及受培训人数所占比例均为该公司中层干部这一 总体的参数。 ●抽样估计就是要通过样本而非总体来估计总体 参数。
1 n 2 s ( x x ) n 1 i 1 i
样本标准差
1 n k ak xi , k 1,2 n i 1 样本k阶矩 1 n bk ( xi x )k , k 1,2 n i 1 样本k阶中心矩
注意:
• 总体参数是常数,计算总体参数的公式中所用到 的总体各单位的标志值是确定的具体数值,而样 本统计量是随机变量,计算样本统计量的公式中 所用的样本在未具体观察前是随机变量。
样本容量与样本个数
• 样本容量:一个样本中所包含的单位数,用n表示。 • 样本个数:又称样本可能数目,指从一个总体中所 可能抽取的样本的个数。对于有限总体,样本个数 可以计算出来。样本个数的多少与抽样方法有关。 (这个概念只是对有限总体有意义,对无限总体没有 意义!)
例3:某大公司人事部经理整理其2500个中层干部 的档案。其中一项内容是考察这些中层干部的平 均年薪及参加过公司培训计划的比例。 总体:2500名中层干部(population ), 如果:上述情况可由每个人的个人档案中得知, 可容易地测出这2500名中层干部的平均年薪及标 准差。 假如:1:已经得到了如下的结果: 总体均值(population mean) =51800 总体标准差(Population standard deviation=4000
统计量
1. 若X1, X2,…, Xn是来自总体X 的一个样本,
g(X1,X2,…, Xn)是X1,X2,…, Xn的函数, 若 g中 则称g(X1,X2,…, Xn)是一统计量。 不含任何未知参数,
注:统计量是随机变量。
x1,x2,…, xn是相应于样本X1,X2,…, Xn的样本值, 则称g(x1,x2,…, xn)是g(X1,X2,…, Xn)的观察值。
400个 样本 支持人数: 160
推断
支持该候选人的选民 占全部选民的比例: 160/400=40%
抽样估计方法主要用在下列两种情况: 1、对所考查的总体不可能进行全部测度; 2、从理论上说可以对所考查的总体进行全部测度, 但实践上由于人力、财力、时间等方面的原因,无法 或没有必要(不划算)进行全部测度。 注意: ● 抽样调查必须遵循随机原则。 ● 抽样估计只能得到对总体特征的近似测度,因此, 抽样估计还必须同时考察所得结果的“可能范围”与 “可靠程度”。
例1:一汽车轮胎制造商生产一种被认为寿命更长的新型轮胎。
平均里程: 36,500公里
120个 样本
测试
推断
新轮胎 平均寿命: 36,500公里
例2:某党派想支持某一候选人参选美国某州议员,为了决定 是否支持该候选人,该党派领导需要估计支持该候选人的民众 占全部登记投票人总数的比例。由于时间及财力的限制: