当前位置:文档之家› 贾俊平《统计学》第6章-统计量及其抽样分布

贾俊平《统计学》第6章-统计量及其抽样分布


抽样分布的形成过程
(sampling distribution)
总体
计算样本统计



如:样本均值
、比例、方差
渐近分布
当n较大时,就用极限分布作为抽样分 布的一种近似,这种极限分布称为渐近分 布。
6.3 由正态分布导出的几个重要 分布
1、 2分布
2、 t分布
3、F分布
2分布
(2 distribution)
1、由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特
(Hermert)和卡·皮尔逊(K·Pearson) 分别于1875年和
1900年推导出来。
2、设 X ~ N(, 2 )
,则
z X ~ N(0,1)
3、令 Y z 2 ,则 Y 服从自由度为1的2分布,即
Y ~ 2 (1)
抽样分布 (sampling distribution)
英国统计学家把抽样分布、参数估计和 假设检验看作统计推断的三个中心内容。
抽样分布就是指样本统计量的概率分布 ,属于随机变量函数的分布。
若无特别说明,讨论的都是可重复的简 单随机抽样,需满足两个条件: 1、随机变量X相互独立 2、样本与总体同分布
不同性别的人与全部人数之比
合格品(或不合格品) 与全部产品总数之比
总体比例可表示为 N0 或
N
样本比例可表示为
p n0 或 n
1 N1
N 1 p n1
n
样本比例的抽样分布
在重复选取容量为n的样本时,由样本比 例的所有可能取值形成的相对频数分布。
当样本容量很大时,样本比例的抽样分 布可用正态分布近似。
一个任意分 布的总体
x


n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
x
抽样分布与总体分布的关系
总体分布
正态分布
样本均值 正态分布
非正态分布
大样本
小样本
样本均值 正态分布
样本均值 非正态分布
样本比例的抽样分布
比例
(proportion)
总体(或样本)中具有某种属性的单位与全部单位总 数之比
统计应用
“抓阄”征兵计划
➢ 然而结果是,有73个较小的号码被分配给了前半 年的日子,同时有110个较小的号码被分配给了后 半年的日子。换句话说,如果你生于后半年的某 一天,那么,你因为被分配给一个较小号码而去 服兵役的机会要大于生于前半年的人
➢ 在这种情况下,两个数字之间只应该有随机误差 ,而73和110之间的差别超出了随机性所能解释的 范围。这种非随机性是由于乒乓球在被抽取之前 没有被充分搅拌造成的。在第二年,主管这件事 的部门在抓阄之前去咨询了统计学家(这可能使生 于后半年的人感觉稍微舒服些)
2分布
(性质和特点)
1. 分布的变量值始终为正
2. 分布的形状取决于其自由度n的大小,通常为不 对称的正偏分布,但随着自由度的增大逐渐趋 于对称
3. 期望为E(2)=n,方差为D(2)=2n(n为自由度)
4. 可加性:若U和V为两个独立的服从2分布的随 机 变 量 , U~2(n1) , V~2(n2), 则 U+V 这 一 随 机 变量服从自由度为n1+n2的2分布
总体

2分布
(图示)
选择容量为n 的 简单随机样本 计算样本方差s2
计算卡方值
2 = (n-1)s2/σ2
计算出所有的
2值
不同容量样本的抽样分布
n=1 n=4 n=10 n=20
2
6.4 样本均值的抽样分布 与中心极限定理
当总体服从正态分布N(μ,σ2)时,来自该总体的所有 容量为n的样本的均值x也服从正态分布,x 的数
判断是否统计量: 看构造的函数是否有未知参数。
常用统计量
掌握均值和方差。
次序统计量
哪些是次序统计量: 中位数、分位数、四分位数、极差和均值
充分统计量
统计计量加工过程中一点信息都不损 失的统计量通常称为充分统计量。
6.2 关于分布的几个概念
6.2.1 抽样分布 6.2.2 渐近分布 6.2.3 随机模拟获得的近似分布
第 6 章 统计量与抽样分布
6.1 统计量 6.2 关于分布的几个概念 6.3 由正态分布导出的几个重要分布 6.4 样本均值的分布与中心极限定理 6.5 样本比例的抽样分布
6.1 统计量
6.1.1 6.1.2 6.1.3 6.1.4
统计量的概念 常用统计量 次序统计量 充分统计量
统计量的概念
➢ 这种抓阄看起来对决定应该被征召入伍是一个相当不错 的方法。然而,在抓阄的第二天,当所有的日子和它们 对应的号码公布以后,统计学家们开始研究这些数据。 经过观察和计算,统计学家们发现了一些规律。例如, 我们本应期望应该有差不多一半的较小的号码(1到183) 被分配给前半年的日子,即从1月份到6月份;另外一半 较小的号码被分配给后半年的日子,从7月到12月份。 由于抓阄的随机性,前半年中可能不会分到正好一半较 小的号码,但是应当接近一半
➢ 在第一年的征兵计划中,号码1被分配给了9月14日 ,分配方法是随机抽取一个大容器中的366个写上了 日子的乒乓球。结果所有年满18岁且生于9月14日的 合格青年将作为第一批被征召入伍。生日被分配为 号码2的青年则在第二批被征召入伍,以此类推
统计应用
“抓阄”征兵计划
➢ 我们知道,并不是所有的人都被征召入伍,因此,生日 被分配的号码较大的人也许永远轮不上到军队服役
学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)
=10
n= 4
x 5
n =16
x 2.5
= 50 X
总体分布
x 50
x
抽样分布
中心极限定理
(central limit theorem)
从均值为,方差为 2的一个任意总体中抽取容量为n的
样本,当n充分大时,样本均值的抽样分布近似服从均 值为μ,方差为σ2/n的正态分布
你不必吃完整一头牛,才知道它的 肉是咬不动的。
Samel Johnson
统计Байду номын сангаас用
“抓阄”征兵计划
➢ 在美国的对越战争中,为使前线有足够的士兵,美 国政府制定了一个“抓阄”的征兵计划。该计划打 算把1到366的号码随机地分配给一年中每一天,然 后由军事部门按分配的号码顺序把生日与之对应的 年轻人分批征召入伍。这种方法的目的是为了给大 家相等的机会卷入这场不受欢迎的战争中,因此被 征召的可能性应该是随机的
相关主题