第三章 抽样分布
14
总体X的K阶原点矩和K阶中心矩分别为
E(Xk)(k=1,2,…) 和 E((X- E(Xk) )k) (k=2,3,…)
总体的一阶原点矩即为总体的均值,总体的二阶中心矩 即为总体的方差。
15
二、几种常用的抽样分布
样本统计量的分布称为抽样分布,即由 样本统计量的全部可能取值和与之相应的概 率(频率)组成的分配数列。
抽样:就是从总体中抽取有限个个体对总体进行观测的过
程。 样本的二重性。抽样之前,由于总体中各个体有同等被 抽中 的 可 能 , 抽 中 哪 个个体不能确定,因此样本是一组随
机变量;但当样本被抽取并测试完成后,各个样本点都
是一个确定的数值,样本成为是一组确定的数值。
6
在相同的条件下对总体X进行n次重复独立的观察。将n次观 察结果按试验的次序记为X1, X2,…, Xn 。 由于X1, X2,…, Xn 是对随机变量X观察的结果,且各次观 察是在相同的条件下独立进行的,所以有理由认为X1, X2,…, Xn是相互独立的,且都是与总体X具有相同分布的随机变量。 这样得到的X1, X2,…, Xn 称为来自总体X的一个简单随机
g ( x1 , x2 ,..., xn )
是g(X1, … ,Xn)的观测值
12
总体分布 未知 总体参数 未知 总体其他信息 未知
样本统计量g=g(X1,X2,…Xn) 两个要点:1、是样本的函数
2、不含未知的参数.
样本 X1,X2,…Xn
在统计推断中,一项重要的工作就是寻找统 计量和导出统计量的分布。
20
x 的抽样分布与总体分布和样本量n有关:
总体是正态分布,样本均值总是正态分布 总体非正态分布,随着n的增大,样本均值趋于正态分布
21
中心极限定理
(central limit theorem)
中心极限定理:设从均值为,方差为 2的一个任意总 体中抽取容量为 n 的样本,当 n 充分大时,样本均值的 抽样分布近似服从均值为μ、方差为σ2/n的正态分布
2 (n)
x
36
附表3中给出了自由度n≤45的2分布的上 α 分位数值. 如对于 0.1, n 25 查附表3得 0.12 (25) 34.382
方便通过EXCEL查分位点,函数为CHIINV。
fx
常用函数
CHIINV
α=0.05 n=55
73.31
α=0.02 n=55
x 0,1
4
总体
总体:研究对象的某项数量指标值的全体。 个体:组成总体的每一个基本元素。
例如:① 某工厂生产的灯泡的使用寿命的全体是一个总体。 每一个灯泡的使用寿命是一个个体。 ② 我校男生的身高的全体是一个总体。
每个男生的身高是一个个体。 总体所含个体的数目称为总体容量.
5
样本
样本:通过随机观测或试验的方法,获得的总体中一部分 个体,称为样本,每个个体称为样本单位。
22
23
24
25
26
27
28
x
样本均值的抽样分布图
合计
1
18
所有可能样本均值的均值和方差
x xi pi 22 1 23 2 28 1 25 16 16 16 i 1
M
x
x x
7 i 1 i
2
fi
1 2 2 21 22 25 1 (23 25) 2 (28 25) 16 25 X
是直接使用样本本身,而是对样本进行“处理”,将
所需信息浓缩集中起来针对不同的问题,构造样本
的适当函数——统计量进行统计推断。
11
一、 统计量
如果样本X1, … ,Xn的函数g=g(X1, … ,Xn)不含未
知参数,则称g(X1, … ,Xn)是一个统计量。
如果x1, … ,xn是对应于样本X1, … ,Xn的样本值, 则称:
例设一个总体含有4个
个体,即总体单位数N=4,
其 取 值 分 别 为 X1=22 、 X2=24、X3=26 、X4=28 。
总体的均值、方差:
X 25 5
2
16
现从总体中抽取 n = 2 的简单随机样本,重复抽样条件 下,共有 42=16 个可能样本。所有可能样本的结果列表如 下,试分析样本均值的分布。
样本均值的均值(数学期望)等于总体均值;
16
样本均值的方差等于总体方差的1/n。
19
事实上,对于来自均值和方差分别为
和 2 的总体的一个简单随机样本X1,
X2,…, Xn ,其样本均值的数字期望和
2 方差分别为 x 和 x
2
n
。
一般称 x
n
为样本均值的抽样误差。
x2 e 2
分布函数为密度函数的积分
4 2 0
2
4
x
26
分布函数为
(1) (0)=0.5
( x) P{ X x}
t2 x 1 2 dt , e 2
(2) (+∞)=1;
x
1 e 2
x2 2
(3) (x)=1- (-x). 一般的概率统计教科书均附有 标准正态分布表供读者查阅 (x)的值.(附表1)如,若 X~N(0,1),(0.5)=0.6915, P{1.32<X<2.43} =(2.43)-(1.32)=0.9925-0.9066 例题:课本74页
所有可能样本及其样本均值( n = 2)
第一个 样本单位
第二个样本单位 A(22)
AA(22)
BA(23)
B(24)
AB(23)
BB(24)
C(26)
AC(24)
BC(25)
D(28)
AD(25)
BD(26)
A(22)
B(24)
C(26) D(28)
CA(24) DA(25)
CB(25) DB(26)
所谓一个分布的 上侧分位数就是指这样一个数,
它使相应分布的随机变量不小于 ( 大于等于)该数的
2 概率为,比如,若记2变量的上侧分位数为 ,则
满足
2 p( 2 )
d
查表313页附表3
20.995Βιβλιοθήκη 11)=2.603 20.01(13)=27.688
f n ( x)
CC(26) DC(27)
CD(27) DD(28)
17
样本均值的抽样分布
均值 22 23 24 25 26 概率 1/16 2/16 3/16 4/16 3/16
将表中样本的均值的各种可能取 值及其可能性(概率)加以整理, 绘制成分布表和分布图如下:
P(x)
0.3
0.2
0.1
0
27
28
2/16
1/16
x
x
P( X x )
f ( x )dx
f ( x )dx 1
f ( x)
黄色阴影部 分概率为α
P ( X x )
的点 xα 为X的上 α 分位数
(简称为上分位点).
上侧分 位数
29
x
(一) 2分布
1. 2分布的定义和密度函数
设X1, … ,Xn是相互独立,服从标准正态分布
第三章 抽样分布
1
第一节 随机样本
研究的标志
统计 推断 中的 总体 及总 体分 布
组成元素 具体对象
组成元素 变量的具体 取值
实物总体
数字总体
例:1000个零件的直径 1000个零件的集合 零件直径的集合
组成元素:每个零件
组成元素:直径观测值
2
对一个总体而言,个体的取值是按一定规律分布
的。任取一个零件,其直径取值是按一定概率分布的。 对某个总体而言,总对应着一个随机变量X,总体 分布就是指随机变量的概率分布。
78.62
37
(二)
t 分布
1. t分布的定义和密度函数
定义:若X~N(0, 1), Y~2(n), X与Y独立,则
X T ~ t (n). Y /n
t(n)称为自由度为n的t分布,记为T~t(n)。 t(n) 分布的概率密度为
新构造的随机变量为原随机变量平方和
31
2(n)分布是参数为n/2,1/2的Γ分布,即2(n)的密度函数为
1 2n / 2 ( n / 2) x e , x 0 f ( x) x0 0,
n x 1 2 2
32
图
2的概率密度曲线
2分布随着自由度n增加,分布渐近于正态。
一个任意分 布的总体
x
n
当样本容量足够 ≥ 30) , 大时(n 样本均值的抽样 分布逐渐趋于正 态分布
x
X
22
中心极限定理
(central limit theorem)
x 的分布
趋于正态 分布的过 程
23
一般正态分布
1. 定义 若随机变量X的密度函数为
1 2 2 f ( x) e 2 其中 x ( x )2
f ( x)
0
x
式中 为实数, >0 .则称X服从参数为 ,2的正态分 布,亦称高斯分布.记为N(, 2).可表为X~N(, 2). 图象见右上角
24
正态分布有两个特性: (1) 单峰对称 密度曲线关于直线x=对称
1 f()=maxf(x)= 2
0
f ( x) f ( x)
2 N(0,1)的随机变量,则称随机变量: 2 X12 X n
所服从的分布为自由度是n的 2 分布,即