总体分布、参数估计
(1)
(X
Y ) (1 2 )
2 1
2 2
n1
n2
服从N(0,1)。
(2) T(XY)(12) n1n2(n1n22)
(n11)S1 2(n21)S2 2
n1n2
服从t(n1+n2 - 2),( 1 = 2 )。
(3)
F
S12
S
2 2
2 1
2 2
服从F(n1-1,n2-1)。
n
1
n 2
2 2
3、样本(累积)分布函数
设样本观测值x1 x2 ,···, xn ki为小于xi+1的样本值出 现的累积频次, n为样本容量, 则可得样本累积频率分布函数
如下:
0 Fn(x) ki /n
当xx1 当xi xxi1
1
当xn x
样本累积频率分布函数,又称样本(累积)分布函数.样本(累积)
分布函数Fn(x)是对总体的累积分布函数F(x)的近似, n越大, Fn(x)对F(x)的近似越好.
由样本X1,X2,···, Xn产生均值函数X的均值 X = p,
方差
X2
p(1p), n
X
的均值也是总体中某类个体的比例
p
.
所以, 常用 x 来估计p .
七、大样本均值函数的分布:中心极限定理 设:随机变量 X 服从任何均值为,标准差为 的分布, X是随机样本X1,X2,···, Xn的均值函数。
t 分布图
3、F 分布
F 分布是由两个 2 分布之比组成的:
U
F
m V
服从F(m,n)。
n
其中,U 服从2(m),V 服从2(n)。
m=100,n=20 m=15,n=20
密度函数形式为:
f(x) (m (/m 2)2 (nn)/2)(m n)(m nx)m 21(1m nx)m2n,x0
(3)Z
X
服从N(0, 1)分布;
n
(4)
(n
1) S
2
2
服从2(n-1)分布;
(5) T
X
S
服从t(n -1)分布;
n
1
(6) 2
n
(Xi
i1
)2
服从2(n)分布;
定理:若X1,X2,···, Xn1 和Y1,Y2,···, Yn2 分别是正态
总体N(1, 12)和N(2, 22)的一个随机样本,且它 们相互独立,则满足如下性质:
0
x0
重要性质: F1(m,n)F(1n,m)
五、由一般正态分布的随机样本所构成的若干重要统计量 的分布
定理:若X1,X2,···, Xn 是正态总体N(, 2)的一个 随机样本,则样本均值函数和样本方差函数,满足如下性 质:
(1)X 服从N(, 2 / n)分布。
(2) X 与 S2 相互独立。
服从自由度为n的 2 分布,记为 2 ~ 2 (n)。 2 (n)分布的均值 E(2)= n,方差 D( 2 )= 2n。
n=1 n=4
n=10
2(n)分布图
2(n)密度函数:
fn(x)
1
n
22
(n)
n1 x
x2 e 2, x 0
2
0
, x0
其中,n为自由度。(n/2)为珈玛函数,是一个含参数
n/2的积分,为:
统计量的值的定义: 统计量的值是不含未知参数的, 样本 观测值x1,x2,···,xn的函数.
四、由标准正态分布 N(0,1)的随机样本所引出的几 个重要统计量分布:2、t 与 F分布
1、 2(n)分布的构成 设随机变量 X 服从N(0,1)分布, X1,X2,···, Xn
为 X 样本,则 2 = X2i= X21 + X22 + ···X2n
n1 t
(n/2) t2 e 2dt
0
2、t 分布
自由度为n的t 分布,记为 t(n),是由N(0,1)分布和 2(n)分布组成的,其表达式为:
T X Y n
其中,X 服从 N(0,1),Y 服从2(n)分布,且X与Y 相互独立。
密度函数为:
fn(x)
(n1) 2
(1x2)n21, x
n(n/2) n
第四章 总体分布、 样本分布与参数估计
§ 4.1 总体分布与样本分布
一、总体(母体):反映总体特征的随机变量的取值的全体。
总体分布(母体分布):反映总体特征的随机变量的概率分 布。
从无限次随机抽取(然后放回)的角度看,表征一个总体 特征的变量(指标),都可以视为随机变量。
有限总体的概率分布,就是有限总体中不同个体的比率( 频率)分布。
样本分布与总体分布
格利文科 ( Glivenko )定理 (样本分布与总体分布的关系) 定理: 当样本容量 n 趋于无穷大时, Fn(x)以概率1(关于 x )均匀 地收敛于F(x). 该定理是运用样本推断总体的理论依据. 定理的数学表达为:
P (l n i m s x u F n p (x ) F (x ) 0 ) 1
随机样本的均值函数和方差函数都是一个随机变量. 样本数据的样本均值 x 是随机变量 X 的观测值;样本数据 的样本方差 s2 是随机变量 S2 的观测值.
随机样本的均值函数:
X
1 n
n i 1
Xi
随机样本的方差函数:
S2 n1 1i n1(Xi X)2
三、统计量与统计量的分布
统计量定义:统计量是不含未知参数的,随机样本X1,X2 ,···, Xn的函数。
(X i 1)2
(4)
i 1
n
2
n1
2 1
(Yi 2 ) 2
服从F(n1,n2)。
i 1
其中,S12是容量为n1的X的样本方差, S22是容量为n2 的Y 的样本方差。
六、任意分布的随机样本均值函数的均值与方差
设:随机变量 X 服从任何均值为,标准差为 的分布,均值为X,标准差为X ,则有如下结论 成立:
二、随机样本与样本观测值(样本数据)
1、随机样本
表征n次抽取个体的随机抽样的一组随机变量X1,X2,···, Xn 。
2、样本观测值
n次随机抽样的结果:x1,x2,···,xn (称为随机样本X1, X2,···, Xn 的样本观测值)。
n称为随机样本向量( X1,X2,···, Xn )的维度,即自由 度。
(1) X = ; (2) (2) X = / n 或 2X = 2 / n
注: 一个应用广泛的样本均值函数的均值和方差: 0-1分布 的样本均值函数均值和方差。
反映总体中某类个体的比例的随机变量X, 可以简单地 用0-1分布B(1, p)表示. E(X)= p, D(X)= p(1-p). p 是总体中 某类个体的比例.