当前位置:文档之家› SPSS第5章 总体分布、样本分布与参数估计(修改)解读

SPSS第5章 总体分布、样本分布与参数估计(修改)解读


思考:请举出总体均值和总体方差的合适估计量。
§ 5.2 统计量与统计量的分布
一、统计量的定义
统计量:统计量是不含未知参数的,随机样本X1,X2,· · · , Xn的函数。 统计量的值: 统计量的值是不含未知参数的, 样本观测值x1, x2,· · · ,xn的函数.
二、几个重要统计量分布:2、t 与 F分布 1、 2(n)分布
第五章 总体分布、 样本分布与参数估计
§ 5.1 总体分布与样本分布
一、总体与总体分布 总体:反映总体特征的随机变量的取值的全体。 总体分布:反映总体特征的随机变量的概率分布。 二、随机样本与样本观测值 1、随机样本
表征n次抽取个体的随机抽样的一组随机变量X1,X2,· · · , Xn 。
2、样本观测值(样本数据)
频率
频率 累积
%
接收
3、样本(累积)分布函数
设样本观测值x1 x2 ,· · · , xn,ki为小于xi+1的样本值出现的累积频 次, n为样本容量,则可得样本累积频率分布函数如下:
0 当x x1 Fn ( x ) k i / n 当xi x xi 1 1 当x n x
重要性质:
1 F1 (m, n) F (n, m)
三、由一般正态分布的随机样本所构成的若干重要统计量的分布
定理:若X1,X2,· · · , Xn 是正态总体N(, 2)的一个随机样本, 则: (1) X ~N(, 2 / n)
(2) X 与 S2 相互独立。
(3) (4) (5)
频率 累积 %
Q:若有放回地抽取2次,请画出两次均值的分布图。
频率
有放回(with replacement)抽样
10 5 {10,10} 10 {5,10} 7.5 {8,10} 9 {7,10} 8.5 {10,10} 10 {10,5 } 7.5 {5,5} 5 {8,5} 6.5 {7,5} 6 {10,5} 7.5 8 {10,8} 9 {5,8} 6.5 {8,8} 7 {10,7} 8.5 {5,7} 6 8 7 10 10 {10,10} 10 {5,10} 7.5 {8,10} 9 {7,10} 8.5 {10,10} 10
X Y n
~ t(n )
其中,X ~ N(0,1),Y ~2(n)分布,且X与Y相互独立。 密度函数为:
n 1 ) 2 n 1 x 2 fn(x ) (1 ) 2 n n (n / 2) x
(

t 分布图
3、F 分布
F
U m V n
~ F (m ,n )
样本(累积)分布函数Fn(x)是对总体的累积分布函数F(x)的近似, n越大, Fn(x)对F(x)的近似越好。
格利文科 ( Glivenko )定理
当样本容量 n 趋于无穷大时,Fn(x)以概率1(关于 x )均匀地收敛于F(x).
P(lim sup
n x
Fn ( x) F ( x) 0) 1
( X Y ) ( 1 2 )

2 1
n1


2 2
~N(0,1)
n1n2 (n1 n2 2) ~t(n1+n2 - 2),( 1 = 2 ) n1 n2
n2
(2) T
( X Y ) ( 1 2 ) (n1 1) S12 (n2 1) S 22
m=100,n=20
m=15,n=20
其中,U ~2(m),V ~2(n) , 且U与V相互独立。 密度函数形式为:
mn ( ) m mn 1 m m m 2 ( )( x) 2 (1 x) 2 , x 0 f ( x) n (m / 2)(n / 2) n n x0 0
{X i , X j }
X
10 5
8
{7,8} 7.5 {10,8} 9
{8,7} 7.5 {7,7} 7 {10,7} 8.5
一个样本统计量的概率分布被称为该统计量的抽样分布
样本均值抽样分布 直方图
10 150.00% 100.00% 5 50.00% 0 6 7 8 9 10 其他 0.00%
Z X

~N(0, 1) ~2(n-1) ~t(n -1)
n
( n 1) S 2

T
2
X S n
(6)
1

2 ( X ) ~2(n) i 2 i 1
n
定理:若X1,X2,· · · , Xn1 和Y1,Y2,· · · , Yn2 分别是正态总 体N(1, 12)和N(2, 22)的一个随机样本,且它们相互独立 ,则满足如下性质: (1)

(3)
2 2 S1 1 F 2 ~F(n1-1,n2-1) 2 S2 2
(4)
n2
2 2
2 ( X ) i 1 i 1 n2
n1
n1 12 (Yi 2 ) 2
i 1
n x 1 1 2 2 x e ,x 0 n n f n ( x) 2 2 ( ) 2 ,x 0 0
其中,n为自由度。(n/2)为珈玛函数,是一个含参数n/2的 积分,为:
(n / 2)
n t 1 2 2
t
0
e dt
2、t 分布
T

n次随机抽样的结果:x1,x2,· · · ,xn (称为随机样本X1,X2,· · · , Xn 的样本观测值)。
n称为随机样本向量( X1,X2,· · · , Xn )的维度,即自由度。
样本均值的抽样分布
一个总体10,5,8,7,10
直方图 3 2 1 0 5 7 9 11 其他 接收 150.00% 100.00% 50.00% 0.00%
设随机变量 X ~N(0,1) , X1,X2,· · · , Xn为 X 样本,则 2 = X2i= X21 + X22 + · · · X2n ~ 2 (n) 2 (n)分布的均值 E(2)= n,方差 D( 2 )= 2n。 n=1
n=4
n=10 2(n)分布图
2(n)密度函数:
相关主题