当前位置:
文档之家› 概率论与数理统计5-1 基本概念
概率论与数理统计5-1 基本概念
第 五章
数理统计的基本概念 与 抽样分布
5.1 基本概念
一、总体与个体 二、随机样本的定义 三、统计量 四、小结
一、总体与个体
一个统计问题总有它明确的研究对象.
研究对象的全体称为总体(母体),
总体中每个成员称为个体.
总体
研究某批灯泡的质量
总体 …
考察国产 轿车的质量
然而在统计研究中,人们往往关心每个 个体的一项(或几项)数量指标和该数量指标 在总体中的分布情况. 这时,每个个体具有 的数量指标的全体就是总体.
例1 设总体 服从参数为 ( 0) 的指数分
布, (1,2 ,L ,n ) 是来自总体的样本, 求样本
(1,
解
2 ,L ,n ) 的概率密度.
总体 的概率密度为p(
x)
e
x
,
x0
0,
x0
因为1,2,L ,n 相互独立, 且与 有相同的分布,
所以 (
灯泡的寿命
国产轿车每公里 的耗油量
该批灯泡寿命的 全体就是总体
所有国产轿车每公里耗 油量的全体就是总体
由于每个个体的出现带有随机性,即相应的 数量指标值的出现带有随机性。从而可把此种 数量指标看作随机变量,我们用一个随机变量 或其分布来描述总体。为此常用随机变量的符 号或分布的符号来表示总体。
通常,我们用随机变量 ,,,…, 等表示总 体。当我们说到总体,就是指一个具有确定概 率分布的随机变量。
D
D(
1 n
i )
1 n2
Di
1 n2
2
1 n
2
i 1
i 1
i 1
(3)
E ( S n2
)
E[
1 n
n
i2
2]
1 n
n
E(i2 ) E 2
i 1
i 1
n
1n (Di (Ei )2 ) (D (E )2 )
i 1
n
pn (x1,
1,2
x2 ,
,L
, xn
,
)
n
)的概率密度为
n
p(xi )
ne
n
i 1
xi
,
i 1
0,
xi 0 其它
例2 设总体 服从两点分布 B(1, p), 其中0 p 1, (1,2 ,L ,n )是来自总体的样本, 求样本 (1,2,L ,n )
容量为n的样本可以看作n维随机变量.但 是,一旦取定一组样本,得到的是n个具体的数
(x1, x2 , , xn ) ,称此为样本的一次观察值,源自 称样本值.2. 简单随机样本
抽取样本的目的是为 了利用样本对总体进行统 计推断,这就要求样本能很 好的反映总体的特性且便 于处理.为此,需对抽样提 出一些要求,通常有两条:
称函数
0,
Fn
(
x
)
k n
,
1,
x x(1) , x(k ) x x(k1) , x x(n) .
为总体的经验分布函数.换句话说, 对任何
实数x, 经验分布函数 Fn (x) 为样本值中不超 过x的个数再除以n, 即
Fn ( x)
1 n
S (x),
( x )
1 n
(
2
2)
(
1 n
2
2)
n1 n
2
i 1
(4)
E(Sn*2 )
E(
n n1
Sn2 )
n n1
E(Sn2 )
2
性质5.2
若总体 的k 阶矩 E( k ) 记成 k存在, 则当n 时, Ak Pk , k 1, 2,L .
证明 因为 1,2,L ,n 独立且与 同分布,
个统计量,统计量的分布称为抽样分布。
设 x1, x2 ,L , xn 是相应于样本1,2 ,L ,n
的样本值, 则称 f (x1, x2 ,L , xn ) 是 f (1,2 ,L ,n )
的观察值.
例1
设
X
1
,
X
2
,
X
是来自总体
3
N
(
,
2
)的
一
个
样本, 其中 为已知, 2 为未知, 判断下列各式哪
E[Fn (x)] F(x), D[Fn (x)]
n
(3) Fn (x)依概率收敛于F(x).即
的分布律.
解 总体 的分布律为
P{ i} pi (1 p)1i (i 0, 1)
因为 1,2 ,L ,n相互独立, 且与 有相同的分布,
所以 (1,2,L ,n ) 的分布律为
P{1 x1, 2 x2 , L , n xn }
P{1 x1}P{ 2 x2}L P{n xn }
所以 1k ,2k ,L ,nk 独立且与 k 同分布,
故有
E (1k
)
E
(
k 2
)
L
E
(
k n
)
E(
k
)
k
.
再根据第四章辛钦定理知
1
n
n
ik
i 1
Pk
,
k 1, 2, L ;
由第四章关于依概率收敛的序列的性质知
g( A1, A2, , Ak ) P g(1,2, ,k ),
1. 代表性:母体的每一个体有同等机会被选入 子样.
2. 独立性:子样的分样 是相互独立的随机变量.
满足上述两条性质的样本称为简单随机样本.
获得简单随机样本的抽样方法称为简单随机抽 样.
为了使大家对总体和样本有一个明确的 概念,我们给出如下定义:
定义5.1 一个随机变量 或其相应的分布 函数F(x)称为一个总体.
(1,2,L ,n )为来自总体X的样本,则有 :
(1) E ;
(2)
D
1 n
2;
(3)
E(Sn2 )
n1
n
2;
(4) E(Sn*2 ) 2.
证明
n
n
n
(1)
E
E
(
1 n
i )
1 n
Ei
1 n
i 1
i 1
i 1
n
n
n
(2)
n
n
xi
n xi
pi1 (1 p) i1
其中 x1, x2, , xn 在集合{0,1}中取值.
三、统计量
由样本推断总体特征,需要对样本值进行 “加工”,“提炼”.这就需要构造一些样本的 函数,它把样本中所含的信息集中起来.
定义5.3. 统计量
设1,2 ,L ,n 是来自总体 的一个样本, f (1,2 ,L ,n ) 是1,2 ,L ,n 的函数, 若 f 不依 赖于任何未知参数 , 则称 f (1,2 ,L ,n ) 是一
x1, x2,L , xn 是这一样本的观察值.
它反映了总体均值
(1)子样均值
1 n
n
i ;
i 1
的信息
其观察值
1n x n i1 xi .
它反映了总体方差 的信息
(2)子样方差
S
2 n
1 n
n i 1
(i
)2
1 n
n i1
i2
n
2
p(n) ( x)
n
n
x n 1 ,
0,
0 x
其他
4. 经验分布函数
定义5.5
设 1,2 ,L
,
是总体
n
的一个样本,
((1) ,(2) ,L ,(n) ) 是(1,2 ,L ,n ).的次序统计量
( x(1) , x(2) , x(n) )为其观测值, 设x是任一实数,
.
(3) 子样的k 阶(原点)矩
k
1 n
n
ik , k 1, 2, L
i 1
;
(4)子样的 k 阶中心矩
mk
1 n
n
(i )k
i 1
,k
2, 3, L
;
其观察值
bk
1n n i1 ( xi
x)k
,k
2, 3,
.
样本矩具有下列性质:
性质5.1设总体的期望E ,方差D 2,
定义5.2 设是具有分布函数 F (x)的随机变量,
若1,2, L , n 是具有同一分布函数 F (x)、 相互独立的随机变量, 则称 1, 2,L , n 为 从总体 (或总体 F (x)) 中抽取的容量为 n
的简单随机样本, 简称样本.
它们的观察值 x1, x2, L , xn 称为样本值,
如:研究某批灯泡的寿命时,我们关心的数 量指标就是寿命,那么,此总体就可以用随 机变量X表示,或用其分布函数F(x)表示.
总体
寿命 可用一概 F(x) 率分布来刻划
某批 灯泡的寿命
因此, 在统计学中,总体这 个概念的要旨是:
总体就是一个概率分布.
有限总体和无限总体
实例 某工厂10月份生产的灯泡寿命所组成的 总体中, 个体的总数就是10月份生产的灯泡数, 这是一个有限总体; 而该工厂生产的所有灯泡寿 命所组成的总体可近似地看成一个无限总体, 它 包括以往生产和今后生产的灯泡寿命.