当前位置:文档之家› 随机抽样及抽样分布

随机抽样及抽样分布


《医药数理统计方法》
§4.1
2、抽样 在一个总体X中抽取n个个体X1,X2,…,Xn,
称为抽样; 这n个个体称为总体X的一个样本; n称为样本容量; 随机变量X1,X2,…,Xn的具体观察值
x1,x2,…,xn称为样本观察值,简称样本值。
《医药数理统计方法》
§4.1
3、(简单随机)样本 样本X1,X2,…,Xn相互独立且与总体有相同
随机抽样及抽样分布
《医药数理统计方法》
§4.1
§4.1 抽样的基本概念和方法
一、总体与个体 二、样本 三、统计量
《医药数理统计方法》
§4.1
二、样本
1、了解总 体
全面的观察统计 抽取部分观察统计
对总体X进行n次观察 第一轮 x1 ,x2 ,…,xn 第二轮 x21,x22,…,x2n ……
每一轮的第一次观察值,看成 X1 的一次取值
注:样本X1,X2,…,Xn是随机变量,而统计量 是随机变量的函数,因此统计量是一个随机 变量。
《医药数理统计方法》
§4.1
2、样本均数
1n X n i1 X i
1n
1n
E (X ) E (ni 1X i)ni 1E (X i) E (X )
1n
1n
1
V (X ) V (ni 1X i) n 2i 1 V (X i) n V (X )
《医药数理统计方法》
§4.3
3)查表 ① n≤30,查P277附表7
P(T t)
2
② n>30,利用公式
t u
2
2
《医药数理统计方法》
§4.3
2、Th4.7 设X1,X2,…,Xn是正态总体N(μ,σ2)的一个样
本,则
X
S

~
t(n
1)
n
《医药数理统计方法》
§4.3
3、Th4.8 设X1,X2,…,Xn1和Y1,Y2,…,Yn2分别为取自正态
n 1
n
1 2)
n
2
《医药数理统计方法》
§4.2
§4.2 样本分布图
连续型随机变量的概率密度或分布函数全面刻 画了总体的分布规律,我们用样本推断总体的 理论依据:
1、样本容量n越大且组距充分小时,样本的 频率分布密度越接近于总体的概率密度函数。 (P86)
2、样本容量n充分大时(n>50),样本的分布 函数近似等于总体的分布函数。(P88)
n i1
Xi2
n(X)2]
《医药数理统计方法》
§4.1
2) E(S2)=σ2 (P97例5.1)
设总体均数μ 总体方差σ2
E(S 2 )

E[ 1 n 1
n i1
(Xi

X
)2 ]

n
1
1
E{
n i1
[(
X
i

)
(X

)]2 }

1
n
E[
n 1 i1
②α 较大时,利用公式
1 F1(n1,n2)F(n2,n1)
《医药数理统计方法》
§4.3
3)X~2(n1),Y~2(n2),且X与Y相互独立,则
X n1 Y n2
F(n1,n2)
P(Y Xnn21F1(n1,n2))
P(Xn1 1 )
Yn2 F(n2,n1)
Y n2 X n1
《医药数理统计方法》
§4.3
2、Th4.4 设 2~2(n),则E(2)=n,V(2)=2n
3、Th4.6 设X1,X2,…,Xn是正态总体N(μ,σ2)的一个样本,

(1)
(n 1)S2
2
~
2(n 1)
(2) X 与S2 相互独立
《医药数理统计方法》
§4.3
三、t分布 1、定义 设随机变量X~N(0,1),Y~2(n), 且X与Y相互独立,则称随机变量
的分布函数,这样的样本称为简单随机样本, 简称样本。
注:1)特性:随机性、独立性、代表性; 2)在实际问题中,总体个数N较大,抽
取的样本容量n较小时,可近似地认为放 回与否不影响抽样的独立性,而采用无放 回抽样,减少工作量。
《医药数理统计方法》
§4.1
三、统计量 1、定义 设X1,X2,…,Xn为总体X的一个样本, g(X1,X2,…,Xn)是一个连续函数,且g中不包 含任何未知参数,则称g为一个统计量。
《医药数理统计方法》
§4.3
注:1)F(n1,n2)分布的概率密度为
(n1n2) 2
(n1)(n1
x)n211(1n1
x)n12n2,x0
f(x) (n1)(n2) n2 n2
n2
22
0
,x0
《医药数理统计方法》
§4.3
2)查表 ①α 较小时,查P278附表8
P (FF )
《医药数理统计方法》
§4.1
3、样本方差 S2 n11in1(Xi X)2
注:1)简算公式
S2

1 n1
n i1
(Xi
X)2

1 n1
n i1
[Xi2
2Xi
X
(X)2]

1[ n1
n i1
Xi2
2X
n i1
Xi

n i1
(X)2]

1[ n1
F(n2,n1)
P(Yn2 Xn1
F(n2,n1))
F分布的左侧小概率 ,可以转化为另一个分布的右侧小概率
《医药数理统计方法》
§4.3
2、Th4.9 设X1,X2,…,Xn1和Y1,Y2,…,Yn2分别为取自正态
总体 N(1,12) 和 N(2,22)的样本,且它们 相互独立,则有
《医药数理统计方法》
§4.3
§4.3 抽样分布
一、 X 的分布 二、 分2 布 三、t分布 四、F分布
《医药数理统计方法》
§4.3
一、X 的分布
1、正态随机变量的性质 1)随机变量X~N(μ,σ2)的线性函数
Y=aX+b仍服从正态分布,且 Y~N(aμ+b,a2σ2),
这里a,b均为常数,且a0。
2 X 1 2 X 2 2 X n 2
服从自由度为n的2分布,记作 2~2(n)。
《医药数理统计方法》
§4.3
注:1)自由度(degree of freedom)--统计量 中独立变量的个数,记为df。
2)定义中的n可取1,即 X~N(0,1),则X2~2(1)
3)2(n)分布的概率密度为
i1
i1
这里ci是不全为零的常数。
《医药数理统计方法》
§4.3
2、Th4.3 设X1,X2,…,Xn是正态总体N(μ,σ2)的一个样本,

X ~ N(, 2 )
n
从而
X

~
N (0,1)
n
《医药数理统计方法》
§4.3
二、 2 分布 1、定义 设相互独立随机变量 X1,X2,…,Xn, 均服从标准正态分布N(0,1),则称
总体 N(1,2) 和 N(2,2)的样本,且它们相 互独立,则有
(XY)(12)
S
11 n1 n2
~t
(n1
n2
2)
其中
S
(n11)S12(n21)S22 n1n22
《医药数理统计方法》
§4.3
四、F分布 1、定义 设随机变量 X~2(n1),Y~2(n2), 且X 与Y相互独立,则称随机变量 F X n1 Y n2 服从自由度为n1,n2的F分布, 记作 F~F(n1,n2)。
S12 S22
2 1
2 2
~F(n11,n21)
《医药数理统计方法》
、个体、样本、统计量等) 2.样本推断总体的理论依据 (连续型-样本频率分布密度,样本分 布函数) 3.抽样分布
X的分布,χ2分布,t分布,F分布
t X Y n
服从自由度为n的t分布,记作 t~t(n)。
《医药数理统计方法》
§4.3
注:1)t(n)分布的概率密度为
f(x ) (n 2 1 )(1 x2) n 2 1, ( x ) n (n 2) n
2)当n→∞时,t分布的极限分布为标 准正态分布。
注:E(Y)=E(aX+b)= aE(X)+b=aμ+b V(Y)=V(aX+b)= a2V(X)=a2σ2
《医药数理统计方法》
§4.3
2) n个相互独立的随机变量
Xi~N(μi,σi2),(i=1,2,…,n)的线性组合
n
X ci X i 仍然服从分态分布,且
i 1
n
n
X~N( cii, ci2i2)
f
(x)

n 22
1 (n2)
x e n21 2x
,
x

0

0
,x0
其中Gamma函数 (s) xs 1exdx,(s0) 0
《医药数理统计方法》
§4.3
4)查表 ① n≤30,查P276附表6
P(2 2)
② n>30,利用公式
2(n)1 2(u 2n1)2
(Xi
)2
2(X
n
)
i1
(Xi
)
n
(X
i1
)2]

1 n 1
E[
n i1
(Xi

)2

n(X

)2 ]
相关主题