生物统计学-第四章抽样分布
t
y
s
,具有n -1的自由度
n 其中,s 称为样本标准差。t分布只有一个参数。
n
16
标准差未知时的平均数分布
自由度(df):
自由度是指独立观测值的个数,在计算s时所使用的n个观测值受到平均 值的约束,这就等于有一个观测值不能独立取值,因此自由度df=n-1。
fdf (t)
df 1 2
df(πf df
2 1
22
n1 n2
1 2 ( y1 y 2)
( y1 y 2)
2 1
22
n1 n2
23
如果两个总体都是正态分布,则有
标准化
N (1
2
,
(12
n1
2 2
n2
))
u ( y1 y2) (1 2 )
2 1
2 2
n1
n2
24
二、标准差未知时,两个平均数的 和与差的分布
t (df1df2 ) t (n1 n2 2)
9
在统计上,如果所有可能样本的某一统计
数等于总体的相应参数,则称该统计数为
总体_ 相应参数的无偏估计值(unbiased estyimate)
13
1、 是μ的无偏估计值。
2、s2是σ2的无偏估计值。 3、以n为除数的样本方差
估计值。
4、s不是σ的无偏估计值。
不是σ2的无偏
14
标准差已知时的平均数分布
生物统计学
西安电子科技大学 生命科学技术学院
刘鹏
1
第四章抽样分布
2
抽样分布
研究总体与从中抽取的样本之间的关系是 统计学的中心内容。
生物统计学的最基本问题是研究总体和样本 间的关系。
总体类型: (1)实际研究对象所构成的总体 (2)数字的总体
3
抽样分布
对这种关系(总体与样本)的研究可从两方面着 手: 一是从总体到样本,这就是研究抽样分布的问题; 二是从样本到总体,这就是统计推断问题。
2
62
6
4
64
6
6
总和
66
∑(y)
4 6 8 6 8 10 8 10 12 72
_
y
s02
s2
s
2
0
0 0.0000
3
1
2 1.4142
4
4
8 2.8284
3
1
2 1.4142
4
0
0 0.0000
5
1
2 1.4142
4
4
8 2.8284
5
1
2 1.4142
6
0
0 0.0000
36
12
24 11.3136
统计推断是以总体分布和样本抽样分布的理论关 系为基础的。
4
总体
随机样本1
……
2
3
4
无穷多个样本
总体和样本的关系示意图
5
抽样分布
从样本
到总体
总体与 样本间 的关系
从总体 到样本
统计推
断(目的)
抽样分 布(基础)
本章研究的内容就是:从总体到样本(抽样分布)
6
抽样分布
抽样分布全部建立在正态分布的基础之上(在正 态分布的总体中抽样)。
每个样本可以计算一个平均数,这样就得到许多 平均数,如果将这些平均数集合起来便构成一个 新总体。由于每次随机抽样所得的平均数可能会 存在差异,所以由平均数构成的新总体也应该有 其分布,这种分布称为平均数的抽样分布。
9
下面用一个抽样实验进一步说明样本平均数的抽 样分布及其分布的参数。
假定用一个很小的总体N=3,其观察值为2、4、6 以样本容量n=2从中进行抽样。
29
例题
例3:已知男生智商平均数为100,方差 为64,女生智商平均为102,方差为49. 现随机抽取25男生和16名女生进行智力 测验,问两个样本平均数之差(男生-女 生)介于1~3之间的概率是多少?
30
例题
例4:某次试验欲采购一批药品,已知 两个公司的产品的使用寿命分别为1270 小时和1260小时,样本方差分别为802和 942,现从该两个公司的产品中各自抽 取50个样本进行寿命检验。假设两者之 间没有显著性差别。那么,两公司的样 本平均数使用寿命之差(第一个公司-第 二个公司)服从怎么样的分布呢?
( y1 y2) (1 2 )
df1s12 df2s22 ( 1 1 ) df1 df2 df1 11 df2 1
( y1 y2) (1 2 )
(n1 1)s12 (n2 1)s22 ( 1 1 ) (n1 1) (n2 1) n1 n2
25
三、两个样本方差比的分布
s12
2
1
F df1,df2
2
这个变量就是服从n-1个自由度的卡方分布(χ2 – distribution)。
19
其密度函数为:
f
( 2 )
df 2 2
1 ( df
)
df
y2
1 2
e2
,
2
y0
0
其他.
2 (n)分布的概率密度曲线如图.
20
对于给定的正数 , 0 1, 称满足条件
P{ 2 2 (n)}
1
t2 df
df 1
2 ,
2
t
17
1. 具有自由度为n的t分布t ~ t(df ), 其数学期望
与方差为:E(t) 0, D(t) df (df 2)
(n 2)
2. t分布的密度函数关于t 0对称.当n充分大时, 其图形近似于标准正态分布概率密度的图形,
再 由函数的性质有
从两个正态总体中抽取样本: 两个平均数的和与差,与正态分布、t分布 有关。 两个样本方差比的分布,与F分布有关。
36
f ( y)dy
2 ( n)
的点
2
(n)
为
2 (n)
分布的上
分位点.
对于不同的 , n,
可以通过查表求
得上 分位点的值.
如何查表,附表6.
21
§4·2 从两个正态总体分 布中抽取的样本统计量的
分布
22
一、标准差已知时,两个平均数的 和与差的分布
1 2 ( y1 y 2)
( y1 y 2)
2
s2
22
f df1 ,df2
(F)
(
df1 df2
df1
)2
( df1 df2 ) 2
( df1 )( df2 ) 22
F ( df1 1) 2
(1
df1
( df1 df2 )
F) 2
df2
,
F
0
0, F 0
26
F分布的平局数和方差分别为:
F
df2 df2
2
,df
2
2
2 F
2df22 (df1 df2 df1(df2 2)2 (df
Y ~ N(, 2 )
n
u
y
n
变量是正态的或近似正态的,则标准化的变量服从或 近似服从N(0,1)分布。如果整体是非正态分布,当n 足够大的时,其样本平局数还是服从正态分布。
15
标准差未知时的平均数分布
未知时,可以用样本标准差变量不服从正态分布,而服从n -1的t分布
2) 2 4)
,df
2
4
F分布的概率密度曲线图
如何查表,附表7.
27
例题
例1:某类药物产品的有效性服从正态 分布,其总体平均数为100,总体标准差 为5.现从该总体中抽取一个容量为25的 简单随机样本,求这一样本的样本平均 数介于99~101的概率。
28
例题
例2:某次测量老鼠的体重,其服从正 态分布,其总体平均数为100,样本标准 差为4。现从该总体中抽取一个容量为16 的简单随机样本,求问其样本平均数服 从怎么样的分布。如果样本容量是64呢? 如果样本容量是64,样本平均数大于102 的概率有多大?
首先计算出总体参数:
μ=(2+4+6)/3=4 σ2=〔(2-4)2+(4-4)2+(6-4)2〕/3=8/3
所有可能的样本数=Nn=32=9
10
总体N=3,样本容量n=2时所有样本的总和数、平均数和方差表
第一个 第二个 样本
观察值 观察值
2
2
22
2
4
24
2
6
26
4
2
42
4
4
44
4
6
46
6
平均数的抽样分布对总体正态性的要求不十分严 格。
(根据中心极限定理,从非正态分布的总体中抽取 的含量为n的样本,当n充分大时,样本平均数渐 近服从正态分布)
方差的抽样分布对总体正态性的要求十分严格。
7
§4·1 从一个正态总体分 布中抽取的样本统计量的
分布
8
一、样本平均数的抽样及其分布
如果从容量为N的有限总体抽样,若每次抽取容 量为n的样本,那么一共可以得到Nn个样本。
31
例题
例6:某实验室让一组10人用第一种工艺 进行试验,方差为25;让另一组10人用 第二种工艺进行试验,方差为144。现假 定工作时间服从正态分布,两个总体平 均数相等,两总体方差有显著性差别。 问;两种工艺平均数用时之差服从怎样 的分布呢?
32
总结
从一个正态总体中抽取样本: 样本平均数的分布与正态分布、t分布有关。 样本方差的分布与卡方分布有关。
11
从表中我们可以算出 样本平均数 的平均数:
_
_
y
N