第9章.卡方检验
理论 实际 比率 比率
r:s
a:b
2 (ra sb)2
rs(a b)
捷算公式
自由度
2
(a b)2 (a b)
(当r : s
1:1时)
2-1=1
r:s:t a:b:c
2 (r s t)(sta2 rtb2 rsc 2 )
rst(a b c) (a b c)
2)数学模型的拟合:
例:青虫菌液对菜青虫防治效果试验,观察喷药后天数与死亡的菜 青虫个数的关系:
喷药后天数(t) 1 2 3 4 5 6 7 8 9 10 11
菜青虫头数(y) 28 32 40 48 57 68 81 98 191 142 116
理论值
28.6 34.1 40.7 48.6 57.9 69.1 82.4 98.4 117.3 139.9 167.0
差异性检验,其作用与t-检验、F-检验 等相似。
9.2 2 -分布
2 -分布由Helmert(1875)发表,Karl
Pearson(1898)重新发现。
2 的定义:标准正态分布中那些相互独立
的随机变量的平方和。
n
N(, 2)
n
n
_
_
( x x)2
(x x)2
2
2
0.05 0.01
[3] 2 的计算:
1)基本公式
2
(n
1)S 2
2
2-检验的初衷是检验样本方差与总体方差是否有差异。
例:某厂生产的某种细纱支数的标准差为1.2,从某日生产 的一批产品中,随机抽16缕进行支数测量,求得标准差为 2.1,设细纱支数服从正态分布,问细纱的均匀度有无显 著变化(α=0.05)?
y 23.9691.193t
y 200
150
100
50
0
0
5
10
t 15
3)理论比率模型的检验
例如在华南农大的学生中抽取100名,其中 男生60名,是否符合1:1这个理论比率模 型?
[2]独立性检验:一种列联表检验方法。通 过求取理论频数,然后由实际频数与理论
频数求取 2 值,进行两组或多组数据的
第九章 2 --检验
9.1 问题的提出
9.2 2 -分布 9.3 2-检验
9.4 适合性检验 9.5 独立性检验
9.6 Yates’ 2值的连续性校正
9.1 问题的提出
2 -检验是把统计量
2
-分布的知识运用
于离散型随机变量(次数资料)的一项分析
方法
[1]适合性检验
1)概率分布的理论拟合:如第4章章中的实际 频数配合二项分布、Poisson分布、正态分 布理论频数的拟合。
2
_
(n
1)S 2
2
, (因:
S
2
(x x)2 )
n 1
x1 x2 xn
zi
xi
, zi2
( xi )2 ,,
2
zi2
( xi )2
统计量 2的定义
_
以 x 估计
2
(n
1)S
2
2
2 2 -分布的概率密度函数和累积分布函数:
f (2)
e k 1 22
2 2
2
k 2
(
k
)
,(0
2
)
2
F ( 2 )
P( 2)
2
n 2
(
1 n
1)!
j
(
2
)
(
n 2
1)
2
e 2
d 2
2
2 -分布的形状
0.6 df 2
0.5
df 3
0.4
0.3
df 4
0.2
df 5
3-1=2
r:s: a:b: t:u c:d
2 (r s t u)(stua2 rtub2 rtuc2 rstd 2 )
rstu(a b c d) (a b c d)
[1]理论比率模型检验(外因模型)
H 0 : Oi Ei
2
(Oi Ei )2 Ei
df k 1
k : 属性的个数
例:在华南农大的学生中抽取100名,其中男生60名, 是否符合1:1这个理论比率模型?
解:H0 : Oi Ei
尽管df 1,但由于n 100,所以不用连续性校正
2
(Oi Ei )2 (60 50)2 (40 50)2 4
Ei
50
50
2 0.05
(df
1) 3.841, 2
2 0.05
,
学生不符合
Oi Ei 60 50 40 50
1:1的理论比率模型(P 0.05)
例:P138-139例9.2
常见比率模型及 2 值捷算公式
0.1
0
0
5
10
15
9.3 2 -检验
[1]原假设H0视具体情况而定 [2]临介值:(表C3,P223)
p( 2 2 )
2
f ( 2 )d 2
2
2 0.05
: 差异不显著;
2 0.05
2
2 0.01
:
差异显著;
2
2 0.01
: 差异极显著
实际值与理论值之间的偏差的判据,这时:
2
(实际值 理论值)2 理论值
k i 1
(Oi
Ei )2 Ei
当df>1时,上式的 2 值才与 2 -分布较为接近,如df=1, 与 2 -分布相去甚远,需作连续性校正,校正公式为(
yates’ correction for continuity):[n<30时,才需校正]
2 k ( Oi Ei 0.5)2
i 1
Ei
9.4 适合性检验(test of goodness of fit)
2 适合性检验的统计假设
H0 : Oi Ei , H1 : Oi Ei
2 适合性检验有两种类型:外因模型和内因
模型。外因模型的检验是没有总体参数需估计的 情况,其自由度的个数df=k-1。而内因模型至少 有一个参数未知需要估计,其自由度的个数df=k1-j,其中j为总体参数的个数。
H0 : 2 1.22
2 (n 1)S 2 (16 1) 2.12 45.9
2
1.22
2 0.05
(d
f
n
1 15)
ቤተ መጻሕፍቲ ባይዱ
24.996
2
2 0.05
,
否定H
0
,
细纱的均匀度发生了显著的变化(
p
0.05)
2)Pearson(1899)发现, 2 值可作为离散型随机变量的