当前位置:
文档之家› 卡方拟合优度检验的原理与计算步骤
卡方拟合优度检验的原理与计算步骤
解:如果家庭成员之间的发病与否(X)互 不影响,则X符合二项分布(两种互斥结果 、试验条件不变、各次试验独立)。也就 表明疾病不具有家族聚集性。
2020/12/8
表 7.2 二项分布的拟合优度χ2 检验计算表
每户发 观察 理论概率 理论
χ2 分量
累计χ2 值
病人数 家庭数
家庭数
(1)
(2)
(3)
(4)
133.4 151.1 68.9 119.0 81.2 84.5 76.9 87.6 93.6 88.2 86.6 87.6 88.6 99.5 104.2
100.0 104.9 103.2 114.1 107.8 113.4 108.4 113.7 113.9 112.5 121.7 123.6 108.0 103.9 95.0
0.5 0.4 0.3 0.2 0.1 0.0
0
f
( 2)
1
2( / 2)
2
2
( / 21)
e2 / 2
自由度=1 自由度=2 自由度=3 自由度=6 P=0.05的临界值
3 3.84 6 7.81 9
1122.59 15
18
卡方值
2020/12/8
卡方分布下的检验水准及其临界值
2020/12/8
131.9 75.3 73.0 121.9 83.3 79.9 85. 88.6 89.1 93.6 94.6 93.3 86.9 98.6 104.3
98.2 95.0 99.8 111.4 108.5 108.6 105.9 109.3 113.2 113.1 115.9 124.7 109.6 99.1 101.4
总体分布的拟合优度检验 Goodness of Fit Test
for Distribution of Population
2020/12/8
为什么要知道总体分布?
1. 参数统计学推断方法(如t检验、F检验)均以 服从某一分布(如正态分布)为假定条件。
2. 实际工作中需要了解样本观察频数(Observed frequency,简记为O)是否与某一理论频数( Expected frequency,简记为E)相符。
α=0.05
理论概率 P( x) x e
x!
fx 0 103 1143 7 1 586 1.41889
n
413
413
2020/12/8
P(7)=0.000556
卡方分量
表 7.3 Poisson 分布的拟合优度χ2 检验计算表
方格内 细胞数
(X) (1)
0 1 2 3 4 5 6 7 合计
1.26461
2.16478
P(2) 2 e 1.418892 0.24198 0.24359, P(7) 1 P(x 6) 0.00067
2!
2
理论细胞计数为 0 的方格数应等于 0.24198×413=99.939,…。
因细胞计数为 5、6、7 的三组,理论频数均小于 5,故将这三组数据合并
0.77500 1.37894 9.5760 0.25938 1.63832
=7-1-2=4,
2 0.05,4
9.49 ,在α=0.05
的水准不拒绝
Ho,故认为
IQ
得分服从正态分布
Z X X 55 101.294 2.97048 S 15.5847121
2020/12/8
拟合优度卡方检验的问题
Oi Ei
(5) 3.061 1.198 2.601 5.580 1.122
2.799
Oi Ei 2
(6) 09.3697 01.4352 06.7652 31.1364 01.2589
07.8344
Oi Ei 2 Ei
(7) 0.09375 0.01012 0.06723 0.65446 0.07462
2020/12/8
本章介绍的拟合优度检验方法 1. 卡方检验
2. 正态性检验的W法(Shapiro-wilk法)、D法( Kolmogorov-Smirnov法)
2020/12/8
第一节 卡方拟合优度检验 的原理与计算步骤
1. 原理
判断样本观察频数(Observed frequency) 与理论(期望)频数(Expected frequency )之差
实际 方格数 (Oi)
(2)
103 143
98 42 18
6 2 1 413
理论概率 (Pi) (3)
0.24198 0.34335 0.24359 0.11521 0.04087 0.01160 0.00274 0.00067
理论 方格数 (Ei)
(4)
099.939 141.802 100.601 047.580 016.878 004.790 001.133 6.201 000.278
解:H0:IQ 得分服从正态分布,H1:不服从正态,α=0.05, X 101.294 S =15.585
2020/12/8
表 7.3 正态分布拟合优度χ2 检验的计算表
实际观 IQ 得分组限 测频数
标准化 组限
累计概率 概 率 理论频数
(1)
55.0 ~ 65.0 ~ 75.0 ~ 85.0 ~ 95.0 ~
39
-0.40386 0.34316~ 0.25082 37.6230
105.0~
36
0.23780 0.59398~ 0.21644 32.4660
Oi Ei 2 Oi Ei 2
Ei
Ei
(7)
(8)
0.06261 0.06261
0.00648 0.06909 0.09977 0.16886 0.05040 0.21926 0.38468 0.60394
125.9 143.8 66.1 118.5 84.0 83.9 77.6 90.9 86.6 85.5 92.6 93.7 102.0 98.0 99.4
99.3 116.7 111.8 112.3 113.2 112.8 113.2 110.8 118.6 122.5 92.3 95.8 104.1 57.5 104.1
自由度=6-1-1=4。
2 0.05,4
9.49 ,本例 P
〉0.05,表示服从 Poisson 分布。
2020/12/8
其他离散型变量分布的拟合优度检验
1. 二项分布 2. Poisson分布 3. 超几何分布 4. 负二项分布
可仿照上述二项分布、Poisson分 布的方法进行分布的拟合优度检验。
查 附表9 W(8,0.05) 0.818 ,W≤W(n,a)时,P≤0.05; W≥W(n,a)时,P≥0.05, 本例W>W(8,0.05),则P >0.05,不能拒绝H0,认为FDP活性服从正态分布。
2020/12/8
三、采用Kolmogorov-Smirnov法进行正态性检验
(5)
(6)
0
112 0.6360 95.4084
2.885
2.885
1
20 0.3106 46.5948
15.179 18.065
2
11 0.0505
7.5852
3
7 0.0027
0.4116 7.996 12.513 30.578
150
8
H0:该病分布服从二项分布,H1:不服从二项分布
α=0.05
第二节 离散型随机变量分布的 拟合优度检验
一、二项分布的拟合优度检验 二、Poisson分布的拟合优度检验
2020/12/8
一、二项分布的拟合优度检验
【例7.4】某研究人员在某地随机抽查了150 户3口之家,结果全家无某疾病有112户,家 庭中1人患病的有20户,2人患病的有11户, 3人全患病有7户,问该病在该地是否有家族 聚集性。
Oi
Zi
Ei
(2)
(3)
(4)
(5)
(6)=150*(5)
1
-2.97048~ 0.00149~ 0.00844 1.2660
5
-2.32882 0.00993~ 0.03586 5.3790 6.6450
15
-1.68717 0.04579~ 0.10210 15.3150
31
-1.04551 0.14789~ 0.19527 29.2905
137.1 78.6 74.1 123.7 83.9 78.9 89.6 93.6 87.6 90.1 87.3 89.6 103.2 95.8 96.8
97.4 97.7 103.2 109.5 115.7 120.1 115.7 108.2 113.1 114.1 99.8 101.4 104.1 99.0 102.3
115.0~
15
125.0~
4
135.0~
3
145.0~155 1
0.87945 1.52111 2.16276 2.80441~ 3.44607
0.81042~ 0.93588~ 0.98472~ 0.99748~ 0.99972
0.12546 0.04884 0.01276 0.00224
18.8190 7.3260 1.9140 0.3360
2020/12/8
【例7.6】用小鼠研究正常肝核糖核酸(RNA)对癌 细胞的生物学作用,测定水层RNA诱导肝癌细胞 的果糖二磷酸酯酶(FDP)活性的结果如下,请分 析FDP活性是否服从正态分布?
Obs 1
2
3
4
5
6
7
8
x 3.83 3.16 4.70 3.97 .03 2.87 3.65 5.09
(4) 2.03 2.87 3.16 3.65