正态性检验和方差齐性检验计算均数、方差、标准差、变异系数、进行t检验、u检验的先决条件有两个:一是总体呈正态分布,二是两组数据所来自的总体方差齐。
如何断定一个样本来自于正态总体呢?这要进行正态性检验。
最常用的方法有两种:一是矩法检验,二是P-P图和Q-Q图,三是正态性D检验或W检验。
正态性检验
1.矩法
2.P-P图/Q-Q图
PP图和QQ图原理一样,都是用图形来大致检测数据是否服从某种分布的。
以PP图为例,横坐标是某检验分布的概率值,纵坐标是观测数据的经验分布的概率值(谁作横坐标谁作纵坐标无所谓)。
如果数据服从检验分布,那么图形画出来应该是一条直线(对角线);至于QQ图,只不过把概率换成了分位点而已。
红细胞数组中值频数累计频数累计频率概率单位420- 430 2 2 1.4 2.8 440- 450 4 6 4.2 3.27 460- 470 7 13 9.0 3.66 480- 490 16 29 20.1 4.16 500- 510 20 49 34.0 4.59 520- 530 25 74 51.4 5.04 540- 550 24 98 68.1 5.47 560- 570 22 120 83.3 5.97 580- 590 16 136 94.4 6.59 600- 610 2 138 95.8 6.73 620- 630 5 143 99.3 7.46 640-660 650 1 144 100.0
8
7
6
5
4
3
2
400500600700
3.正态性D 检验 正态性W 检验
Shapiro-Wilk 即正态性W 检验统计量。
Kolmogorov-Smirnov test 的原理是寻找最大距离(Distance ), 所以常称为D 法。
当N≤2000时正态性检验用Shapiro-Wilk 统计量,N>2000时用Kolmogorov D 统计量。
∑∑-+-=n
x x n x n i D i
/)(]2/)1([2
4
W=[∑a in (X a-i+1-X i )]2 /∑(X -X )2
方差齐性检验
2
2
21S S F =
111-=n ν 122-=n ν。