当前位置：文档之家› 非参数统计讲义六--多个样本的检验

非参数统计讲义六--多个样本的检验

a,b Test S tatistics
Ra nks X G 1.00 2.00 3.00 To tal N 6 6 6 18 Mean Rank 15.00 9.33 4.17
Ch i-Squa re df Asymp. S ig.
X 12.36 3 2 .002
a. Kruska l Wallis Test b. Grouping Variab le: G
b Tests of Normality
X
Ko lmogorov-Smirnov Statistic df Si g. .182 6 .200* a. Lillie fors Significance Correction b. G = 1.00
a
Statistic .964
Sh apiro-Wil k df 6
9D 存活日数 2 2 2 3 4 4 4 5 7 7 Ri ni
i
11C 秩 2 2 2 4.5 7 7 7 10.5 21 21 84 10 8.40 存活日数 5 5 6 6 6 7 8 10 12 秩 10.5 10.5 15.5 15.5 15.5 21 24 26.5 30
R
— — —
169 9 18.78
组间平方和 H 全体样本的秩方差
n(n 1) 全体样本的秩方差＝ 12
为做出精确的判断，我们计算K-W统计量H，以反映平均秩间的差异。
k 12 H＝ ni ( Ri R ) 2 N N +1 i 1 （）
R 12 n 3( N 1) N ( N 1) i 1 i
H c H / C 8.9163 / 0.9925 8.9839
P=CHIDIST(8.9839,2)＝ 0.011199
EXCEL函数可知道，自由度为卡方分布，在显著水平下0.05，分布的上尾临界值为5.99，由于8.98>5.99，所以拒绝原假设。因此秩和最低的B组至少与秩和最高的A组是不同的。 xx=CHIINV(0.05,2)=5.99
5 6 7
95 90 80
40 35
90 70 75
25
70
1
1 1 1
检验假设 H0：三所大学的学生成绩相等 H1：并非三所大学的学生成绩都相等
60 85
95
90 80 60 20 30 15 40 35
1
1 1 2 2 2 2 2 2
50
70 60 80 90 70 75
3
3 3 3 3 3 3
N 1.00 2.00 3.00 To tal 6 6 6 18
Mean St d. Deviatio n St d. Error 51.83 33 10.18 659 4.158 66 34.83 33 8.109 67 3.310 76 21.83 33 6.145 46 2.508 87 36.16 67 14.85 716 3.501 87
X G
45 38 56 1 1 1
60
47 65 30
1
1 1 2
40
28 44 25
2
2 2 2
42
22 19 15 31 27
2
3 3 3 3 3
软件一软件二软件三 45 30 22 38 40 19 56 28 15 60 44 31 47 25 27 65 42 17

Si g. .851
*. Th is is a lower bound of the true significa nce .
b Tests of Normality
X
Ko lmogorov-Smirnov Statistic df Si g. .238 6 .200* a. Lillie fors Significance Correction b. G = 2.00
雇员
1
大学A
25
统一编秩
3
大学B
60
统一编秩
9
大学C
50
统一编秩
7
2 3
4 5 6
70 60
85 95 90
12 9
17 20 18.5
20 30
15 40 35
2 4
1 6 5
70 60
80 90 70
12 9
15.5 18.5 12
7
秩和
80
组A秩和
15.5
95 组B秩和 27
75
组C秩和
Minim um 38.00 25.00 15.00 15.00
Maximum 65.00 44.00 31.00 65.00
分组数据的正态性检验
SORT CASES BY G . SPLIT FILE SEPARATE BY G . EXAMINE VARIABLES=X /PLOT BOXPLOT STEMLEAF NPPLOT /COMPARE GROUP /STATISTICS DESCRIPTIVES /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.
14
88
12 (95) (27 ) (88) H 3(20 1) 8.9163 20(21) 7 6 7
2 2 2
计算校正系数C
(33 3 33 3 2 3 2 2 3 2) C 1 0.9925 3 20 20
例1：某制造商雇用了来自三个本地大学的雇员作
为管理人员。最近，公司的人事部门已经收集信息并考核了年度工作成绩。从三个大学来的雇员中随机地抽取了三个独立样本，见表所示。制造商想知道是否来自这三个不同的大学的雇员在管理岗位上的表现有所不同。
雇员 1 2 3 4 大学A 25 70 60 85 大学B 60 20 30 15 大学C 50 70 60 80
检验是否几个独立样本来自相同总体（Tests whether several independent samples are from the same population.）零假设：样本来自的多个独立总体的分布无显著差异。
方差分析过程关注三个或更多总体的均值是否相等的问题，数据是被假设成具有正态分布和相等的方差，此时F检验才能奏效。 F检验对正数据的正态性非常敏感。当采集的数据常常不能满足正态的条件时需要用非参数统计。
k
2 i
给出显著性水平，若K-W统计量H的显著性小于该显著性水平，则拒绝零假设，认为样本来自的多个独立总体的分布存在显著性差异。近似服从df=K-1的卡方分布
每组样本小于5时为小样本，查表大于等于≥5时为大样本。近似卡方分布
例：某公司需要购买一套文字软件，有三个产品，选择18个员工分成三组学习，比较三个软件学习时间最短。
a
Sh apiro-Wil k Statistic df .882 6
Si g. .278
*. Th is is a lower bound of the true significa nce .
b Tests of Normality
X
Ko lmogorov-Smirnov Statistic df Si g. .178 6 .200* a. Lillie fors Significance Correction b. G = 3.00
K个样本检验
K个独立样本检验
K个相关样本检验
一、多个独立样本检验
概述：多样本检验推断样本来自的多个独立总体的分布是否存在显著性差异。其方法是：通过检验样本的均值或中位数是否存在显著性差异，以推断样本来自的多个独立总体的分布是否存在显著性差异。多样本检验提供了常用的三种检验方法:克拉夏尔-瓦里斯检验法（Kruskal-wallis H）、JonchheereTerpstra和中位数(Median)检验法。
DSC1 存活日数秩 3 4.5 5 10.5 6 15.5 6 15.5 6 15.5 7 21 7 21 9 25 10 26.5 11 28.5 11 28.5 212 — 11 — — 19.27
克拉夏尔-瓦里斯检验法
基本思想：如果样本来自的总体分布相同，每个独立样本应均匀地分布于在该总体之中。我们可以将这些独立样本混合按升序排序，求出每个观察值的秩，然后对多组样本的秩求平均数，每组的平均秩应大致相同。
因为秩统计量的分布与总体分布无关，可以摆脱总体分布的束缚。
将数据样本转换成秩样本后，再对这个秩样本进行方差分析。
Kruskal-Wallis检验
K-W法将多个样本数混合并按升序排序, 求出其秩对多个样本的秩分别求平均秩序如果各样本的平均秩大致相等,则认为多个总体分布无显著差异
有结点（tie)需修正！
表 8–9 三种药物杀灭钉螺的死亡率%比较
甲死亡率
32.5 35.5 40.5 46.0 49.0 Ri ni
药秩
10 11 13 14 15 63 5 16.0 20.5 22.5 29.0 36.0 — —
乙死亡率
药秩
4 6 7 9 12 38 5
丙死亡率
6.5 9.0 12.5 18.0 24.0 — —
药秩
1 2 3 5 8 19 5
表 8–10 小白鼠接种三种不同菌型伤寒杆菌的存活日数比较
proc print data=rankings; run;

proc npar1way data=tj08; class g; var x; run;
H0:三种软件学习时间相等
H1：并非所有软件学习时间都相同
NPAR TESTS /K-W=X BY G(1 3) /MISSING ANALYSIS.

e商务文档

非参数统计讲义六--多个样本的检验

相关文档推荐：