秩转换的非参数检验
参数检验
参数检验方法:t 检验,方差分析; 总体分布假定:各组样本所来自的总体为 正态分布(已知的分布形式),各组样本所 来自的总体方差齐性。
非参数检验
定义:不依赖于总体的分布类型,对样本 所来自总体的分布不作严格假定的统计推 断方法,称为非参数检验(nonparametric test)。直接对总体分布做假设检验。 又称为任意分布检验(distribution-free test)。
(1) 很低 低 中 偏高 高 合计
(2) 1 8 16 10 4
(3) 2 23 11 4 0
(4) 3 31 27 14 4 79
(5) 1~3 4~34 35~61 62~75 76~79 —
(6) 2 19 48 68.5 77.5 —
39(n1) 40(n2)
1917(T1) 1243(T2)
查T界值表。
(3)确定P值,作出结论
若n1≤10且n2-n1≤10,可通过查阅T界值表
(附表10)确定P值;
若两样本量不满足上述条件,则可采用正
态近似法作u检验,按公式(8-2)计算u值。
正态近似法
| T n 1(N 1)/2 | n 1 n 2(N 1) ( t j t j ) ) (1 3 12 N N
(通常取秩和较小者)。
, 较小例数组的秩和 n 1 n 2 T min(R1 ,R 2 ),n 1 n 2
N n1 n2 n0 min( n1 , n2 )
较小例数组的平均秩和为:
n0(1 N)/2
若H0成立,T值应接近 n0(1 N)/2 ,若T值严重偏离
n0(1 N)/2 ,则提示H0可能是不正确的。小样本时,
n1=10
T1=141.5
(1)建立检验假设,确定检验水准
H0:两组患者RD值总体分布位置相同 H1:肺癌病人RD值高于矽肺0期工人RD值
α=0.05
(2)混合编秩,求统计量T
将两样本数据混合,从小到大排序;
对混合数据进行秩转换,获得每一观察值对应
的秩次;
观察值相等者取平均秩次; 分别计算两样本的秩和; 取样本量较小者为n1,其秩和作为统计量T; 两样本量相等者任取其中一个作为统计量T
总秩和 : TA+TB=12(12+1)/2=78
A组(x) 3, 5, 7, 9 11 (i) 1 2 3 4 5 B组(x) 12 13 (i) 6 7
14 8.5 T=23.5 14 16 20 22 8.5 10 11 12 T=54.5
秩次:在一定程度上反映了原始数据大小(等级)的信息。 秩和:反映了一组数据在分布上的范围位置。 平均秩次:反映一组数据平均水平 A组平均秩次=23.5/6=3.92 B组平均秩次=54.5/6=9.08
参数检验
parametric test 要求:样本来自给定分 布的总体,该总体分布 依赖于若干参数: , 2
非参数检验
Non-parametric test
要求:对总体的分布 类型不作任何要求
统计分析: 参数估计 假设检验:参数
统计分析: 假设检验: 总体的分布位置
注意:如果已知其计量资料满足(或近
3
u
例8-3分析结果
本例n1=10,
n2-n1=2,T=T1=141.5,满足查 T界值表的条件;
查表得单侧0.025<P<0.05;
拒绝H0
,认为肺癌病人的RD值高于矽肺0 期病人的RD值。
2. 等级资料两样本比较
例8-4 吸烟和不吸烟工人HbCO含量比较
含量 吸烟 不吸烟 合计 秩范围 平均秩 秩和 吸烟 不吸烟 (7)=(2)×(6) (8)= (3)×(6) 2 152 768 685 310 4 437 528 274 0
在H0成立(两配对样本差值的总体中位数 为0)的条件下,两配对样本的差值的正负 及其绝对值的相对大小是随机的; 在此情况下,正秩和与负秩和之间应当相 近,差别不会太大; 如果正秩和与负秩和之间相差足够大,则 可认为H0成立的可能性很小,从而加以拒 绝。
1. 配对样本差值的中位数与0比较
配对设计两组处理效应的比较一
非参数检验的应用场合
计量资料: 不满足参数检验的条件,且无适当的变量变 换方法解决此问题时; 分布类型无法获知的小样本计量资料; 一端或两端存在不确定数值(如>1000IU) 的计量资料;
等级资料:比较各组间等级强度的差别。
非参数检验的优缺点:
优点:
适用范围广
对数据要求不严
方法简便、易于理解和掌握
(1)建立检验假设,确定检验水准
H0:两组工人HbCO含量总体分布位置相同
H1:吸烟工人HbCO含量高于不吸烟工人
α=0.05
1.5 3 4 5 6 7 8 9 10 11 64.5
1.5
假设检验过程
与配对资料符号秩检验基本相同。
此处先计算每一测量值与给定的值的差数;
然后对此差数进行秩转换,进行与配对资料符
号秩检验完全相同的操作过程。
此例得T=1.5,量高于当地正
缺点:
损失信息、检验效能低
符合条件 不符合条件 首选参数检验 非参数检验
第一节 配对样本比较的Wilcoxon 符号秩检验
Wilcoxon符号秩检验简介
符号秩检验由Wilcoxon于1945年提出;
应用:
配对样本差值的中位数与0比较; 单个样本中位数与总体中位数(给定值) 的比较。
符号秩检验的基本思想
般采用配对t 检验,如果差数严重
偏离正态分布,可采用Wilcoxon符
号秩检验。
例8-1:两种方法测量12份血清ALT测量结果
编号 (1) 1 2 3 4 5 6 7 8 9 10 11 12 合计 原法 (2) 60 142 195 80 242 220 190 25 198 38 236 95 — 新法 (3) 76 152 243 82 240 220 205 38 243 44 190 100 — 差值d (4)=(3)-(2) 16 10 48 2 -2 0 15 13 45 6 -46 5 —
分布形状相同或类似的两个总体分布位置 比较,可以简化地理解为两总体中位数的 比较。
1. 计量资料两样本比较
例8-3 两类肺病患者RD值比较
肺癌病人 RD值 2.78 3.23 4.20 4.87 5.12 6.21 7.18 8.05 8.56 9.60 秩次 1 2.5 7 14 17 18 19 20 21 22 RD值 3.23 3.50 4.04 4.15 4.28 4.34 4.47 4.64 4.75 4.82 4.95 5.10 n2=12 矽肺0期工人 秩次 2.5 4 5 6 8 9 10 11 12 13 15 16 T2=111.5
相同秩次较多时的校正值:
uc
| T n(n 1) / 4 | 0.5 n(n 1)(2n 1) / 24 (t ti ) / 48
3 i
注意:仍为非参数检验
2.配对设计等级资料的符号秩检验
1. 把等级从弱到强转换成秩,如某指标的检测结果
为-,+,++,+++,可转化为相应的秩次1,2, 3,4; 2. 求各对秩次的差值,省略所有差值为0的对子数, 令余下的有效对子数为n;
—
差值d (4)=(3)-(2) 16 10 48 2 -2 0 15 13 45 6 -46 5
—
正秩 (5) 8 5 11 1.5
7 6 9 4
负秩 (6)
1.5
10 3 54.5 11.5
1.检验假设
H0 : M d 0 H1 : M d 0;
2.编秩号
(1)剔去差数为 0 的数据; (2)余下的 n 个差数按绝对值自小至大排秩号,但排好后秩号 要保持原差数的正负号; (3)差数绝对值相等时,要以平均秩号表示;
似满足)t 检验或 F 检验条件,当然选 t
检验或 F 检验,因为这时若选秩转换的
非参数检验,会降低检验效能。
秩转换的非参数检验
非参数检验是一类统计学方法的总称,
基于秩转换(rank transformation)的
非参数检验只是其中的一种。
秩转换的非参数检验
秩次(rank):某种测量值按照从小到大 的顺序排序后,每一测量值所对应的序号。 秩转换:将某一变量值从小到大排序后, 获得每一变量值的秩次,并用此秩次代替 原有变量值的过程。
例8-1:两种方法测量12份血清ALT测量结果
编号 (1) 1 2 3 4 5 6 7 8 9 10 11 12
合计
原法 (2) 60 142 195 80 242 220 190 25 198 38 236 95
—
新法 (3) 76 152 243 82 240 220 205 38 243 44 190 100
0.05
3.求秩号和,即将正、负秩号分别相加,正负秩号绝对值之
和应等于 n(n 1) / 2 ,可用以核对。
4. 检验统计量 T 取较小一个秩和(或任取) ,根据 T 值查附表 9 进行判断,该表左侧为对子数,表身内部 是秩和,与上端纵标目之概率相对应。 判断标准:
若 T 在上下界范围内时,P 大于相应的概率水平(如 0.05) 若 T 在上下界范围外时,P 小于相应的概率水平 若 T 等于界值时,P 等于相应的概率水平
例8-1分析结果
取负秩和为T,则T=11.5;
查T界值表得0.05<P<0.1;
结论:不拒绝H0,不能认为两种方法检测