14章秩和检验
显然,两组反映的信息是不同的,但由于两组的结构百分比无变化 (仅仅是位置不同),不改变检验结果。(χ2=5.224,P&g验
以表1为例。将无效、有效、显效三个疗效等级数量化, 数值用平均秩号,然后比较各组平均秩号的大小。
治疗组 无效 有效 显效 合计 6 19 35 60
109 8 9 3 129
228 17 10 7 262
1-228 229-245 256-262
114.5 13625.5 12480.5 237 259 2133 250.5 1036 17045 1896 2254.5 777 17408
246-255 250.5
• .H0:两组疗效相同;H1:两组疗效不同 • .取α =0.05 • .编秩,求各组秩和。
秩和检验(rank sum test)
秩次:将各原始数据从小到大排列, 分别给每个数据一个顺序号,也就是 秩次。 如: 9 6 7.5 13 秩次: 3 1 2 4 秩和检验:用各组秩和代替原始数据 进行假设检验的方法。
第一节 两独立样本差别的秩和检验 Wilcoxon
xs
A: B: 7 3 14 5 22 6 36 10 40 17 48 18 63 20 98 39 41.00+29.41 14.75+11.73
39 42 51 43 55 45 22 48 40 45 40 49
55 54 55 47 53 63 52 44 48 55 32 57
16 12 4 4 -2 18 30 -4 8 10 -8 8
10 9 3 3 1 11 12 3 6 8 6 6 68 R=10
• H0 : Md=0(两处理效应相同),H1 Md0 两处理效应不相同, α =0.05 编秩号 成对资料编秩号时较为复杂,要注意三点。 • (1)按差数的绝对值自小至大排秩号,但排好后秩号要保持原 差数的正负号;(2)差数绝对值相等时,要以平均秩号表示, 如表6-3中差数绝对值为4者共三人,其秩号依次应为2、3、4, 现皆取平均秩号3;(3)差数为0时,其秩号要分为正、负各半 ,若有一个0,因其绝对值最小,故秩号为1,分为0.5与-0.5, 若有两个0,则第二个0的秩号为2,分为1与-1等等。 • 求秩号和即将正、负秩号分别相加,本例得正秩号和为68,负秩 号和为10,正负秩号绝对值之和应等于n(n+1)/2 ,可用以核对, 如本例68+10=(12*13)/2=78,说明秩号计算正确。 • 检 验统计量R取较小一个秩号和,根据R值查附表12进行判断,该 表左侧为对子数,表身内部是较小秩号和,与上端纵标目之概率 0.05,0.01相对应,其判断标准是 R>R0.05时P>0.05, R0.05≥R>R0.01时 0.05≥P>0.01 P≤R0.01时 P≤0.01
• 例14-2 采用配对设计,用某种放射线的A、B两种方式分别局部照射家免的两 个部位,观察放射性急性皮肤损伤程度,见表14-3。试用符号秩和检验比较A、 B的损伤程度是否不同。
家兔号 ( 1) 皮肤损伤程度(评分) A 照射( 2) B 照射 差数 正( 5) 秩号 负 (6)
1 2 3 4 5 6 7 8 9 10 11 12 合计
表中 R1 取值的概率都是 1/20,归纳成 R1 在各种取值时的概率分布为: R 6 7 8 9 10 11 12 13 14 15 P(R1) 0.05 0.05 0.10 0.15 0.15 0.15 0.10 0.10 0.05 0.05
本法的基本思想
• 检验的基本思想是假定两个总体分布的中心位置 相同,中位数分别是Md1、 Md2,各抽出一个独立 的随机样本,各样本含量分别为n1,n2,且n1+n2=n。 • H0: Md1= Md2,即两总体分布位置相同, • H1:Md1 Md2,即两总体分布位置不同。 • 假若H0成立,两总体分布中心位置不存在差异, 则两样本的秩和在n1=n2时应大致相等;当n1 n2 时,则应与各样本含量成比例。反之,当两总体 分布不相同时,各组秩和将不与样本含量成比例。 但两种情况下都有R1+R2=n(n+1)/2。
0 1 2 3 3 4 4 5 5 6 6 7 7 8 9 10
0 1 2 3 3 4 4 5 5 4 4 3 3 2 1 0
0.0625 0.0625 0.0625 0.125 0.125 0.125 0.125 0.125 0.0625 0.0625 0.0625
附表10中只列有n≤25时的临界值。理论研究表明,当n 大于10时,检验统计量R经转换近似服从标准正态分 布:0.05>P>0.01 , 在α=0.05水准上拒绝H0 , 接受H1 , 结论与查表法相同
结论:
两组疗效的构成百分比差异无统
计学意义。
两组的疗效无差别。 (×)
注意:
一般的 χ2 检验不适用于有序
分类资料——“等级”、“程度”、
“优劣”的比较分析。因为检验只
利用了两组构成比提供的信息,损
失了有序指标包含的“等级”信息。
例如,假定两组的显效例数和有效例数互换,见表2。
表 2 治疗组与对照组疗效比较 组别 治疗组 对照组 例数 60 58 例 数 无效 6 14 有效 35 24 显效 19 20 百分比(%) 无效 10.00 24.14 有效 58.33 41.38 显效 31.67 34.48
• 大样本时,R值作如下变换后服从标准正态分布:
u
R n0 ( N 1) / 2 1 n1 n2 ( N 1) 12
二 等级/频数资料的秩和检验
例 14-1 分别用5%咪奎莫特软膏和氟尿嘧啶 软膏治疗尖锐湿疣的随机双盲临床研究 的疗效观察结果见表14-2,试比较两种 药物治疗尖锐湿疣的疗效。
第十四章 基于秩次的统计方法
• 参数检验:一是假定随机样本来自某种
已知分布(如正态总体),二是 该总体 分布依赖于若干参数,故称为参数检验。
• 非参数检验(nonparametric test):对
总体分布不作严格假定,又称任意分布 检验(distribution--free test), 即不必依 赖专门的总体分布的统计方法,与参数 无关,这时比较分布而不是比较参数, 称为“非参数检验”。
• H0 : 两样本来自同一总体(样本的每个观察值来自两总 体的概率均为0.5) • H1 : 两样本来自不同总体(样本的每个观察值来自两总 体的概率不等)
表 6-1 A 样本 观察值 7 14 22 36 40 48 63 98 秩和 秩号 4 6 10 11 13 14 15 16 R1=89 两独立样本秩和检验计算表 B 样本 观察值 3 5 6 10 17 18 20 39 秩号 1 2 3 5 7 8 9 12 R2 =47
• 1.建立检验假设H0、H1 • 2.给定检验水平α • 3 .统一编秩号,分组求秩和R1 、 R2 ,若 n1,n2 不等,则求较小例数组的秩和, 如 n1=n2 , T=min(R1 、 R2) 。计算检验统 计量R • 4 . 查附表9 , 得检验界值(如果R位于(
Rα (1) , Rα (2))区间内,P>α 接受H0 ;否则,拒 绝H0,接受H1)
R1 119114.5 9 237 1 250.5 4 259 17045
R2 109114.5 8 237 9 250.5 3 259 17408
当存在相同秩次时,必须对14-2的公式进行较正
c 1
3 ( t i ti ) i
对照组 14 20 24 58
合计 20 39 59 118
秩次范围 平均秩次 1-20 21-59 60-118 10.5 40 89
计算两组秩号并进行秩和检验
两组的平均秩号分别为: 治疗组:R1= (6×10.5+19×40+35×89)/60 =65.6 对照组:R2=(14×10.5+20×40+24×89)/58=53.1 经秩和检验,u=2.169,P<0.05,两组疗效差异有 统计学意义,因为治疗组平均秩号大于对照组,所以治 疗组疗效好。
概率 P
1,2,3,4 2,3,4 1,3,4 1,2,4 3,4 1,2,3 2,4 1,4 2,3 1,3 4 1,2 3 2 1 ---
--1 2 3 1,2 4 1,3 2,3 1,4 2,4 1,2,3 3,4 1,2,4 1,3,4 2,3,4 1,2,3,4
10 9 8 7 7 6 6 5 5 4 4 3 3 2 1 0
Asymp. Sig. Value Pearson Chi-Square Likelihood Ratio Linear-by-Linear 5.046 Association N of Valid Cases 118 1 .025 5.244 5.346 df (2-sided) 2 2 .073 .069
者的性别、年龄、病程无显著性差异,治疗结果见表1。
表 1 治疗组与对照组疗效比较 组别 治疗组 对照组 例数 60 58 例 数 无效 6 14 有效 19 20 显效 35 24 百分比(%) 无效 10.00 24.14 有效 31.67 34.48 显效 58.33 41.38
卡方检验
分析结果:
228 173 17 7 3 7 c 0.5836 3 N N uc u / c 1.242 1.96, 故P 0.05
3
228 1
N3 N
卡方与秩和检验区别
实例 考察硝苯地平治疗老年性支气管炎的疗效,治疗组 60人,用硝苯地平治疗,对照组58人,常规治疗,两组患
非参数分析方法的优缺点
• 优点:不受总体分布条件的限制,适用范 围广,某些不便准确测定,只能以严重程 度,好坏优劣,次第先后等作记录的资料 也可应用。 • 缺点:适用于参数检验的资料,如用非参 数检验会造成信息的丢失,导致检验功效 的下降。即当0假设不真时,非参数检验将 不如参数检验能较灵敏地拒绝0假设,犯第 二类错误的概率要比参数检验法大。