当前位置:文档之家› 常用非参数统计方法

常用非参数统计方法

齐性 H检验(Kruskal-Wallis 法)
•2020/10/16
例10.3 在研究白血病时,测得鼠脾的DNA含量如表 10.3第(1)、(3)、(5)、(7)栏。问不同病情的鼠脾 DNA含量有无差别?
•2020/10/16
一、建立假设检验,确定检验水准
❖H0:四种鼠脾DNA含量总体分布位置相同
•2020/10/16
➢正态近似检验,公式为:
• 当相同秩次较多时,
•2020/10/16
等级资料的形式
• 例10.2 用某药治疗不同病情的老年慢性支气管炎病 人,疗效见表10.2第(1)、(2)两栏,问该药对两种病 情的老年慢性支气管炎病人的疗效是否相同?
•常错误采用 卡方检验
•2020/10/16
•统计量
•2020/10/16
正态近似法公式确定概率P:
•2020/10/16
统计学基本内容
•分析资料的步骤:
•1、确定资料的类型:

分类资料、定量资料;
•2、选择适当的统计方法;
•3、作出统计推断结论。
•定量资料的分析: • t检验 Z(U)检验 (F检验)
•分类资料的分析: • 检验
•2020/10/16
非参数检验又称任意分布检验(distribution-free test) 。
➢ 优点:资料分布特征要求较低,适用范围广,收集资料方便 ;对不满足参数方法的资料,效率高。
➢ 缺点:对适宜用参数方法的资料,若用非参数法处理,没 有充分利用资料提供的信息,导致检验效能下降。犯第Ⅱ 类错误概率比参数检验大。
一、假设
• H0:两种病情病人的疗效分布相同。 • H1:两种病情病人的疗效分布不同。 • α=0.05
•2020/10/16
二、计算检验统计量uc值
• 排秩 • 求秩和 • 统计量T 。n1=82,T=8780.5 本例n1=82,n2=126,n2-n1=44,已超过附
表12所列范围,
•2020/10/16
本例 n1=7,n2=10,取T=T1=93.5
❖两组合计的秩和为多少?
•2020/10/16
➢三、确定P值和作出推断结论
查附表12, n1=7, n2-n1=10-7=3, 原则:内大外小
双侧0.05 42-84
拒绝 42 接受 84 拒绝
按α=0.05水准,拒绝H0,接受H1,故认为 铅作业工人比非铅作业工人血铅值高。

❖H1:四种鼠脾DNA含量总体分布位置不同
或不全同。
•2020/10/16
二、计算检验统计量
❖ 混合编秩: 由小到大排列,统一编秩 ❖ 相同值:同组顺序编号,不同组取平均秩次。
❖ 计算各组秩和Ri (i=1,2,3,4)
❖ 计算统计量H值
•2020/10/16
三、确定gt;20.05(3),即P<,因此拒绝H0,接受H1
常用非参数统计方法
•2020/10/16
概念复习
• 统计描述 • 数值资料 (P4 变量的分类) • 集中趋势 — 平均数 (P9)
–算术均数:单峰对称分布(正态、近似正态分布) –中位数: 偏态分布、分布不规则、开口资料 (位置指标,对分布不作要求)
•2020/10/16
参数统计 VS 非参数统计

b: 当差值为0,则不计该例(n随之减少 c: 如两差值相等,则取其平均秩次
• ③给秩添加正负号 • d>0的秩次为“+”;d<0的秩次“-”。 • ④ 分别求出差值为正与负的秩和,任取差
值为正或负秩和作为统计量。
• T+ =22.5, T- =13.5。
•2020/10/16
确定概率P
• 0.10 5-31
•用数据排序的秩来代替原数据进行假设检验: 位置检

•2020/10/16
适宜作非参数检验的资料
✓ 计量资料,总体偏离正态性或总体分布未知 ✓ 等级资料:痊愈、显效、有效、无效;-、 ±、
+、++、+++; 心功能分级;烧伤程度…
✓ 边界不确定的资料:如出现>50mg或 0.5mg以下
•2020/10/16
正态性检验
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
df
Sig.
统计量
df
Sig.
d
.333
9
.005
.602
9
.000
•2020/10/16
检验的基本思想:
假定两种处理效应相同,则差值的总体分布 是以0为对称的,即差值总体中位数为0。
相当于这些差值按绝对值大小编秩,再冠以原来 的正、负符号,正秩与负秩在理论上是随机的,即正 、负秩和应相近。
➢参数统计(parametric statistics):已知总体分 布类型,通过样本统计量对总体参数进行估 计和检验。 ➢区间估计: ➢t检验: u1= u2 ?要求独立随机样本、取自 正态总体、方差齐性
➢非参数统计(nonparametric statistics):不依 赖总体分布类型,不对参数进行估计或检验 ,通过样本观察值推断总体分布位置是否相 同。
配对设计资料主要是对差值进行分析。
•2020/10/16
•一、建立假设检验,确定检验水准
❖H0:两种方法所测值总体分布位置相同,

(差值的总体中位数为零)。
❖H1:两种方法所测值总体分布位置不同,

(差值的总体中位数不为零)

•2020/10/16
二、计算检验统计量
①算出各对数值之代数差 d=xi-yi ②编秩 a:将差值的绝对值从小到大编秩
假设
H0:三种方剂疗效分级的总体分布相同 。
H1:三种方剂疗效分级的总体分布不同或 不全同。

α=0.05
求检验统计量Hc
•2020/10/16
•2020/10/16
多个样本间的多重比较
当多个样本比较的秩和检验拒绝H0,认为各总 体分布位置不同或不全相同时,常需进一步 作两两比较的秩和检验,以推断哪两个总体 分布位置不同,或哪两个总体分布位置相同 。
为此需进行组间的多重比较(multiple comparison)。
•2020/10/16
配对符号秩和检验
• 主要用于配对数值变量资料的检验。
• 例 用过硫酸铵分光光度法和示波极谱法测定水中锰的含 量(mg/L),见表10.6第(2)、(3)栏,问两法结果有 无差别?
•2020/10/16
差值的正态性检验
7
.200*
.863
7
.162
非铅作业组
.174
10
.200*
.919
10
.348
•2020/10/16
一、建立检验假设,确定检验水准
H0:铅作业与非铅作业工人血铅值分布的位置
相同,
H1:铅作业与非铅作业工人血铅值分布的
位置不同。 α=0.05
•2020/10/16
二、计算检验统计量T 值
❖ 混合编秩 0.24 0.24 0.29 0.33 0.44 0.58 0.63 0.72
• 0.05 3-33
n=8。
• 0.02 1-35 • 0.01 0-36
T=22.5或T=13.5
• 原则:内大外小
• P>0.10 按=0.05水准,不能拒绝H0,尚不 能认为两种方法测定锰含量有差别。
•2020/10/16
正态近似法(N>50)
n>50, 可利用秩和分布的正态近似法, 其中
0.82 0.87 0.87 0.97 1.01 1.21 1.64 2.08 2.13
遇有原始数据相同时,可分两种情况处 理:①相同数据在同一组,其秩次按位置 的顺序。②相同数据分在两组,均取其平 均秩次(10+11)/2=10.5。
•2020/10/16
•2020/10/16
• 两组秩次分别相加 T1=93.5 T2=59.5 ❖取较小样本的秩和记为统计量 T,
非参数方法很多,主要介绍秩和检验(rank sum test) 。
•1 •2 •3 •4 •5 •6 •7 •8
•9 •1 0
•1 •1 12
•1 •1 34
•1 5
•1 6
•2020/10/16
• 非正态分布:两个班同学(n1,n2)从高到低、 交错地排在队伍中,编号(即身高的秩次),若两 个班同学身高相近(排列均匀),则每个班所报数 字之和(秩和T)与其理论秩和相差不大。反之 ,则有理由相信其中一个班同学的身高比另一 个班高。
认为四种鼠脾DNA含量总体分布位置不同或不全同 。
K=3,ni<=5, 附表13; K>3,最小样本例数>=5,H近似服从自由度为k-
1的卡方分布, 2 界值表。
•2020/10/16
等级资料(校正H)
• 例10.4某医生用三种方剂治疗某妇科病,疗 效如表10.4,问三种方剂的疗效有无差别?
•2020/10/16
两样本比较秩和检验
例 测得铅作业与非铅作业工人的血铅值 (μmol/L), 问两组工人的血铅值有无差别?
•2020/10/16
SPSS 软件检验正态性与方差齐性结果
正态性检验
group
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
df
Sig. 统计量
df
Sig.
x
铅作业组
.201
• 比较 n1的秩和T与其理论秩和n1(N+1)/2, 这就是秩和检验的思想。
• 秩和检验(rank sum test)
相关主题