当前位置:文档之家› 常用非参数统计方法精品PPT课件

常用非参数统计方法精品PPT课件


123 45 6 7 8
9 10 11 12
13 14
15
16
• 非正态分布:两个班同学(n1,n2)从高到低、 交错地排在队伍中,编号(即身高的秩次),若两 个班同学身高相近(排列均匀),则每个班所报数 字之和(秩和T)与其理论秩和相差不大。反之, 则有理由相信其中一个班同学的身高比另一个 班高。
常用非参数统计方法
流行病与卫生统计学系
概念复习
• 统计描述 • 数值资料 (P4 变量的分类) • 集中趋势 — 平均数 (P9)
–算术均数:单峰对称分布(正态、近似正态分布) –中位数: 偏态分布、分布不规则、开口资料 (位置指标,对分布不作要求)
2021/2/21
2
参数统计 VS 非参数统计
➢ 缺点:对适宜用参数方法的资料,若用非参数法处理,没 有充分利用资料提供的信息,导致检验效能下降。犯第Ⅱ 类错误概率比参数检验大。
非参数方法很多,主要介绍秩和检验(rank sum test) 。
2021/2/21
4
1 4 10 1112 13 14 15 80
2 3 5 6 7 8 9 16 56
10.5
1.01
13
n1=7
T1=93.5
n2=10
T2=59.5
2021/2/21
9
SPSS 软件检验正态性与方差齐性结果
正态性检验
group
Kolmogorov-Smirnova
Shapiro-Wilk
统计量
df
Sig. 统计量
df
Sig.
x
铅作业组
.201
7
.200*
.863
7
.162
非铅作业组
0.82 0.87 0.87 0.97 1.01 1.21 1.64 2.08 2.13
遇有原始数据相同时,可分两种情况处 理:①相同数据在同一组,其秩次按位置 的顺序。②相同数据分在两组,均取其平 均秩次(10+11)/2=10.5。
2021/2/21
12
2021/2/21
13
• 两组秩次分别相加 T1=93.5 T2=59.5
.174
10
.200*
.919
10
.348
2021/2/21
10
一、建立检验假设,确定检验水准
H0:铅作业与非铅作业工人血铅值分布的位置
相同,
H1:铅作业与非铅作业工人血铅值分布的
位置不同。 α=0.05
2021/2/21
11
二、计算检验统计量T 值
❖ 混合编秩 0.24 0.24 0.29 0.33 0.44 0.58 0.63 0.72
❖取较小样本的秩和记为统计量 T,
本例 n1=7,n2=10,取T=T1=93.5
❖两定P值和作出推断结论
查附表12, n1=7, n2-n1=10-7=3, 原则:内大外小
双侧0.05 42-84
拒绝 42 接受 84 拒绝
按α=0.05水准,拒绝H0,接受H1,故认为
问两组工人的血铅值有无差别?
表 10.1 两组工人的血铅值 (μmol/L)
铅作业组
秩次
非铅作业组
秩次
(1)
(2)
(3)
(4)
0.82
9
0.24
1
0.87
10.5
0.24
2
0.97
12
0.29
3
1.21
14
0.33
4
1.64
15
0.44
5
2.08
16
0.58
6
2.13
17
0.63
7
0.72
8
0.87
➢参数统计(parametric statistics):已知总体分 布类型,通过样本统计量对总体参数进行估
计和检验。 : (x Z / 2sx , x Z / 2sx )
➢区间估计: : (x t / 2, sx , x t / 2, sx )
➢t检验: u1= u2 ?要求独立随机样本、取自 正态总体、方差齐性
54
3510
6
24
108~131
119.5
2151
23
53
132~184
158
4740
11
24
185~208
疗效
单纯性 (1)
表 10.2 某药对两种病情的老年慢性支气管炎病人的疗效比较
单纯性合
合计
秩次范围 平均秩次
秩和
并肺气肿 (2)
(3)=(1)+(2) (4)
(5)
单纯性 合并肺气肿
(6)=(1)(5) (7)=(2)(5)
控制
65
显效
18
有效
30
无效
13
合计
126
2021/2/21
42
107
1~107
铅作业工人比非铅作业工人血铅值高。
2021/2/21
15
➢正态近似检验,公式为:
u
T
n1n1 n2 1/ 2 0.5 n1n2 n1 n2 1/12
i
C 1
(t 3 j
t
j
)
/( N
3
N
)
j 1
当相同秩次较多时,
uc
u C
式中t j (j=1,2,…)为第 j 个相同秩的个数
假定相同秩(即平均秩)中有 2 个 1.5,5 个 8,3 个 14,则
适宜作非参数检验的资料
✓ 计量资料,总体偏离正态性或总体分布未知 ✓ 等级资料:痊愈、显效、有效、无效;-、 ±、
+、++、+++; 心功能分级;烧伤程度…
✓ 边界不确定的资料:如出现>50mg或 0.5mg以下
2021/2/21
8
两样本比较秩和检验
例 测得铅作业与非铅作业工人的血铅值 (μmol/L),
• 比较 n1的秩和T与其理论秩和n1(N+1)/2, 这就是秩和检验的思想。
2021/2/21
6
秩和检验(rank sum test)
• 秩(rank):观察值从小到大排序,该序号在统
计学上称为秩/秩次; •秩和:秩次求和得到; •秩和检验:用秩和进行假设检验的方法。
秩(rank) → 秩和(rank sum) →秩和检验(rank sum test) 用数据排序的秩来代替原数据进行假设检验: 位置检验
➢非参数统计(nonparametric statistics):不依
赖总体分布类型,不对参数进行估计或检验,
通过样本观察值推断总体分布位置是否相同。
2021/2/21
3
非参数检验又称任意分布检验(distribution-free test)。
➢ 优点:资料分布特征要求较低,适用范围广,收集资料方便; 对不满足参数方法的资料,效率高。
t1 2 , t2 5 ,t3 3 ,
2021/2/21
(t
3 j
t
j)
(23
2) (53 5) (33 3) 15016
等级资料的形式
• 例10.2 用某药治疗不同病情的老年慢性支气管炎病 人,疗效见表10.2第(1)、(2)两栏,问该药对两种病
情的老年慢性支气管炎病人的疗效是否相同?
相关主题