统计学非参数检验课件
学习交流PPT
7
• 非参数统计的名字中的“非参数(nonparametric)”意 味着其方法不涉及描述总体分布的有关参数;
• 它被称为“和分布无关”(distribution—free),是因为 其推断方法和总体分布无关;不应理解为与所有 分布(例如有关秩的分布)无关.
学习交流PPT
8
非参数检验的优点
• 完全随机两组均数比较的t检验(独立t检验) • 匹配设计下两组均数比较的t检验(匹配t检验)
• 单因素多组比较:方差分析
• 完全随机设计下的多组均数比较
学习交流PPT
3
局限性
• t检验
• 独立t检验要求:正态、方差相等(或不相等)、个体 独立
• 匹配t检验要求:差值正态、个体独立
• 方差分析
• 单因素多水平比较方差分析要求:正态、方差相等、个 体独立
学习交流PPT
14
第六章 非参数检验
• 非参数检验概述
• 非参数检验、特点及应用
• 单样本的非参数检验
• 两个样本和多个样本的非参数检验
学习交流PPT
15
单样本的非参数检验
• c2拟合优度检验 • K-S拟合优度检验 • 中位数的符号检验
分类数据 检验分布
对中位数的推断
学习交流PPT
16
• c2统计量
• 在参数检验和非参数检验都可以使用的情况下,非参数 检验的功效(power)要低于参数检验方法。
学习交流PPT
12
以下情况下应当首选非参数方法
• 参数检验中的假设条件不满足,从而无法应用。例 如总体分布为偏态或分布形式未知,且样本为小样 本时。
• 检验中涉及的数据为定类或定序数据。 • 所涉及的问题中并不包含参数,如判断某样本是否
学习交流PPT
4
未解决问题
• 两组性别结构是否相同? • 疗效用痊愈、显效、有效、无效四级分类法进行评价时,两组
或多组如何比较? • 如何检验样本数据来自的总体服从正态分布? • 总体不是正态分布,小样本情况下,如何检验总体的集中趋势? • 有6名歌手参加比赛,4名评委进行评判打分,推断评委的评判
缺点:方法比较粗糙,对于符合参数检验条件者,采用
非参数检验会损失部分信息,其检验效能较低;样本含
量较大时,两者结论学常习交相流P同PT
11
非参数检验的特点
• 非参数检验不需要严格假设条件,因而比参数检验有更 广泛的适用面。
• 非参数检验几乎可以处理包括定类数据和定序数据在内 的所有类型的数据,而参数检验通常只能用于定量数据 的分析。
学习交流PPT
10
参数检验
(parametric test)
已知总体分布类型,对 未知参数进行统计推断
非参数检验
(nonparametric test)
对总体的分布类型 不作严格要求
依赖于特定分布类 型,比较的是参数
不受分布类型的影响,比 较的是总体分布位置
优点:方法简便、易学易用,易于推广使用、 应用范围广;可用于参数检验难以处理的资料 (如等级资料,或含数值“>50mg”等 )
• 海难发生后,幸存者共718人,其中男性374人, 女性344人,以显著性水平为0.1检验存活状况与性 别是否有关?
c02.1(1)2.706
学习交流PPT
19
• 提出零假设和备择假设
• H0:观察频数与期望频数一致
• H1:观察频数与期望频数不一致
• 计算期望频数
• 男性的期望频f e 数
,女性为153人
• 依据总体分布状况,计算出分类变量中各类别的期望频 数,与分布的观察频数进行对比,判断期望频数与观察 频数是否有显著差异,从而达到对分类变量进行分析的 目的。
学习交流PPT
18
• 1912年4月15日,豪华巨轮泰坦尼克号与冰山相撞 沉没。当时船上共有2208人,其中男性1738人, 女性470人。
• 非参数检验(nonparametric tests)
• 又称为任意分布检验(distribution- free test),它不 考虑研究对象总体分布具体形式,也不对总体参数进行 统计推断
• 仅仅依赖于数据观测值的相对大小(秩)等,而是通过检 验样本所代表的总体分布形式是否一致来得出统计结论。
标准是否一致 • ……
学习交流PPT
5
• 参数检验:
• 样本被视为从分布族的某个参数族抽取出来的总体的代 表,而未知的仅仅是总体分布具体的参数值
• 推断问题就转化为对分布族的若干个未知参数的估计问 题,用样本对这些参数做出估计或者进行某种形式的假 设检验,这类推断方法称为参数方法。
学习交流PPT
6
• 对总体假定较少,有广泛的适用性, 结果稳定性较好。
• 假定较少 • 不需要对总体参数的假定 • 与参数结果接近
• 针对几乎所有类型的数据形态。 • 容易计算
• 在计算机盛行之前就已经发展起来。
学习交流PPT
9
非参数检验的弱点
• 可能会浪费一些信息
• 特别当数据可以使用参数模型的时 候
• 大样本手算相当统计量
7181738565 2208
• 查表
c2 (自(f由0 f度ef为e)2类别30数3-1)
• 做关出判c断02.1:(1)决绝2.7原0假6设,认为存活状况与性别显著相
• 用来测定定类变量之间的相关程度
c2 (f0 fe)2
• c2统计量的分布与自由f度e 有关;
c
•
2
c2统其 计量中 f描0表 述了示 观察观 值与察期值 望f值e表 频 的接示 数 近期 程, 度望值频数 0
学习交流PPT
17
• 拟合优度检验(goodness of fit test)
• 用c2统计量进行统计显著性检验的重要内容之一;
第六章 非参数检验
学习交流PPT
1
方法的回顾
• 单个因素(两水平)的作用评价:两组比较
• 完全随机设计下的单因素两组比较 • 匹配设计的两组比较
• 单个因素(多水平)的作用评价:多组比较
• 完全随机设计下的单因素多水平比较
• 两个因素的分析问题
• 无交互作用、有交互作用
学习交流PPT
2
• 单因素两组比较:t检验
来自正态分布等,判断某样本是否为随机样本。
学习交流PPT
13
常用的非参数检验方法
• 用于单个样本的c2拟合优度检验、K-S拟合优度检 验、中位数的符号检验
• 用于两个匹配样本的Wilcoxon符号秩检验 • 用于两个独立样本的Wlicoxon秩和检验 • 用于多个独立样本的Kruskal-Wallis检验。