当前位置:文档之家› 第五讲 非参数检验

第五讲 非参数检验


单样本K-S检验
实际问题应用举例

单样本K-S检验
操作演示

收集到21名周岁儿童身高的样本数据,分析 周岁儿童身高的总体是否服从正态分布
儿童身高.sav
单样本K-S检验
选择待检验变量:周岁儿童的身高 在Test Distribution框中选择理论分布

单样本K-S检验

单样本的非参数检验
实际问题应用举例
医学家在研究心脏病人猝死人数与日期的关 系时发现:一周之中,星期一心脏病人猝死 者较多,其他日子则基本相当。各天的比例 近似2.8:1:1:1:1:1:1.现收集到心脏病人死 亡日期的样本数据,推断其总体分布是否与 上述理论分布相吻合
在这个问题中,死亡日期是“定序型数据”, 对该类问题的总体分布检验往往采用卡方检验

二项分布检验
实际问题应用举例
从某批产品中随机抽取23个样品进行检测并 得到检验结果数据。用1表示一级品,用0表 示非一级品。根据抽样结果验证该批产品的 一级品率是否为90%
二项分布检验
操作演示

二项分布检验
在Define Dichotomy框中指定如何分类。如果检验变量 是二分变量,则选中Get from data选项 SPSS将自动将第一组作为检验类,检验该类出现的概率 是否与输入的检验概率存在显著差异
卡方检验
卡方检验方法可以根据样本数据,推断总 体分布与期望分布或某一理论分布是否存 在显著差异

卡方检验
卡方检验基本思想的理论依据
如果从一个随机变量X中随机抽取若干个观 察样本,这些观察样本落在X的k个互不相干 的子集中的观察频数服从一个多项分布,该 多项分布当k趋于无穷时近似服从卡方分布

两独立样本的非参数检验
操作演示
目的:通过非参数检验方法,判断它们的分 布是否存在显著差异,进而对两种工艺的优 劣进行评价
两独立样本的非参数检验
两独立样本的非参数检验
K-S检验结果
待检验的变量 组标记值 K-S检验方法
概率P值(0.037)小于显 著性水平α(0.05),因此 应该拒绝原假设,可以认为 甲乙两种工艺下产品使用寿 命的分布存在显著差异
2.8:1:1:1:1:1:1
卡方检验
检验结果

二项分布检验
在现实生活中有很多数据的取值是二分的,通 常这些二分数据分别用1和0表示


卡方统计量观测值对 应的概率P值(0.256 )大于显著性水平α (0.05) 接受原假设,可以认 为心脏病人死亡日期 的实际分布与理论分 布2.8:1:1:1:1:1:1 无显著差异
统计分析与SPSS应用
丁婉玲 wld@
第五讲 非参数检验
丁婉玲 wld@
非参数检验
非参数检验是统计分析方法的重要组成部 分,它与参数检验共同构成统计推断的基 本内容 非参数检验是在总体不服从正态分布且分 布不明时,利用样本数据对总体分布形态 进行推断 由于非参数检验方法在推断过程中不涉及 有关总体分布的参数,因此称为“非参数 ”检验
检验结果
概率P值(0.344)大于显著性水平α(0.05),因 此不能拒绝原假设,可以认为周岁儿童的总体分布 与正态分布无显著差异
Normal:正态分布 Uniform:均匀分布 Poisson:泊松分布 Exponential: 指数分布
课堂练习1
某地某一时期内出生35名婴儿,其中女性19名(Sex=0 ),男性16名(Sex=1)。请问这个地方出生婴儿性别比 与通常的男女性别比例(0.5)是否不同
课堂练习4
利用第2章第6题的数据(居民储蓄调查数 据.sav),分析不同常住地人群本次存款 金额的总体分布是否存在显著差异
课堂练习5
利用第2章第6题的数据(居民储蓄调查数 据.sav),分析不同收入人群本次存款金 额的总体分布是否存在显著差异
要点小结
了解非参数检验的目的和前提 掌握和熟悉单样本非参数检验的操作步骤

产品合格率.sav
数据编辑窗口中的第一条数据所在组为第一组
二项分布检验
检验结果

单样本K-S检验
K-S检验能够利用样本数据推断样本来自 的总体是否服从某一理论分布,是一种拟 合优度的检验方法,适合探索连续型随机 变量的分布
23个样本中一级品个数小于等于19个的概率 值为0.193,如果显著性水平为0.05,则不 应该拒绝原假设,认为一级品概率与90%无 显著差异
是一种吻合性检验 适用于对有多项分类值的总体分布的分析 原始假设是:样本来自的总体分布与期望分 布或某一理论分布无显著差异
卡方检验对数据存储的要求

定义一个存放变量值的变量 定义一个存放各变量值观测频数的变量
卡方检验
操作演示“心脏病猝死.sav”
卡方检验
选定待检测的变量:死亡日期 设定理论值
例如课堂练习1中
星期一光临店铺的顾客数量为11人,实质上就是 “来店日期”这个变量,取值为1的个案数为11 星期二光临店铺的顾客数量为19人,实质上就是 “来店日期”这个变量,取值为2的个案数为19
加权操作完毕后,数据编辑窗口显示的内 容并不会发生变化
两独立样本的非参数检验
某工厂用甲乙两种不同的工艺生产同一种 产品。如果希望检验两种工艺下产品的使 用寿命的分布是否存在显著差异,可从两 种工艺生产出的产品中随机抽样,得到抽 样数据见“使用寿命.sav”
多独立样本的非参数检验
多独立样本的非参数检验是通过分析多组 独立样本数据,推断样本来自的多个总体 中的中位数或分布是否存在显著差异 多组独立样本是指按独立样本抽样方式获 得的多组样本
多独立样本的非参数检验
希望对北京、上海、成都、广州四个城市 的周岁儿童的身高进行比较分析。采用独 立抽样方式获得四组独立样本。具体数据 见“多城市儿童身高.sav”
婴儿 1 2 3 4 5 6 7 8 9 10 11 12 Sex 1 0 1 1 1 1 0 0 0 0 1 1 婴儿 13 14 15 16 17 18 19 20 21 22 23 24 Sex 1 1 1 1 0 0 0 0 0 0 1 1 婴儿 25 26 27 28 29 30 31 32 33 34 35 Sex 1 1 0 0 0 0 1 0 0 0 0
男性和女性 合格产品和不合格产品 硬币正面和硬币反面
如果进行n次相同的实验,则出现1或0的次数可 用离散型随机变量来描述,那么变量X的分布为 二项分布

如果出现1的概率设为p 则出现0的概率就为1-p
二项分布检验
二项分布检验是要通过样本数据检验样本 来自的总体是否服从指定的概率为P的二 项分布,其原假设是:样本来自的总体与 指定的概率为P的二项分布无显著差异

采用非参数检验方法进行检验,判断四个城 市周岁儿童的身高分布是否存在显著差异
多独立样本的非参数检验
操作演示
多独立样本的非参数检验
多独立样本的非参数检验
Kruskal-Wallis检验
多独立样本的非参数检验
Kruskal-Wallis检验结果 概率P值(0.003)小于显 著性水平α(0.05),因此 应该拒绝原假设,可以认为 四个城市周岁儿童的身高分 布存在显著差异
四 15
五 15
六 16
日 19
问题出在 哪里
卡方检验数据要求——变量加权
卡方检验数据要求——变量加权
变量加权
SPSS中指定的加权变量的过程实质上是变 量的复制

两独立样本的非参数检验
两独立样本的非参数检验是在对总体分布 不甚了解的情况下,通过对两组独立样本 的分析推断样本来自的两个总体的分布是 否存在显著的差异

卡方检验 二项分布检验 单样本K-S检验
掌握和熟悉两独立样本K-S检验的操作步骤 掌握和熟悉多独立样本Kruskal-Wallis检验的 操作步骤
课堂练习2
利用第2章第6题的数据(居民储蓄调查数 据.sav),分析存款金额的总体分布与正 态分布是否存在显著差异
课堂练习3
某店铺老板认为一周七天中光临店铺的顾客数 量相同,现随机收集某一周七天的顾客数量如 下,请检验一周内各日的顾客人数是否相同
பைடு நூலகம்
课堂练习1——关键点
一 11
二 19
三 17
相关主题