第7章非参数检验
第7章非参数检验
(1)选定待检验的变量到“检验变量列表”框 (2)在“期望全距”栏中确定参与分析的观测值的范围:
从数据中获取:所有观测数据都参与分析 使用指定的范围:只在该取值范围内的观测数据才参与 分析。 (3)期望值:给出各理论值 所有类别相等:所有子集的频数都相同 值:依次输入值,通过【添加】、【更改】、【删除】 进行增加、修改和删除。
1.基本思想 (1)通过对样本变量值的分析,实现对总体的变
量值出现是否随机进行检验。 (2)原假设:总体变量值出现是随机的。
①检验依据:游程-样本序列中连续出现相同的 变量值的次数。 ②游程数太大或太小都表明变量值存在不随机的 现象
第7章非参数检验
(3)检验统计量
Z r r r:游程数 r
DmaSx (xi()F(xi) 由于实际累 散 计 值 概 , D率 修 可 为 正 对 离 为: 修D 正 :Dmax(Sm (xi)aF x(x(i),maSx (xi (1)F(xi))
第7章非参数检验
(4)原假设成立时:
①小样本下:D~kolmogorov分布
②大样本下: nD 近似服从K(x)分布
③SPSS仅给出大样本下的 nD 和对应的p值 (5)决策
①D统计量的p值<显著性水平,拒绝原假设, 样本来自的总体与指定分布有显著差异
②D统计量的p值>显著性水平,不拒绝原假设, 样本来自的总体与指定分布无显著差异
第7章非参数检验
2.实现步骤
分析-非参数检验-旧对话框-1单样本 K-S
第7章非参数检验
随机的。
第7章非参数检验
2.实现步骤
分析-非参数检验-旧对话框-游程
第7章非参数检验
(1)选定待检验的变量到“检验变量列表” 框
(2)割点:计算游程数的分界值
①中位数:样本中位数为分界值
②众数:样本众数为分界值
③均值:样本均值为分界值
④设定:以用户输入的值为分界值,SPSS 将小于该分界值的所有变量作为一组,大 于或等于该分界值的所有变量作为一组, 计算游程。
第7章非参数检验
7.1.1总体分布的卡方检验
1.基本思想-吻合性检验 (1)原假设:样本来自的总体分布与期望分布无显
变著频量差率值异 为落。入第 2i个 子ik1集( f中i0 的fi0f理ie )论2 ~概p i率2 (为k 1),相应的期np 望i k 子集个数, fi0 观察频数,fie 期望频数,
第七章 SPSS非参数检验
第七章
第7章非参数检验
本章内容
7.1 单样本的非参数检验 7.2 两独立样本的非参数检验 7.3 多独立样本的非参数检验 7.4 两配对样本的非参数检验 7.5 多配对样本的非参数检验
第7章非参数检验
非参数检验
非参数检验: (1)在总体分布未知或知道甚少的情况下, 利用样本数据对总体分布形态等进行推断 的方法。 (2)推断过程中不涉及有关总体分布的参 数。
1.基本思想 (1)通过样本数据检验样本来自的总体是否服从
指定概率p的二项分布。
(2)小样本P -精{X确检x}验 x Cni piqni i0
Z x0.5np np(1 p)
大样本-近似检验 x 2时加0.5 x 2时减0.5
n
n
第7章非参数检验
2.实现步骤
分析-非参数检验-旧对话框-二项式
第7章非参数检验
3.应用案例
医学研究表明心脏病人猝死人数与日期的 关系为:一周内,星期一猝死者较多,其 他日子基本相当,各天的比例近似为:2.8: 1:1:1:1:1:1 根据“心脏病猝死”数据,推断总体分布 是否与理论分布相吻合。
分析: 利用总体分布卡方检验实现。
第7章非参数检验
7.1.2二项分布检验
(1)选定待检验的变量到“检验变量列表” 框
(2)检验分布:选择理论分布 ①常规:正态分布 ②相等:均匀分布 ③泊松:泊松分布 ④指数分布:指数分布
第7章非参数检验
3.应用案例
利用“儿童身高”数据分析周岁儿童身高 总体是否服从正态分布。
分析: 可以通过单样本K-S检验实现。
第7章非参数检验
7.1.4 变量值随机性检验
第7章非参数检验
(1)选定待检验的变量到“检验变量列表” 框
(2)定义二分法:指定如何分类 从数据中获取:检验变量为二值变量 割点:输入具体数值,大于等于该值的为第 一组,大于该组的为第二组
(3)检验比例:输入二项分布的检验概率值
第7章非参数检验
3.应用案例
利用“产品合格率”数据,推断该批产品 的一级品率是否为90%
第7章非参数检验
7.1 单样本的非参数检验
1.目的:样本来自总体的分布是否与某个已 知的分布相吻合?
—绘制样本数据的直方图、pp图、QQ图判 断—粗略
—通过非参数检验—精确 2.单样本非参数检验 (1)对单个总体的分布形态等进行推断 (2)方法:卡方检验、二项分布检验、K-S
检验、变量值随机性检验等。
2值越大 观测频数分布与期望数频分布差距越大 2值越小 观测频数分布与期望数频分布差距越小 2对应的p值 ,拒绝原假设,样本来的自总体分布与理论分存布在显著差异 2对应的p值 ,不拒绝原假设,样本自来的总体分布与理论布分无显著差异
第7章非参数检验
2.实现步骤 分析 - 非参数检验-旧对话框-卡方检验
r
2 n1n2 n1 n2
2 r
2 n1n2 ( 2 n1n2 n1 n2 ) ( n1 n2 ) 2 ( n1 n2 1)
n1 出现 1的个数, n2 出现 0的个数
(4)决策:
Z统计量的p值<显著性水平,拒绝原假设,变量值的出现不是 随机的。
Z统计量的p值>显著性水平,不拒绝原假设,变量值的出现是
分析: 产品合格与否属于二值变量,可以通过二 项分布检验ቤተ መጻሕፍቲ ባይዱ现。
第7章非参数检验
7.1.3单样本K-S检验
1.基本思想 (1)以俄罗斯数学家柯尔莫哥和斯米诺夫名字命名 (2)利用样本数据推断样本来自的总体是否服从某一理论分布,
是一种拟合优度的检验方法,适用于探索连续型随机变量的分布。 (3)步骤 ①计算各样本观测值在理论分布中出现的理论累计概率值F(x) ②计算各样本观测值的实际累计概率值S(x) ③计算理论累计概率值与实际累计概率值的差D(x) ④计算差值序列中最大绝对差值D