当前位置:文档之家› 第7章 非参数检验

第7章 非参数检验


例:产品一级品率是否为90%
7.1.3 单样本K-S检验
该检验为拟合优度检验,可以检验 样本数据是否服从指定的理论分布,适 用于探索连续型随机变量的分布形态, 如正态分布、均匀分布、指数分布等。
原假设:样本来自的总体与指定的理论 分布无显著差异
单样本K-S检验基本思路
假定F0(x)是一个已知的分布函数,Fn(x) 是未知的总体分布函数F(x)的样本经验 分布函数,取检验统计量: D=max︳Fn(x)- F0(x)︳ 在样本数据服从指定分布时,D的观测 值应该较小,如果D的观测值较大,则 零假设可能不成立。
Wald-Wolfowitz游程检验
Moses极端反应检验
Moses极端反应检验
基本思路: (1).将一样本作为控制样本,另一样本作为 实验样本。两样本混合后按升序排列; (2).找出控制样本的跨度(最低秩和最高秩 间的样品数)和截头跨度(去掉控制样 本的最小值和最大值后的跨度)。 若跨度(截头跨度)很小,认为样本存在 极端反应。
Nonparametric Tests 优点
1. 可应用于各种不同的情况,不受 总体分布的限制;
2. 适合处理无法精确数量化的名目 资料和小样本资料;
3. 计算通常较简单且容易理解。
Nonparametric Tests 缺点
1. 将量的资料转换为质的资料时, 漏失了数据的一些信息;
2. 检验的敏感度和效果均不如参 数检验好。 但是:根据国外的一项研究,有些方 法的检验效能大约在参数检验方法的 95%左右,并非低得不能接受。
(2)卡方检验要求样本容量一般大于50。
(3)当样本数据的分类只有两类时,用二 项检验。样本容量小到卡方检验不能用时, 二项检验是唯一可用的检验。
比较
(4)资料分类是若干离散型类别,以 及当期望的频数足够大时,最好用卡方 检验。
(5)样本数据为连续分布时,最好用 K-S检验。
That’s
you!
选择何种检验方法
取决因素:成本、时间、效度、可用资料 的总数、可用资料的形式、抽样方法、总体的 属性、以及第I、Ⅱ类错误的概率(α和β)等。 在检验中,若可以获得参数检验所需的假 设资料,当然选择适当的参数检验法,若对于 来自神秘总体或较稀少的试验,可能使用非参 数检验较为合适,但当面对等级化资料时,则 只能使用非参数检验方法。
单样本变量值随机检验具体做法 (1)菜单Analyze->Nonparametric Test->Runs (2)选定待检验的变量到Test Variable list框中 (3)在Cut Point框中确定计算游 程数的分界点。
例:设备工作是否正常
比较
(1)当检验的假设是关于样本是否来自一 指定分布总体的问题时,可采用三种具有 拟合优度类型的检验方法中的一个,即卡 方检验、二项检验和K-S检验。
7.1.1 卡方检验(Chi-Square过程)
Χ2检验就是根据样本数据推断总体的 分布与期望分布或某一理论分布是否有显著 H0 差异。它的原假设是 :样本来自的总体其 分布形态与期望分布无显著差异。进行检验 时,需要构造统计量:
2 ( O E ) 2 i i Ei i 1 k
2 ( O E ) i 2 i Ei i 1 k
基本操作步骤:
1. Analyze->Nonparametric Tests -> 2 Independent Sample; 2.选择待检验变量到Test Variable框中; 3.指定存放样本标志值的变量到Grouping Variable 框; 4.选择非参数检验方法。
SPSS实现1
中位数检验
2.分布位置检验方法
用于检验样本所在总体的分布位置/形状是否相同.
具体包括用于成组资料分布位置检验的2 Independent Samples与K Independent Samples过程;以及用于配对 资料分布位置检验的2 Related Samples与K Related Samples过程
7.1单个样本的检验
3.Jonkheere-Terpstra检验
7.4两配对样本的非参数检验
1.Wilcoxon符号秩检验
2.符号检验 3.Mcnemar变化显Frieman检验
2.Kendall协和系数检验
3.Cochran’s Q检验
对比:参数检验
参数检验是在已知总体分布 的条件下,对相应分布的总体参 数进行估计和检验。比如单样本 u检验就是假定该样本所在总体 服从正态分布,并已知方差,然 后来推断总体的均数是否和已知 的总体均数相同。
Wilcoxon W统计量和MannWhitney U统计量
1. Wilcoxon W=Wx,若m>n; Wilcoxon W=Wy,若m<n; Wilcoxon W为第一个观测值所在样本的 W值,若m=n; 2. Mann-Whitney U=W-n(n+1)/2 在小样本下U统计量服从曼-惠特尼分布, 大样本下U近似服从正态分布。
其中,Qi=归入第i类中的观测数目;
Ei=零假设成立时第i类中的期望事件数。
此公式先将每一类别中的观测和期望的频 数之差的平方除以相应的期望频数,然后对所有 的k类求和。 如果观测和期望的频数接近一致,则其差 (Qi—Ei)就小,因而Χ2就小;反之,若其差大, 则Χ2 的值也越大。当Χ2 越大时,观察的频数就 越不可能是来自于以零假设为基础的整体。
例:猝死人数与日期关系是否为 2.8:1:1:1:1:1:1
举例
7.1.2 二项检验
二项检验属于拟合优度型检验, 该检验法适用于只能划分为两类的数 据总体,如:男生和女生、小于或等 于某值的数和大于该值的数。对于取 自该总体的所有可能结果,要么是这 两类中的某一类,要么是另一类,不 可能同时属于对立分类中的两类,称 具有这种分类特征的数据所服从的分 布为二项分布。
第七章
定义:
非参数检验
非参数检验的着眼点不是总体的某个 (或某些)参数,而是总体的分布情况— —即研究目标总体的分布是否与已知理 论分布相同;或者各样本所在总体的分 布位置、形状是否相同。
由于这一类方法并不涉及总体参数, 因而被称为非参数方法。
非参数检验所要处理的问题
• (1)只涉及一个总体时,检验总体的分 布是否为某指定的已知分布; • (2)涉及多个总体时,检验它们的分布 是否相同 注:两种分布是否相同,一般看两者 类型及参数(均值、方差等)是否完全 一致。如果两个总体的分布类型相同, 而参数不同,也被视为概率分布不同。
基本操作步骤:
1. Analyze->Nonparametric Tests -> K Independent Sample; 2.选择待检验变量到Test Variable框中; 3.指定存放样本标志值的变量到Grouping Variable 框; 4.选择非参数检验方法。
all…
Thank
Mann-Whitney U检验
该检验可用来检验两个独立样本是否取自 同一总体,它是最强的非参数检验之一, 基本思路(1)将样本X和样本Y混合后作升序排 列,计算每个数据的秩; (2)分别对两样本的秩求平均,得到两个平均 秩,分别用W1=WX/m和W2=WY/n表示。 若W1和W2比较接近,则说明两个样本来自相 同分布的总体,若W1和W2差异较大,则说明 两个样本来自不同的总体。
K—S双样本检验
该检验可用来检验两个独立样本是否取自同 一总体。 基本思路 (1)将样本X和样本Y混合后作升序排列; (2) 分布计算两组样本秩的累计频数和每个点 上的累计频率Fn1(x)和Fn2(x); (3) 计算D=max[Fn1(x)- Fn2(x)] 如果D 较小,则可以认为两个样本取自同一 个总体;如果D较大,大到一定程度,则可以 认为两个样本不是取自同一总体的。
Kruskal-Wallis H检验
实质为Mann-Whitney U检验的推广,其基本思路: (1).多组样本混合按升序排列,并求出各变量的秩; (2)考察各组秩的均值是否存在显著差异。 研究各组秩的均值差异可利用方差分析法。
若秩的均值存在显著差异,则认为多总体的分布 有显著差异。
Kruskal-Wallis H检验
Chi-Square过程具体做法
Chi-Square检验先按照已知总体的构成 比分布计算出样本中各类别的期望频数,然 后求出观测频数和期望频数的差值,最后计 算出卡方统计量,利用卡方分布求出P值, 以得出检验结论。
Chi-Square过程具体做法
(1)菜单Analyze->Nonparametric Test>Chi Square (2)选定待检验的变量到Test Variable框 中 (3)在Expected Range框中确定待检验样本 的取值范围 (4)在Expected Values框中给出期望分布 的频数
假设观测结果可以表示为0和1的序列, 把0和1连续出现构成的数据段称为一个游 程,总的数据段称为游程总个数。
例如:把下面序列:0011101100 中,00、111、0、11、00当作游程,游程 总个数为5。
当游程总数太大(周期性)或太小 (不随机)时,认为样本数据不是随机序列。
游程检验
游程检验有游程最大长度检验和游 程总数检验两种检验方法,SPSS采用的 是游程总数检验方法,用该法可以检验 一组样本数据是否来自同一总体(或差 异不明显服从同一分布),即考察按随 机顺序得到的一组样本的观测值是否表 现出足够的随机性。
单样本K-S检验具体做法
(1)菜单Analyze->Nonparametric Test->1-Sample K-S (2)选定待检验的变量到Test Variable list框中 (3)在test distribution框中选 择理论分布。
例:周岁儿童身高的总体分布是否为 正态分布
相关主题