当前位置:文档之家› 第二讲-非参数统计检验

第二讲-非参数统计检验

第二讲非参数检验1. 实验目的1. 了解非参数假设检验基本思想;2. 会用SAS 软件中的proc nparlway 过程进行非参数假设检验和 proc freq 过程进行列联表的独立性检验。

2. 实验要求1. 会用SAS 软件建立数据集,并进行统计分析;2. 掌握proc nparlway 过程进行非参数假设检验的基本步骤;3. 掌握proc freq 过程进行列联表的独立性检验的基本步骤。

3. 实验基本原理3.1符号检验H 0:两种方法的处理效果无显著性差异令 li = *1 第i 个个体中新方法优于对照方法.0 第i 个个体中新方法劣于对照方法 i=1,2,|||,N统计里S NN=瓦I ii TS N 表示新方法的处理效果优于对照方法的配对组总数。

若新方法的处理效果显著的优于对 照方法,则S N 的值应明显偏大。

因此,若对给定的置信水平[,有 P「S N - 八则拒绝H 0。

1NN(1) S N 服从二项分布b(N ,-) E(S N ),Var (S N ) 。

拒绝域为: 2 24'SN SNc ;H 。

为真时,(2)由中心极限定理可知,当的零分布趋于标准正态分布3.2 Wilcox on 秩和检验 (1)单边假设检验H o :两种方法的处理效果无显著性差异 as H i ::新方法优于对照方法。

n用于检验H o 的统计量为:W s I ii 4若对给定的置信水平,有P[W s - C 「:〉,则拒绝H o。

且W s的分布列为:P H °{W S =w #{w ;n,m}' 了 N 、1 1n根据观测结果计算W s的观测值W s,计算检验的p 值:p= P H o{W s-W s }八 P H °{W S二k}k _w s然后将p 值与显著水平:•作比较,若p ::: :•,则拒绝H 0,否则接受H 0。

(2)双边假设检验给定的显著水平:-,C |和c 2应该满足:P H 0{W A 乞 c 1}P H 0{W A - c 2}=仅由上式还不能唯一确定 &和C 2,当我们对两种方法谁优谁劣不得而知时,通常取PH °{W A22 c 1}= PH °{W A - c 2}= ~若利用p 值进行检验,设 W A的观测值为'A ,计算概率值P H °{W A - A }或P H °{W A 「A }由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。

例如 0 乞 PH °{ WA - ' A ^V 2则 p = 2PH 0{W A - • ■ A }。

求出 p 值后,若 p<a,拒 绝H 。

,否则接受。

拒绝域为:(3)列联表的独立性检验H o :方法的处理效果无显著性差异二jk :表示格子概率,m jk二n: jk表示三维列联表中事件发生的理论频数。

将概率用相应的频率频率去估计。

”Q2J gk 一%)2V2(f)令Q ~ (f)i =i j k=i nn i j k其中:f二(rst -1) - (为检验特定独立性所需要独立估计的概率数目)将样本数据代入统计量进行检验。

然后将P与显著水平:•作比较,若p ::: :•,拒绝H0,否则接受H0。

4. 实验相关SAS知识(1)独立样本的秩检验proc npar1way过程proc npar1way过程的基本语句形式为proc n par1way [opti on s];class variables; ( proc n par1way 过程不可缺少的语句)exact; (求出检验的精确 p值)var variables;其中"options ”可包含以下选项的部分或全部:①DATA数据集名:指定要分析的数据集。

②ANO VA对原始数据执行标准的单因素方差分析。

③WILCOXO N进行wilcoxon型秩和检验。

当有两种处理方法时,进行的是wilcoxon秩和检验;当有多种处理方法时,进行Kruskall-Wallis 检验。

④EDF:进行基于样本经验分布函数的非参数检验,包括Smirnov检验。

若省略这些选项,SAS系统将给出所有基于秩以及经验分布函数的非参数检验方法的分析结果。

(2)列联表的独立性检验proc freq 过程的基本语句形式为proc freq [opti on s];tables variable1*variable2* .. /opti ons;weight variable;其中"options ”可包含以下选项的部分或全部:①DATA数据集名:指定要分析的数据集。

②chisq:要求对生成的每个二维列联表的独立性作2检验,并计算依赖于2统计量的关联度。

③cellchi2:要求输出每个格子对总2统计量的贡献。

④expected:在独立性假定下输出各格子的期望频数。

⑤deviatio n:要求输出每个格子上的频数与期望频数之差。

⑥nocol:不输出二维列联表各格子的列百分数。

⑦norow:不输出二维列联表各格子的行百分数。

⑧nofreq:不输出格子频数。

⑨nopercent:不输出各格子的百分数。

⑩nopri nt:不输出列联表,但允许输出各分析结果。

5. 实验举例5.1 Wilcox on秩和检验(单边和双边假设检验)例1 为了解一种新的术后护理方法和原护理方法相比是否可以显著缩短病人手术后的恢复时间,随机的将做完某种手术的18位病人分为两组,每组9人,按不同方法护理,观测到他们的恢复时间(单位:天)如下:原方法:20,21,24,30,32,36,40,48,54新方法:19,22,25,26,28,29,34,37,38在〉=0.05下检验新方法是否显著的缩短了病人手术后的恢复时间。

Wilcox on秩和单边假设检验SAS程序如下:data a1;in put method $ time@@;cards;a 20 a 21 a 24 a 30 a 32 a 36 a 40 a 48 a 54b 19 b 22 b 25 b 26 b 28 b 29 b 34 b 37 b 38 proc npar1way data=a1 wilcoxon; class method; exact;run;结果显示p =0.2181 故接受原假设H。

,即认为病人手术后采用新旧护理方法对其恢复时间无显著差异。

5.2 . Smirnov 检验例2 (数据见教材)SAS程序如下:data a1;in put group $ time@@;cards;a 6.8 a 3.1 a 5.8 a 4.5 a 3.3 a 4.7 a 4.2 a 4.9b 4.4 b 2.5 b 2.8 b 2.1 b 6.6 b 0.0 b 4.8 b 2.35proc npar1way data=a1 edf;class group;exact;var time;run;运行结果显示p=0.0879>0.05,即认为两种止痛药效果无显著差异;但在 0.1水平上可认为两者有显著差异。

5.3 . Wilcoxon符号秩检验例3 (见教材例题2.8 ) SAS程序如下:data a;in put id product1 product2;cards;1 459 4142 367 3063 303 3214 392 4435 310 2816 342 3017 421 3538 446 3919 430 40510 412 390 data b;set a;diff=product1-product2;proc uni variate data=b;var diff;run;运行结果显示:符号秩和检验的p值为0.1094>0.05,故认为两复合肥无显著差异;而Wilcox on秩和检验的p值为0.0488<0.05,故认为新复合肥能显著提高小麦的产量。

5.4多种处理方法比较的Kruskal-Wallis 检验例4 (见教材例题2.10)SAS程序如下:data a;in put group $ weight@@;cards;a 164 a 190 a 203 a 205 a 206 a 214 a 228 a 257b 185 b 197 b 201 b 231c 187 c 212 c 215 c 220 c 248 c 265 c 281d 202 d 204 d 207 d 227 d 230 d 276proc npar1way data=a wilcoxon;class group;(不要加入exact语句,运行非常耗时!)var weight;run;运行结果显示 Pr > Chi-Square =0.2394>0.05 ,故认为四种食谱的营养效果无显著差异。

5.5 Friedma n 检验例5 (见教材例题 2.12)SAS程序如下:data a;in put pers on $ emoti on $ v@@;cards;p1 e1 23.1 p1 e222.7 p1 e3 22.5p1 e4 22.6p2 e1 57.6 p2 e253.2 p2 e3 53.7p2 e4 53.1p3 e1 10.5 p3 e2 9.7 p3 e3 10.8 p3 e4 8.3p4 e1 23.6 p4 e219.6 p4 e3 21.1p4 e4 21.6p5 e1 11.9 p5 e213.8 p5 e3 13.7p5 e4 13.3p6 e1 54.6 p6 e247.4 p6 e3 39.2p6 e4 37.0p7 e1 21.0 p7 e213.6 p7 e3 13.7p7 e4 14.8p8 el 20.3 p8 e2 23.6 p8 e3 16.3 p8 e4 14.8proc freq ;tables pers on *emoti on *v/scores=ra nk cmh n opri nt;run;运行结果显示p值为0.0917>0.05,故认为在催眠状态下,受试者对4种情绪状态的反应无显著差异。

5.6 列联表的独立性检验例6 (数据见教材例题) SAS程序如下:data pen alty;in put p $ d $ cou nt@@;cards;y w 19 y b 17 n w 141 n b 149proc freq data=penalty;tables p*d/chisq expected no col norow n operce nt;weight count;run;6. [ 本次实验]为了研究两种化学添加剂对电池寿命的影响,对13个同类型的电池,随机的抽取6个加入甲种添加剂,其余7个加入乙种添加剂,各组电池寿命如下(单位:小时):甲组:18 24 25 27 30 35乙组:20 21 28 32 34 38 40对a =0.10,检验两种添加剂下电池的寿命是否有显著差异。

相关主题