第一节 非参数检验的基本概念及特点一、非参数检验(一)什么是“非参数”非参数模型:缺乏总体分布模式的信息。
(二)非参数检验的定义非参数检验:不需要假设总体是否为正态分布或方差是否为齐性的假设检验称非参数检验。
(三)非参数检验的优点和缺点: 1、优点:一般不涉及总体参数,其假设前提也比参数假设检验少得多,适用面较广。
计算简便。
2、缺点:统计效能远不如参数检验方法。
由于当数据满足假设条件时,参数统计检验方法能够从其中广泛地充分地提取有关信息。
非参数统计检验方法对数据的限制较为宽松,只能从中提取一般的信息,相对参数统计检验方法会浪费一些信息。
(四)非参数检验的特点: 1、它不需要严格的前提假设; 2、特别适用于顺序数据; 3、适用于小样本,且方法简单;4、最大的不足是不能充分利用资料的全部信息;5、不能处理“交互作用”,即多因素情况。
第二节 两个独立样本的非参数检验方法一、秩和检验法秩和即秩次的和或等级之和。
秩和检验法也叫Mann-Whitney-Wilcoxon 检验,它常被译为曼-惠特尼-维尔克松检验,简称M-W-W 检验,也称Mann-Whitney U 检验。
秩和检验法与参数检验法中独立样本的t 检验法相对应。
当“总体正态”这一前提不成立时,不能用t 检验,可以用秩和检验法。
(一)秩统计量秩统计量指样本数据的排序等级。
假设从总体中反复抽取样本,就能得到一个对应于样本容量1n 和2n 的秩和U 的分布。
这是一个间断而对称的分布,当1n 和2n 都大于10时,秩和T 的分布近期近似正态分布,其平均数和标准差分别为()21211++=n n n T μ ()1212121++=n n n n T σ其检验值为TTσμ-=T Z(二)计算过程1、小样本:两个样本容量均小于10(n 1≤10,n 2≤10)例11-1:在一项关于模拟训练的实验中,以技工学校的学生为对象,对5名学生用针对某一工种的模拟器进行训练,内外让6名学生下车间直接在实习中训练,经过同样的时间后对两组人进行该工种的技术操作考核,结果如下:模拟器组:56,62,42,72,76实习组:68,50,84,78,46,92假设两组学生初始水平相同,则两种训练方式有无显著差异?表11-1 两种训练方式的成绩考核成绩 成绩排列 等级 等级和模拟器组 (5人)56 42 1 251=T62 56 4 42 62 5 72 72 7 76 76 8 实习组 68 46 2 412=T(6人)50 50 3 84 68 6 78 78 9 46 84 10929211检验过程:1.建立假设0H :∑∑=21R R ,即两样本无显著差异 a H :∑∑≠21R R ,即两样本有显著差异2.计算统计量1)将数据从小到大排列,见上表。
2)混合排列等级,即将两组数据视为一组进行等级排列,见上表。
3)计算各组的秩和,并确定T 值,即 T = min (T 1,T 2)=min (25,41)=25 3.比较与决策若T 1<T <T 2,则接受虚无假设,拒绝研究假设。
若T ≤T 1,或T ≥T 2,拒绝虚无假设,接受研究假设。
查秩和检验表,当n 1=5,n 2=6, T 1=19,T 2=41, 因为 19<25<41, 即T1<T<T2, 所以接受虚无假设,拒绝研究假设,差异不显著。
说明两种训练的成绩无显著差异。
2、大样本:两个样本容量均大于10(n 1>10,n 2>10)例11-2:对某班学生进行注意稳定性实验男生与女生的实验结果如下,试检验男女生之间注意稳定性有否显著差异?男生:(n 1=14)19,32,21,34,19,25,25,31,31,27,22,26,26,29 女生:(n 2=17)25,30,28,34,23,25,27,35,30,29,29,33,35,37,24,34,32 检验过程: 1.建立假设0H :∑∑=21R R a H :∑∑≠21R R2.计算统计量1)求秩和T 。
先混合排列等级,再计算1T 和2T ,最后确定T 。
排序如下: 男生:,,,,,,,,,,,,,,17 5.11 5.11 4 5.13 5.21 5.21 5.8 5.8 5.1 27 3 5.23 5.1 女生5.23 27 6 31 5.29 25 17 17 5.19 5.29 5.13 5.8 5 27 15 5.19 5.8,,,,,,,,,,,,,,,,175.115.1145.135.215.215.85.8 5.1 273 5.23 5.1T +++++++++++++=174=2)求Z 值98.12.25224174-T Z TT-=-==σμ3.比较与决策2/05.098.1Z Z 〉=,05.0〈p ,拒绝虚无假设,差异达到显著性水平。
说明男女在注意稳定性上有显著差异。
二、中数检验法 (一)适用条件中数检验法对应着参数检验中两独立样本平均数之差的t 检验。
中数检验法的基本思想是将中数作为集中趋势的量度,检验不同的样本是否来自中位数相同的总体。
因而其虚无假设(H0)为:两个独立样本是从具有相同中数的总体中抽取的,它也可以是双侧检验或单侧检验。
双侧检验结果若有统计学意义,意味着两个总体中数有差异(并(),2242)11714(1421n n n 211T =++⨯=++=μ()2.2512)11714(1714211n n n n 2121T =++⨯⨯=++=σ没有方向);单侧检验结果若有统计学意义,则表明对立假设“一个总体中数大于另一个总体中数”成立。
(二)计算过程例题13-8:为了研究核糖核酸是否可以作为记忆的促进剂,研究者以老鼠为对象分成实验组与控制组。
实验组注射RNA ,控制组注射生理盐水,然后在同样的条件下学习走迷津,如果如下(单位:时间)。
试问两组的学习成绩有无显著差异?实验组:16.7,16.8,17.0,17.2,17.4,16.8,17.1,17.0,17.2,17.1,17.2,17.5,17.2,16.8,16.3,16.9控制组:76.6,17.2,16.0,16.2,16.8,17.1,17.0,16.0,16.2,16.5,17.1,16.2,17.1,16.8,16.51.提出假设0H :mdn mdn B A =,即两组中位数相等,或两组成绩无显著差异 a H :mdn mdn B A ≠,即两组中位数不等,或两组成绩有显著差异2.计算统计量1)求混合中数。
将数据按大小排列,确定中数。
表13-11 中数计算表16 16.2 16.3 16.5 16.6 16.7 16.8 16.9 17 17.1 17.2 17.4 17.5 f2 3 1 2 1 1 5 1 4 4 5 1 1 F2 568910151620242930319.1616213121====++X X X Mdn N2)统计多个样本在中数上下的次数,列出列联表。
表13-12 计数表实验组 控制组 ∑>Mdn 的次数 10 5 15 <Mdn 的次数5 10 15 ∑1515303)求2χ值()33.3151515155510103022=⨯⨯⨯⨯-⨯⨯=χ3.比较与决策33.32=χ<()84.3205.01=χ,p >0.05,差异不显著,接受虚无假设,拒绝研究假设。
说明实验组与控制组在迷津学习中差异不显著,即RNA 对记忆无明显的促进作用。
第三节 配对样本的非参数检验方法一、符号检验法(一)、适用条件符号检验是以正负符号作为资料的一种非参数检验程序。
它是一种简单的非参数检验方法,适用于检验两个配对样本分布的差异,与参数检验中配对样本差异显著性t 检验相对应。
符号检验也是将中数作为集中趋势的量度,虚无假设是配对资料差值来自中位数为零的总体。
它是将两样本每对数据之差(Xi —Yi )用正负号表示,若两样本没有显著性差异,理论上正负号应各占一半或不相上下。
相反,若正负个数相关较大,则可能存在差异,由此表明两个样本不是来自同一总体,并可推论两样本的总体存在差异。
(二)、计算过程1、小样本符号检验法N ≤25例11-4:用配对设计方法对9名运动员不同方法训练,每一个对子中的一名运动员按传统方法训练,另一名运动员接受新方法训练。
课程进行一段时间后对所有运动员进行同一考核,结果如下。
能否认为新训练方法显著优于传统方法配对 1 2 3 4 5 6 7 8 9 传统(X ) 85 88 87 86 82 82 70 72 80 新法(Y ) 90 84 87 85 90 94 85 88 92 符号(X-Y ) -++-----1)建立假设 单侧检验0H :+P <-P a H :+P >-P2)标记配对数据之差的符号。
见上表。
3)统计符号总数N 。
符号总数中不包含0,只包括正号和负号个数和,即-++=n n N = 2 + 6 = 84)将+n ,-n 中的较小者记为r ,即()-+=n n r ,m in 5)比较与决策根据符号总和N 及显著水平值α查符号检验临界值表,见附表15。
表中列出了符号总和与显著性水平α所对应的临界值αr ,其判断规则如下表。
表11-2 单侧符号检验法的方法的统计判断规则表r 与临界值(CR )比较P 值 差异显著性 r >r 0.05P >0.05不显著2==+nr 0.01<r ≤r 0.05r ≤r 0.010.01<P ≤0.05P ≤0.01显 著 极显著查附表15,N=8时,临界值为0(0.05水平),而实得r = n += 2> r 0.05。
所以差异不显著,接受虚无假设,不能认为新法显著优于传统方法。
2、样本容量N>25时在附表15中,虽然N 是从1到90,就是说N 在这个范围内时都可以用查附表15的方法,但是在世纪中当N>25时常常使用正态近似法。
将N 分为n+和n-两部分,为二项分布,根据二项分布的原理,有21==-+q p ,N Np 21==μ,22121N N Npq =⨯⨯==σ σμ-=r Z 22N N r -= 为了更接近正态分布,采用较正公式,即()2205.0N Nr Z -+=例11-5:在教学评价活动中,要求学生对教师的教学进行7点评价(即1-7分),下表是某班学生对一位教师期中与期末的两次评价结果,试问两次结果差异是否显著?①建立假设0H :-+=P P a H :+P ≠-P②确定正、负号数目,正负号总数N 的r 值8=+n ,19=-n ,27=+=-+n n N ,8)19,8min(==r③计算统计量92.12/272/27)5.08(-=-+=Z④比较与决策2/05.092.1Z Z 〈=p >0.05,接受虚无假设,差异不显著。