第十一章_非参数检验
2014-2-7 6
[例] 假设我们观测15个相配的对,获得两个差为零和13个差不为 零,其中有11个正号,2个负号,试在2.5%的显著性水平上进行单 侧检验。 [解] H0:p=0.5 H1:p (+)>p (―) 由α=0.025确定否定域,查二项分布表(附表2) P (13;13,0.5)=0.000 P (12; 13,0.5)=0.002 P (11; 13,0.5)= 0.010 P (10; 13,0.5)=0.035 P (13) + P(12)+ P (11)=0.000 + 0.002 + 0.010 =0.012<0.025 P (13) + P (12) + P (11) +P(10)= 0.012 + 0.035=0.047>0.025 所以否定域由x等于11,12,13组成。现检验统计量 x=11,
12
配对符号秩检验的零假设基本上和符号检验以及用于 配对样本的 t 检验的零假设相同。配对符号秩检验的步骤 如下:
(1) 首先求出每对数据的差值d 。
(2) 不计正负,按绝对值大小把差值d按顺序排列起来。 (3)绝对值最小者赋秩为l,第二小者赋秩为2,……,绝对
值最大者赋秩为n (其中绝对值相等者,将它们应得的秩均分
2014-2-7
21
[解] H0:专科类院校和本科类院校的环境质量无差异 H1:专科类院校和本科类院校的环境质量有差异 根据题意 R1=l+2+4+5+6+7+9+11+14+17=76 R2=3+8+10+12+13+15+16+18+19=114 代入下两式得
所以检验统计量U=min(U1,U2)=U2=2l 由α=0.05查附表10得 Uα(n1 ,n2)=U 0.05(10 ,9)=20<2l 所以不否定零假设,说明在0.05的水平上,不能认为专科类院
2014-2-7 18
(3)分别计算两样本的秩和:样本l中所有X1,X2,…, X n1的秩和 记作R1;样本2中所有Y1,Y2,…,Y n2的秩和记作R2。 (4)秩和检验是针对两个总体具有完全相同的形式的零假设而进 行检验的。在均值差检验中,研究的重点放在中心趋势的差异上, 而不是离差的差异或形式的差异。秩和检验的零假设则可以用任 何差异形式表示出来。 (5)计算检验统计量U 。检验统计量U是对混合样本中n1+ n2个元 素根据它们的秩和和它们所属的总体标出的双重指标
2014-2-7 10
第二节 配对符号秩检验
对于配对样本,至此我们已经接触了两种 检验,即符号检验和t检验。在符号检验中, 只考虑差值d的符号而不管其大小,并且应用 二项分布检验零假设。另一方面,最有力的检 验—— t 检验,则不仅需要定距尺度,而且还 要求假定差值d服从正态分布。配对符号秩检 验兼备了上述两种检验的某些特征,其效力也 介乎两者之间。
2014-2-7 16
将[例11.2.1]与[例l0.3.1]和[例11.1.2]对比,可见配对符号秩检验 的效力比符号检验的效力高得多,而很接近于t 检验的效力。理论研 究表明,对于配对样本非正态分布的差值d,配对符号秩检验是最佳 检验。 虽然本例中n 很小,但是为了说明用法,我们仍然使用正态近似
2014-2-7
15
[解] H0:T+ =|T-|,即在总体中,正秩和等于负秩和。 H1:T+ >|T-|。 前表给出了有关资料,由此又列出了配对符号 秩检验所需要的数据。根据表中数据,可以看出负 秩和小于正秩和。因此检验统计量T 取负秩和。 T =|T-|=1.5 + 4 + 8=13.5 由α=0.025,n=13,查表得单侧检验的 T0.025(13)=l7>13.5,所以否定T+ =|T-|的零假设, 即说明该实验刺激有效。
2014-2-7 2
非参数检验,无需做出经典统计所必要的
关于分布的任何假设。唯一需要的假设是:全
部数据或数据对都出自相同的基本总体,且取 样是随机的、相互独立的。基于这种原因,非 参数检验又称为分布自由(或无分布)检验。 “无
分布”不是指总体真的无分布,而是指虽有时 对
总体分布一无所知,但仍可以进行分析。不仅 如此,这些很容易理解的方法还可以用于处理
H1:p (+)>p (―)
由上例知,B(x;13,0.5)在α=0.025显著性
水平上,单侧检验(p>0.5)否定域由 x 由11, 12,13组成。 观察前表知,在13个相配的对中,10个差为 正号,3个差为负号,即检验统计量 x=10。所 以零假设 p=0.5在2.5%显著性水平上不能被拒 绝。
[例] 设评审专家对19所大专院校按校园环境质量排 名次,环境质量最好的学校记分数为1,环境质量最差的 学技记分数为19。其中10所学校是本科院校,其他9所学 校是专科院校。假定这19所学校是分别从全部大专院校 中随机地抽取的,试问:专科类院校和本科类院校的环 境质量是否有显著性差异(α=0.05)? 本科院校环境质量的名次(秩)为: 1,2,4,5,6,7,9,11,14,17 (n1=10) 专科院校环境质量的名次(秩)为: 3,8,10,12,13.15.16,18,19 (n2=9)
双侧检验 p (+)≠p (―) 很显然,符号检验就是先假设 p=0.5,按二项分布计算正号“+”
出现次数之抽样分布,然后以样本中正号“+”出现的次数 x 作为检
验统计量。如果它是B(x;n,0.5)下的小概率事件,便否定对差分 布之中位数为零的零假设,即认为两总体存在平均水平上的差别。
由此可见,符号检验是二项检验的一种实际应用。
2014-2-7
19
检验统计量U是U1和U2中较小的一个,即U= min(U1,U2),然后用下式核对计算
U1 + U2 =n1 n2
(6)给出显著性水平α,从秩和检验表(附表10)中 查出临界值Uα,如果计算出的U值小于或等于从附表10 中查出的临界值Uα(n1 ,n2),则零假设被拒绝。
2014-2-7 20
2014-2-7 11
配对符号秩检验对于非正态分布的d 值,是
最佳检验,其检验效力大大高于符号检验。如
果 t 检验的假定成立,配对符号秩检验的检验
效力对于大、小样本都近乎为95%。因此,在
定距尺度测量的水平上,若由于样本容量太小 而不能假定正态分布的时候,配对符号秩检验 特别有用。
2014-2-7
之),再在差值前补填上符号。 (4)求得正差值的秩和T+ 及负差值的秩和T- 。我们期望 两个秩和应该近似相等。如果T+和T-相差太大,就应该否定 零假设。
2014-2-7
13
(5)取两个秩和中较小的一个,即T=min(T+ ,|T-|), 作为检验统计量。 (6)给定显著性水平α。如果n小,从配对符号秩检验 表(附表9)中直接查出临界值Tα(n)。如果n大(n>25),就 要应用正态近似法,查出Zα(单侧检验)或Zα/2(双侧检验), 同时检验统计量Z按下式计算
2014-2-7 的是各个对的结果要相互独立。 5
符号检验的零假设就是配对观察结果的差平均起来等于零:人们 期望这些差中有一半小于零(负号),而另一半大于零(正号),因此
符号检验就是对差分布之中位数为零的零假设检验。现将符号检验
的零假设和备择假设表达如下 H0:p (+)=p (―)=0.5
H1:单侧检验 p (+)>p (―)或 p (+)<p (―)
2014-2-7 1
与均值差等检验比较,非参数检验有什么优点呢? 在对均值差进行t 检验时,不仅要有定距尺度的假定, 还要有正态总体的假定。当然,对于大样本,正态总体 的假定可以放松。但正是对于小样本,这种假定最容易 出问题。因此,在满足下面两条件之一时,我们期望用 非参数检验代替均值差检验:①没有根据采用定距尺 度,但可以安排数据的顺序(即秩);②样本小且不能假 定具有正态分布。由于非参数检验不能充分利用全部现 有的资料信息。因此,如果有根据采用定距尺度,并且 如果对于小样本能够假定其具有正态性,或对大样本能 够放松对正态性假定的要求,一般宁愿使用均值差检 验,而不用非参数检验。
法计算一下检验统计量
在单侧检验中,Zα=Z0.025=1.96<2.24,我们可以否定零假
设。但必须指出,正态近似计算法没有把同数值(或同分对)的情
况考虑在内而作出修正。因此,它在同数值的数目很大时不能使用。
2014-2-7 17
第三节 秩和检验
前面我们刚刚讨论过的符号检验和配对符号秩检 验,都只适用于配对样本。当样本为独立样本时,可采 用本节所讨论的秩和检验法。其具体步骤为:
单一实验组的实验中,对于样本中每个个体的前测与后测, 如果我们并不关心(X1―X0)的具体数值,而只关心是增大 了还是减小了。具体来说,就是只研究差值 d 的符号,即 若X1>X0,记作“+”; 若X1<X0,记作“―”; 若X1=X0,删去。
那么我们面对的就将是配对样本的“符号检验”问题
了。“符号检验”并不要求配对样本出自同一个总体,重要
所以零假设 p=0.5在2.5%显著性水平上被拒绝。
2014-2-7 7
[例] 随机地选择13个单位,放映一部描述吸烟有害于身体健康 的影片,下表中的数字是各单位认为吸烟有害身体健康的职工的百分 比,现试在0.05显著性水平上,用符号检验检验实验无效的零假设。
2014-2-7
8
[解 ]
H0:p=0.5
数检验在使用100个数据时的效力等 于t检验(在正确模型条件下)使用95 个数据的效力。
2014-2-7
检验力又称检验势, 它是用1―β或[1―(犯 第二类错误的概率)] 来定义的。也就是说, 对于固定的样本容量, 检验能够否定错误假 设的能力越大,其相 对检验力越大。