当前位置:文档之家› 非参数假设检验

非参数假设检验

明买该光盘与性别的关系不显著。
三、秩和检验(等级和检验)
参数中均值检验在小样本时是如何处理的——要求总体 服从正态分布,当总体不符合正态分布时如何处理?转换成 等级,然后检验,这一类的检验统称为秩和检验。
(一)曼-惠特尼U检验
1.什么是曼-惠特尼U检验。它假设两个样本分别来自两个总 体,目的是检验这两个总体的均值是否有显著的差别。
解:本例中的观测值以月为组,共分为m=6组,每
月的销售台数即为观测的频数 vi ,观测的总次数
为n=150。现欲检验是否服从(离散的)均匀分布, 即每月的销售量是否为
ei
nPi
150 6
25(台),
Pi
1 ,i 6
1,L
,6
为此,设
H0 :洗衣机销售量服从均匀分布;
H1 :并不服从均匀分布;
计算 2 统计量的值:
要求用a=0.05的显著性水平检验顾客的性别和购买金额是否独立。
解:
H0 :购物的金额大小与性别无关(独立); H1 :购物的金额大小与性别有关。
计算列联表各格的理论值:
eij
ric j n
e11
(106)(260) 548
50.29
e12
(210)(260) 548
99.46
(232)(260)
估计的参数的个数。
第四步:根据显著性水平a查 2 分布表求相应的
临界值——2 a
2
2 a
时,拒绝原假设,说明样本观
测并非来自该理论分布。
【例6.10】某百货公司的电器部下半年各月洗衣机 的销售数量如下:
该电器部经理想了解洗衣机的销售数量是否在 各月是均匀分布的,也就是说各月中销售数量的差 别可以归结为随机原因,这样可以为以后的进货提 供依据。要求以a=0.05 的显著性水平进行检验。
列的概率根据样本计算应该是 (c1 / n)
根据概率论的原理,如果行和列的变量是独立的,那
么落入第1行和第1列的概率应该是(r1 / n)(c1 / n) ,
由于样本量为n,则落入第1行第1列的理论频数应该

e11
n( r1 n
)( c1 n
)
r1c1 n
由此可以推广到
eij
2
在独立性检验中的
n( ri )(c j nn
要求以显著性水平a=0.05检验两学校的素质教育有没有差别。 解:我们假设两个学校的素质教育除了平均水平以外在
其他方面没有差异。我们需要检验
H0 :两校素质教育水平无差异。 H1 :两校素质教育水平有差异。
计算U值:
U 15 25 (15)(16) 333 162 2
U的均值和标准差分别为 E(U ) n1n2 187.5
n , n 对于 1 2都比较小的情形,可以查附表6得到临界值Ua ,
在 U Ua 时,拒绝H0 : 1 2 。在原假设为真的情况下,可
以证明随机变量U的均值和方差分别为
E(U ) n1n2 2
D(U ) n1n2 (n1 n2 1) 12
并且当 n1 和n2都不小于10时,随机变量
Z U E(U ) D(U )
令a=0.05,用 2独立性检验推断购买某种光盘与性别是否有关?
解: H0 :购买与性别无关,H1 :购买与性别有关。
现采用两种方法计算 2 值。
2
( f e)2 (32 26)2 (118 124)2
e
26
124
(20 26)2 (130 125)2
26
124
1.3846 0.2903 1.3846 0.2903
(106)(288)
e13 548 110.07 e21 548 55.71
e22
(210)(288) 548
110.36
e23
(232)(288) 548
121.93
并列入列联表各格的括号内。计算 2 值
2 (40 50.29)2 (90 99.64)2 (130 110.07)2
近似地服从标准正态分布。
设第一个总体的均值为1 ,第二总体的均值为2 ,
则对于
H0 : 1 2
H1 : 1 2
如果Z
Z
,
则拒绝H

0
对于H0 : 1 2
H1 : 1 2
如果Z
Z
,
则拒绝H

0
对于H0 : 1 2
H1 : 1 2
如果 Z Z ,则拒绝H0
【例6.14】为了比较两个小学贯彻素质教育的情况,现从甲学 校抽15名学生,乙学校抽25名学生,按素质教育的要求进 行测试并评分,按评分高低顺序排队并编上等级,其结果 如下:
二、 2检验
(一)分类数据的拟合优度检验
1.如何探讨数据规律
显示数据规律性的方法:频数分布表,能否了 解数据来自某一分布或与某一理论分布相一致的程
度如何?------ 2检验
直方图和统计量的检测可能给出了一些探 索性的假设。然而,这些应该用一些较为正规 的方式来加以论证。拟合优度检验给出了统计 意义上的证据来检验有关分布的假设。最为通 用的拟合优度检验是卡方检验。
1.什么是威尔科克森带符号的秩检验?它只要求数据之差所 服从的分布是对称分布。目的是检验成对观测的数据之差 是否来自均值为0的总体,或产生数据的两个总体是否具 有相同的均值。
2.具体步骤。
第一步:求出成对观测数据的差di ,并将其绝对值按
统计量为
)
ric j n
r
2
c ( fij eij )2
i1 j1
eij
【例6.12】某副食品商店欲研究顾客的性别与购物金额大小之间 是有关系,还是没有关系(意味着相互独立)。在该商店内 随机调查了548位顾客,按金额大小和性别进行分类,取得 如下数据(见表6.3):
表6.3顾客的性别与购买金额列联表(括号内是理论频数 eij )
(二) 2 分布的独立性检验
拟合优度检验是根据样本观测值与一个理 论值进行比较来检验的,但是有些数值并不知 道服从何种理论分布。因此在双边量的分布中, 有时想了解两个变量是相依的还是独立的。卡 方检验可用于这样的检验,称作卡方的独立性 检验。
这种情况下可以使用列连表进行分析,并 用卡方进行独立性检验。列连表是一个表示两 个分类变量的r行c列的矩阵。
第二步:分别求两个样本的等级和。设第一个样本的等级和
为 W1,第二个样本的等级和为W2 ,则有 W1 W2 n(n 1) / 2
第三步:计算曼-惠特尼U检验统计量
U1
n1n2
n1(n1 1) 2
W1
U2
n1n2
n2 (n2 2
1)
W2
U U 从 U1 和 2 中选择较小者并称其为 。
第四步:作出判断
50.29
99.64
110.07
(66 55.71)2 (120 110.36)2 (102 121.93)2
55.71
110.36
50.29
2.105 0.933 3.609 1.901 0.842 3.258
12.648
2×3列联表的自由度为(r-1)(c-1)=2,
当a=0.05时,
2 0.05
5.991
2
2 0.05
H0 ,拒H绝1
的金额大小与性别有关。
,接受
,即购物
2×2列联表的χ2值计算还可以简化,为了说明方便,将列联表 每格的数字用字母表示
2
n(ad bc)2
(a c)(b d )(a b)(c d )
【例6.13】某市场调研机构,调查某种光盘的购买者和性别 之间是否有关系取得如下数据:
(17.1 24)2 (12.52 5)2 11.52
14.96
14.96
自由度为m-1-1=5-1-1=3,临界值
2 0.05
(3)
7.185
所以拒绝H0 ,说明每分钟通过收费站的汽
车辆数不服从泊松分布。
在应用 2 分布拟合优度检验时,应注意每一类
中理论频数不宜过小,通常应不小于5。如果出现理 论频数太低,就应当与邻近的类进行合并。
第三节 非参数假设检验
▪ 我们已讨论的假设检验是建立在假定样 本来自的总体是正态分布的。当没有这 个假定或不成立时,这些检验的结论就 可能被质疑。为了解决该问题,统计学 家发展了无需上述假定的非参数检验。
一、非参数假设检验
1.定义:它泛指参数假设检验以外的 各种检验。
2.特点: (1)非参数检验不依赖于总体分布。 (2)非参数假设检验适用于较低的计 量水平,如等级、顺序的计量等。 (3)常常用于参数以外的检验,如随 机变量是否服从某种规律、某种分 布的拟合优度检验,数据是否随机 的游程检验等。
2.具体步骤。
第一步:把两组数据混和在一起,按照大小顺序编排等级。 最小的为1,其次为2等等,两个数据和三个数据相等如 何处理?
若有两个数据相等,且它们在按大小顺序编排好的数列里 是第m和第m+1个数据,则它们的等级(也称作秩)都是m+ (m+1)/2=2m+1/2。同理,若有3个数据相等,且它们在按大 小顺序编排好的数据列里第m,第m+1和第m+2位数据,则它们 的等级都是3m+3/3=m+1。
所以拒绝H0,说明下半年各月销售量与均
匀分布有差别,这些差别尚不能完全归结为随机
原因。
【例6.11】在高速公路收费站100分钟内观测到通过 收费站的汽车共190辆,每分钟通过的汽车辆 数分布如下表:
用显著性水平a=0.05检验这些数据是否来自泊松分布。 解:设
H0 :汽车通过收费站的辆数服从泊松分布; H1 :不服从泊松分布。
2
相关主题