当前位置：文档之家› 非参数假设检验

非参数假设检验

明买该光盘与性别的关系不显著。
三、秩和检验（等级和检验）
参数中均值检验在小样本时是如何处理的——要求总体服从正态分布，当总体不符合正态分布时如何处理？转换成等级，然后检验，这一类的检验统称为秩和检验。
（一）曼-惠特尼U检验
1.什么是曼-惠特尼U检验。它假设两个样本分别来自两个总体，目的是检验这两个总体的均值是否有显著的差别。
解：本例中的观测值以月为组，共分为m=6组，每
月的销售台数即为观测的频数 vi ，观测的总次数
为n=150。现欲检验是否服从（离散的）均匀分布，即每月的销售量是否为
ei
nPi
150 6
25(台),
Pi
1 ,i 6
1,L
,6
为此，设
H0 ：洗衣机销售量服从均匀分布；
H1 ：并不服从均匀分布；
计算 2 统计量的值：
要求用a=0.05的显著性水平检验顾客的性别和购买金额是否独立。
解：
H0 ：购物的金额大小与性别无关（独立）； H1 ：购物的金额大小与性别有关。
计算列联表各格的理论值：
eij
ric j n
e11
(106)(260) 548
50.29
e12
(210)(260) 548
99.46
(232)(260)
估计的参数的个数。
第四步：根据显著性水平a查 2 分布表求相应的
临界值——2 a
2
2 a
时，拒绝原假设，说明样本观
测并非来自该理论分布。
【例6.10】某百货公司的电器部下半年各月洗衣机的销售数量如下：
该电器部经理想了解洗衣机的销售数量是否在各月是均匀分布的，也就是说各月中销售数量的差别可以归结为随机原因，这样可以为以后的进货提供依据。要求以a=0.05 的显著性水平进行检验。
列的概率根据样本计算应该是 (c1 / n)
根据概率论的原理，如果行和列的变量是独立的，那
么落入第1行和第1列的概率应该是(r1 / n)(c1 / n) ，
由于样本量为n，则落入第1行第1列的理论频数应该
是
e11
n( r1 n
)( c1 n
)
r1c1 n
由此可以推广到
eij
2
在独立性检验中的
n( ri )(c j nn
要求以显著性水平a=0.05检验两学校的素质教育有没有差别。解：我们假设两个学校的素质教育除了平均水平以外在
其他方面没有差异。我们需要检验
H0 ：两校素质教育水平无差异。 H1 ：两校素质教育水平有差异。
计算U值：
U 15 25 (15)(16) 333 162 2
U的均值和标准差分别为 E(U ) n1n2 187.5
n , n 对于 1 2都比较小的情形，可以查附表6得到临界值Ua ，
在 U Ua 时,拒绝H0 : 1 2 。在原假设为真的情况下,可
以证明随机变量U的均值和方差分别为
E(U ) n1n2 2
D(U ) n1n2 (n1 n2 1) 12
并且当 n1 和n2都不小于10时，随机变量
Z U E(U ) D(U )
令a=0.05，用 2独立性检验推断购买某种光盘与性别是否有关？
解： H0 ：购买与性别无关，H1 ：购买与性别有关。
现采用两种方法计算 2 值。
2
( f e)2 (32 26)2 (118 124)2
e
26
124
(20 26)2 (130 125)2
26
124
1.3846 0.2903 1.3846 0.2903
(106)(288)
e13 548 110.07 e21 548 55.71
e22
(210)(288) 548
110.36
e23
(232)(288) 548
121.93
并列入列联表各格的括号内。计算 2 值
2 (40 50.29)2 (90 99.64)2 (130 110.07)2
近似地服从标准正态分布。
设第一个总体的均值为1 ，第二总体的均值为2 ，
则对于
H0 : 1 2
H1 : 1 2
如果Z
Z
,
则拒绝H
；
0
对于H0 : 1 2
H1 : 1 2
如果Z
Z
,
则拒绝H
；
0
对于H0 : 1 2
H1 : 1 2
如果 Z Z ,则拒绝H0
【例6.14】为了比较两个小学贯彻素质教育的情况，现从甲学校抽15名学生，乙学校抽25名学生，按素质教育的要求进行测试并评分，按评分高低顺序排队并编上等级，其结果如下：
二、 2检验
（一）分类数据的拟合优度检验
1.如何探讨数据规律
显示数据规律性的方法：频数分布表，能否了解数据来自某一分布或与某一理论分布相一致的程
度如何？------ 2检验
直方图和统计量的检测可能给出了一些探索性的假设。然而，这些应该用一些较为正规的方式来加以论证。拟合优度检验给出了统计意义上的证据来检验有关分布的假设。最为通用的拟合优度检验是卡方检验。
1.什么是威尔科克森带符号的秩检验？它只要求数据之差所服从的分布是对称分布。目的是检验成对观测的数据之差是否来自均值为0的总体，或产生数据的两个总体是否具有相同的均值。
2.具体步骤。
第一步：求出成对观测数据的差di ，并将其绝对值按
统计量为
)
ric j n
r
2
c ( fij eij )2
i1 j1
eij
【例6.12】某副食品商店欲研究顾客的性别与购物金额大小之间是有关系，还是没有关系（意味着相互独立）。在该商店内随机调查了548位顾客，按金额大小和性别进行分类，取得如下数据（见表6.3）：
表6.3顾客的性别与购买金额列联表（括号内是理论频数 eij ）
（二） 2 分布的独立性检验
拟合优度检验是根据样本观测值与一个理论值进行比较来检验的，但是有些数值并不知道服从何种理论分布。因此在双边量的分布中，有时想了解两个变量是相依的还是独立的。卡方检验可用于这样的检验，称作卡方的独立性检验。
这种情况下可以使用列连表进行分析，并用卡方进行独立性检验。列连表是一个表示两个分类变量的r行c列的矩阵。
第二步：分别求两个样本的等级和。设第一个样本的等级和
为 W1，第二个样本的等级和为W2 ，则有 W1 W2 n(n 1) / 2
第三步：计算曼-惠特尼U检验统计量
U1
n1n2
n1(n1 1) 2
W1
U2
n1n2
n2 (n2 2
1)
W2
U U 从 U1 和 2 中选择较小者并称其为。
第四步：作出判断
50.29
99.64
110.07
(66 55.71)2 (120 110.36)2 (102 121.93)2
55.71
110.36
50.29
2.105 0.933 3.609 1.901 0.842 3.258
12.648
2×3列联表的自由度为(r-1)(c-1)=2,
当a=0.05时,
2 0.05
5.991
2
2 0.05
H0 ,拒H绝1
的金额大小与性别有关。
，接受
，即购物
2×2列联表的χ2值计算还可以简化，为了说明方便，将列联表每格的数字用字母表示
2
n(ad bc)2
(a c)(b d )(a b)(c d )
【例6.13】某市场调研机构，调查某种光盘的购买者和性别之间是否有关系取得如下数据：
(17.1 24)2 (12.52 5)2 11.52
14.96
14.96
自由度为m-1-1=5-1-1=3，临界值
2 0.05
(3)
7.185
所以拒绝H0 ，说明每分钟通过收费站的汽
车辆数不服从泊松分布。
在应用 2 分布拟合优度检验时，应注意每一类
中理论频数不宜过小，通常应不小于5。如果出现理论频数太低，就应当与邻近的类进行合并。
第三节非参数假设检验
▪ 我们已讨论的假设检验是建立在假定样本来自的总体是正态分布的。当没有这个假定或不成立时，这些检验的结论就可能被质疑。为了解决该问题，统计学家发展了无需上述假定的非参数检验。
一、非参数假设检验
1.定义：它泛指参数假设检验以外的各种检验。
2.特点: (1)非参数检验不依赖于总体分布。 (2)非参数假设检验适用于较低的计量水平，如等级、顺序的计量等。 (3)常常用于参数以外的检验，如随机变量是否服从某种规律、某种分布的拟合优度检验，数据是否随机的游程检验等。
2.具体步骤。
第一步：把两组数据混和在一起，按照大小顺序编排等级。最小的为1，其次为2等等，两个数据和三个数据相等如何处理?
若有两个数据相等，且它们在按大小顺序编排好的数列里是第m和第m+1个数据，则它们的等级（也称作秩）都是m+ （m+1）/2=2m+1/2。同理，若有3个数据相等，且它们在按大小顺序编排好的数据列里第m，第m+1和第m+2位数据，则它们的等级都是3m+3/3=m+1。
所以拒绝H0，说明下半年各月销售量与均
匀分布有差别，这些差别尚不能完全归结为随机
原因。
【例6.11】在高速公路收费站100分钟内观测到通过收费站的汽车共190辆，每分钟通过的汽车辆数分布如下表：
用显著性水平a=0.05检验这些数据是否来自泊松分布。解：设
H0 ：汽车通过收费站的辆数服从泊松分布； H1 ：不服从泊松分布。
2

e商务文档

非参数假设检验

相关文档推荐：