当前位置：文档之家› 第二章非参数统计分析

第二章非参数统计分析

SPSS的数据格式合格品 1 0 频数 20 5
表中的“1”表示合格品；“0”表示不合格品
23:39 16
(SPSS binomial test)
第 1 步：指定 “ 频数 ” 变量：点击【Data】【Weight-Cases】，将“频数”选入【Frequency Variable】【OK】第2步：选择【Analyze】【Nonparametric
H 0 : 0 : H1 : 0 H 0 : 0 : H1 : 0
23:39
13
【练习1】盒中有5种球，重复抽取200次（每次抽1个球）各种球出现的次数见下表。问盒中5 种球的个数是否相等？显著水平α=0.05。
种别 1 2 3 4 5 ∑
23:39
fi 35 40 43 38 44 200
14
第二节二项分布检验
二项分布检验(binomial test)是通过考察二分类变量的每个类别中观察值的频数与特定二项分布下的期望频数之间是否存在显著差异，来判断抽取样本所依赖的总体是否服从特定概率为p的二项分布。
为总体的分布函数为 F0 x 。
23:39
10
卡方检验的窗口，SPSS的卡方检验主要用来检验离散随机变量的分布。
23:39
11
卡方检验的窗口。
23:39
12
X 1 2 3 4 Total Observed N 380 69 43 8 500 Expected N 400.0 60.0 35.0 5.0 Residual -20.0 9.0 8.0 3.0
23:39
4
一、χ2拟合优度检验
在实际问题中，会遇到必须了解总体的分布函数的时候，这时利用样本资料对总体的分布函数进行检验就成了非常重要的了。
我们需要检验总体的分布函数F(x)是否等于某个给
定的函数 F0(x) ，可以根据经验来确定。其中含有未知参数时，应利用样本资料采用点估计求得后，再进行检验。
H 0 : p1 80%, p2 12%, p3 7%, p4 1% H1 : pi pi 0
23:39 6
类型 A 380
fi
npi (ei )
400
fi npi ( fi npi ) 2
-20 400
( fi npi ) 2 npi
1.00
B
C D 合计
69
43 8 500
60
35 5 500
9
8 3 __
81
64 9 __
1.35
1.83 1.80 5.98
根据显著性水平，有
2 (3) 7.82 ，由于
2 Q 5.98 (3) 7.82
表明5%的显著水平下，不能拒绝原假设，即观测的比率与期望的比
率一致。 23:39
7
如果分布是连续的其检验步骤为：
12.2 12.4 10.8 11.3 12.0 12.2 11.8 12.0 11.9 12.3
检验该供货商生产的配件长度是否服从正态分布？(=0.05)
23:39
22
总体分布类型的检验
(SPSS K-S检验)
第1步：选择【Analyze】【Nonparametric
Test】【1-Sample K-S】进入主对话框；第2步：将待检验的变量选入【Test Variable List】(本例为“配件长度”)；第3步：点击【Exact】，并在对话框中选择【Exact】，点击【OK】。
检验的统计量可以取B。
在原假设为真的条件下，B服从参数为n和0.5的二项分布 b(n,0.5)。由于原假设为真时，B应该不太大，也不太小，如
23:39 果B太大或太小，应该拒绝原假设。 27
一、精确中位数的符号检验
精确的符号检验是指检验的p值是由精确的概率给出
的。我们利用正号和负号的数目，来检验某假设，这是
23:39
3
第一节 Chi-Square test 卡方检验
卡方检验通常称为拟合优度检验。主要是通过样本观测值检验总体是否服从某个分布。如果数据是连续的，需要将连续的分布进行分段，计算每段的期望概率与观测到的频率之间是否差异很大。在SPSS中的Chi-Square test ，主要是对离散的总体进行拟合优度检验。
23:39
20
检验统计量
D max | Fn ( x) F0 ( x) |
当H0成立且无抽样误差时，统计量D等于0。因此：当D的实际观测值较小时，可以认为零假设H0成立；当D的观测值较大时，则零假设H0可能不成立。其中Fn（x）称为经验分布。假定有样本1，1，2，2，2，4，5，5，5，10。其经验分布为 x 1 0
23:39
5
【例1】某金融系统贷款的偿还类型有四种，各种的预期还率为80%、12%、7%和1%。在一段时间的观察记录中，A型按时偿还的有380笔、B型偿还有69笔、C型有
43笔、D笔有8笔。问在5%显著性水平上，这些结果与预
期的是否一致。α＝0.05。解：这个问题属于要检验每一类型的出现概率与理论期望概率是否相等，即检验
（1）提出统计假设 H 0：F x F0 x 由统计假设出发，将总体取值范围分为m个互不相
容的小区间：t0，t1 t1，t2 tm 1，tm
区间个数以7~14为宜。然后，统计出每个区间内样本点的数目fi，再用pi表示变量在第i个区间的概率，
23:39
8
23:39
31
符号检验的思路，记
成功：X-0大于零，即大于中位数M，记为“+”；
失败：X-0小于零，即小于中位数M，记为“-”。
令
S+=得正符号的数目
S－=得负符号得数目
可以知道S+或S— 均服从二项分布B（65，0.5）。则可以
用来作检验的统计量。其假设为：
H 0 : 0 : H1 : 0
二项分布检验的原假设是：抽取样本所依赖的总体与特定的二项分布无显著差异。
如果检验的p值小于0.05，则拒绝原假设。
23:39
15
【例2】根据以往的生产数据，某种产品的合格率为90%。现从中随机抽取25个进行检测，合格品为20个。检验该批产品的合格率是否为90%？(产品合格率X~B(n,0.9))
23:39 29
Histogram of x
Frequency
0 20
2
4
6
8
10
40
60 x
80
100
120
23:39
30
通常在正态总体分布的假设下，关于总体均值的假设检验和区间估计是用与t检验有关的方法进行的。然而，在本例中，总体分布是未知的。为此，首先看该数据的直方图从图中很难说这是什么分布。假定用总体中位数来表示中间位置，这意味着样本点，取大于me 的概率应该与取小于me 的概率相等。所研究的问题，可以看作是只有两种可能“成功”或“失败”。
Test Statistics Chi-Squarea df Asymp. Sig. X 5.979 3 .113
P值大于0.05，结果说明还贷情况与预期是一致的。
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 5.0.
Tests-Binomial】选项进入主对话框第3步：将待检验的变量选入【Test Variable List】(本例为“合格品”) 第4步：在【Test Proportion】中输入检验的概率 (本例为0.9)，点击【OK】
23:39 17
SPSS的输出结果
23:39
表中的合格品的观察比例为0.8，检验比例为0.9。精确单尾概率为0.098，它表示如果该批产品的合格率为0.9，那么25个产品中合格品数量小于等于20个的概率为0.098。P>0.05,不拒绝原假设，没有证据表明该批产品的合格率不是 0.9 18
20
35
16
8
7
5
利用SPSS检验该数据可能的分布。用SPSS，在正态、均匀、指数和泊松分布中选择。
23:39 26
第四节符号检验
符号检验的统计量为B=得正号的个数。符号检验。设随机变量X1，…，Xn是从某个总体
X中抽出的简单随机样本。且分布函数F(X)在X=0是
连续的。假设检验问题
1 H 0 : F ( 0）＝ 2 1 H1 : F ( 0） 2
【练习2】
某地某一时期内出生40名婴儿，其中女性12名（定Sex=0），男性28名（定 Sex=1）。问这个地方出生婴儿的性比例与通常的男女性比例（总体概率约为0.5）是否不同？
23:39
19
第三节总体分布类型的KS检验
单样本的K-S检验(Kolmogorov-Smirnov检验)是用来检验抽取样本所依赖的总体是否服从某一理论分布。其方法是将某一变量的累积分布函数与特定的分布进行比较。设总体的累积分布函数为F(x)，已知的理论分布函数为F0(x) ，则检验的原假设和备择假设为 H0: F(x)=F0(x) ； H1: F(x)≠F0(x) 原假设所表达的是：抽取样本所依赖的总体与指定的理论分布无显著差异。 SPSS提供的理论分布有正态分布、Poisson分布、均匀分布、指数分布等。
„ （4）利用样本值 x1，x2，x3，，xn 计算实际频数 f i ，再计
算经验概率 pi ，据以计算的值

2
i 1
f i npi
m
2
npi
2 （5）作结论，若 2 m 1 r ，则拒绝原假设，即认为总体的分布函数不为 F0 x ；反之，则接受原假设，即认

e商务文档

第二章非参数统计分析

相关文档推荐：