当前位置:文档之家› 第二章非参数统计分析

第二章非参数统计分析

SPSS的数据格式 合格品 1 0 频数 20 5
表中的“1”表示合格品;“0”表示不合格品
23:39 16
(SPSS binomial test)
第 1 步 : 指 定 “ 频 数 ” 变 量 : 点 击 【Data】 【Weight-Cases】,将“频数”选入 【Frequency Variable】 【OK】 第2步:选择【Analyze】【Nonparametric
H 0 : 0 : H1 : 0 H 0 : 0 : H1 : 0
23:39
13
【练习1】 盒中有5种球,重复抽取200次(每 次抽1个球)各种球出现的次数见下表。问盒中5 种球的个数是否相等?显著水平α=0.05。
种别 1 2 3 4 5 ∑
23:39
fi 35 40 43 38 44 200
14
第二节 二项分布检验
二项分布检验(binomial test)是通过考察二分类 变量的每个类别中观察值的频数与特定二项分布下 的期望频数之间是否存在显著差异,来判断抽取样 本所依赖的总体是否服从特定概率为p的二项分布。
为总体的分布函数为 F0 x 。
23:39
10
卡方检验的窗口,SPSS的卡方检验主 要用来检验离散随机变量的分布。
23:39
11
卡方检验的窗口。
23:39
12
X 1 2 3 4 Total Observed N 380 69 43 8 500 Expected N 400.0 60.0 35.0 5.0 Residual -20.0 9.0 8.0 3.0
23:39
4
一、χ2拟合优度检验
在实际问题中,会遇到必须了解总体的分布函数的 时候,这时利用样本资料对总体的分布函数进行检验就 成了非常重要的了。
我们需要检验总体的分布函数F(x)是否等于某个给
定的函数 F0(x) ,可以根据经验来确定。其中含有未知 参数时,应利用样本资料采用点估计求得后,再进行检 验。
H 0 : p1 80%, p2 12%, p3 7%, p4 1% H1 : pi pi 0
23:39 6
类型 A 380
fi
npi (ei )
400
fi npi ( fi npi ) 2
-20 400
( fi npi ) 2 npi
1.00
B
C D 合计
69
43 8 500
60
35 5 500
9
8 3 __
81
64 9 __
1.35
1.83 1.80 5.98
根据显著性水平 ,有
2 (3) 7.82 ,由于
2 Q 5.98 (3) 7.82
表明5%的显著水平下,不能拒绝原假设,即观测的比率与期望的比
率一致。 23:39
7
如果分布是连续的其检验步骤为:
12.2 12.4 10.8 11.3 12.0 12.2 11.8 12.0 11.9 12.3
检验该供货商生产的配件长度是否服从正态 分布?(=0.05)
23:39
22
总体分布类型的检验
(SPSS K-S检验)
第1步:选择【Analyze】【Nonparametric
Test】【1-Sample K-S】进入主对话 框; 第2步:将待检验的变量选入【Test Variable List】(本例为“配件长度”); 第3步:点击【Exact】,并在对话框中选择 【Exact】,点击【OK】。
检验的统计量可以取B。
在原假设为真的条件下,B服从参数为n和0.5的二项分布 b(n,0.5)。由于原假设为真时,B应该不太大,也不太小,如
23:39 果B太大或太小,应该拒绝原假设。 27
一、精确中位数的符号检验
精确的符号检验是指检验的p值是由精确的概率给出
的。 我们利用正号和负号的数目,来检验某假设,这是
23:39
3
第一节 Chi-Square test 卡方检验
卡方检验通常称为拟合优度检验。主要是通 过样本观测值检验总体是否服从某个分布。如果 数据是连续的,需要将连续的分布进行分段,计 算每段的期望概率与观测到的频率之间是否差异 很大。在SPSS中的Chi-Square test ,主要是对 离散的总体进行拟合优度检验。
23:39
20
检验统计量
D max | Fn ( x) F0 ( x) |
当H0成立且无抽样误差时,统计量D等于0。因此:当D的 实际观测值较小时,可以认为零假设H0成立;当D的观测值较 大时,则零假设H0可能不成立。其中Fn(x)称为经验分布。 假定有样本1,1,2,2,2,4,5,5,5,10。其经验分布 为 x 1 0
23:39
5
【例1】某金融系统贷款的偿还类型有四种,各种的 预期还率为80%、12%、7%和1%。在一段时间的观察记 录中,A型按时偿还的有380笔、B型偿还有69笔、C型有
43笔、D笔有8笔。问在5%显著性水平上,这些结果与预
期的是否一致。α=0.05。 解:这个问题属于要检验每一类型的出现概率与理论 期望概率是否相等,即检验
(1)提出统计假设 H 0:F x F0 x 由统计假设出发,将总体取值范围分为m个互不相
容的小区间:t0,t1 t1,t2 tm 1,tm
区间个数以7~14为宜。然后,统计出每个区间 内样本点的数目fi,再用pi表示变量在第i个区间的概 率,
23:39
8
23:39
31
符号检验的思路,记
成功:X-0大于零,即大于中位数M,记为“+”;
失败:X-0小于零,即小于中位数M,记为“-”。

S+=得正符号的数目
S-=得负符号得数目
可以知道S+或S— 均服从二项分布B(65,0.5)。则可以
用来作检验的统计量。其假设为:
H 0 : 0 : H1 : 0
二项分布检验的原假设是:抽取样本所依赖的 总体与特定的二项分布无显著差异。
如果检验的p值小于0.05,则拒绝原假设。
23:39
15
【例2】 根据以往的生产数据,某种产品 的合格率为90%。现从中随机抽取25个进行检 测,合格品为20个。检验该批产品的合格率是 否为90%?(产品合格率X~B(n,0.9))
23:39 29
Histogram of x
Frequency
0 20
2
4
6
8
10
40
60 x
80
100
120
23:39
30
通常在正态总体分布的假设下,关于总体均值的假设 检验和区间估计是用与t检验有关的方法进行的。然而, 在本例中,总体分布是未知的。为此,首先看该数据的直 方图从图中很难说这是什么分布。假定用总体中位数来表 示中间位置,这意味着样本点,取大于me 的概率应该与 取小于me 的概率相等。所研究的问题,可以看作是只有 两种可能“成功”或“失败”。
Test Statistics Chi-Squarea df Asymp. Sig. X 5.979 3 .113
P值大于0.05,结果说明还贷情 况与预期是一致的。
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 5.0.
Tests-Binomial】选项进入主对话框 第3步:将待检验的变量选入【Test Variable List】(本例为“合格品”) 第4步:在【Test Proportion】中输入检验的概率 (本例为0.9),点击【OK】
23:39 17
SPSS的输出结果
23:39
表中的合格品的观察比例为0.8,检验比 例为0.9。精确单尾概率为0.098,它表示如果该 批产品的合格率为0.9,那么25个产品中合格品 数量小于等于20个的概率为0.098。P>0.05,不拒 绝原假设,没有证据表明该批产品的合格率不是 0.9 18
20
35
16
8
7
5
利用SPSS检验该数据可能的分布。用SPSS, 在正态、均匀、指数和泊松分布中选择。
23:39 26
第四节 符号检验
符号检验的统计量为B=得正号的个数。 符号检验。设随机变量X1,…,Xn是从某个总体
X中抽出的简单随机样本。且分布函数F(X)在X=0是
连续的。假设检验问题
1 H 0 : F ( 0)= 2 1 H1 : F ( 0) 2
【练习2】
某地某一时期内出生40名婴儿,其中女 性12名(定Sex=0),男性28名(定 Sex=1)。问这个地方出生婴儿的性比例与 通常的男女性比例(总体概率约为0.5)是 否不同?
23:39
19
第三节 总体分布类型的KS检验
单样本的K-S检验(Kolmogorov-Smirnov检验)是用来 检验抽取样本所依赖的总体是否服从某一理论分布。 其方法是将某一变量的累积分布函数与特定的分布 进行比较。设总体的累积分布函数为F(x),已知的理论 分布函数为F0(x) ,则检验的原假设和备择假设为 H0: F(x)=F0(x) ; H1: F(x)≠F0(x) 原假设所表达的是:抽取样本所依赖的总体与指定的 理论分布无显著差异。 SPSS提供的理论分布有正态分布、Poisson分布、均 匀分布、指数分布等。
„ (4)利用样本值 x1,x2,x3, ,xn 计算实际频数 f i ,再计
算经验概率 pi ,据以计算的值

2
i 1
f i npi
m
2
npi
2 (5)作结论,若 2 m 1 r ,则拒绝原假设,即认 为总体的分布函数不为 F0 x ;反之,则接受原假设,即认
相关主题