当前位置:文档之家› SPSS学习教程PPT10非参数检验

SPSS学习教程PPT10非参数检验

定义:两独立样本的非参数检验是在对总 体分布不很了解的情况下,通过分析样本数据, 推断样本来自的两个独立总体分布是否存在显 著差异。一般用来对两个独立样本的均数、中 位数、离散趋势、偏度等进行差异比较检验。
两个样本是否独立,主要看在一个总体中抽取 样本对另外一个总体中抽取样本有无影响。如 果没有影响,则可以认为两个总体是独立的。 SPSS提供了4种两独立样本的非参数检验方法。
10.1 总体分布的卡方(Chi-square)检验
在得到一批样本数据后,人们往往希望从 中得到样本所来自的总体的分布形态是否和某 种特定分布相拟合。这可以通过绘制样本数据 直方图的方法来进行粗略的判断。如果需要进 行比较准确的判断,则需要使用非参数检验的 方法。其中总体分布的卡方检验(也记为χ 2 检验)就是一种比较好的方法。
两独立样本的K-S检验将关注差值序列。SPSS 将自动计算K-S Z统计量,并依据正态分布表 给出对应的相伴概率值。如果相伴概率小于或 等于用户的显著性水平,则应拒绝零假设H0, 认为两个样本来自的总体分布有显著差异;如 果相伴概率值大于显著性水平,则不能拒绝零 假设H0,认为两个样本来自的总体分布无显著 差异。

实现步骤
图10-12 在菜单中选择“1-Sample K-S”命令
图10-13 “One-Sample Kolmogorov-Smirnov Test”对话框
图10-14 “One-Sample K-S:Options”对话框
10.4.3 结果和讨论
(1)本例输出结果如下表所示。
10.5 两独立样本非参数检验 10.5.1 统计学上的定义和计算公式
图10-8 “Binomial Test:Options”对话框
10.2.3 结果和讨论
10.3 SPSS单样本变量值随机性检验 10.3.1 统计学上的定义和计算公式
定义:单样本变量值的随机性检验是对某 变量的取值出现是否随机进行检验,也称为游 程检验(Run过程)。
单样本变量值的随机性检验是由Wald提出 的,它的零假设为H0:总体某变量的变量值出 现是随机的。 单样本变量值的随机性检验通过游程 (Run)数来实现。所谓游程是样本序列中连 续出现的变量值的次数。
10.1.2 SPSS中实现过程
研究问题 某地一周内各日患忧郁症的人数分布如表 10-1所示,请检验一周内各日人们忧郁数是否 满足1:1:2:2:1:1:1。
表10-1
学生的数学成绩 周 日 1 2 3 4 5 患 者 数 31 38 70 80 29
6
7
24
31

实现步骤
图10-1 在菜单中选择“Weight Cases”命令
10.2.2 SPSS中实现过程
研究问题 某地某一时期内出生35名婴儿,其中女性19名 (定Sex=0),男性16名(定Sex=1)。问这个 地方出生婴儿的性别比例与通常的男女性比例 (总体概率约为0.5)是否不同?数据如表102所示。
表10-2
婴 1 2 儿
35名婴儿的性别
Sex 1 0 婴 13 14 儿 Sex 1 1 婴 儿 25 26 Sex 1 1
SPSS在统计中将计算K-S的Z统计量,并依 据K-S分布表(小样本)或正态分布表(大样 本)给出对应的相伴概率值。如果相伴概率小 于或等于用户的显著性水平α ,则应拒绝零假 设H0,认为样本来自的总体与指定的分布有显 著差异;如果相伴概率值大于显著性水平,则 不能拒绝零假设H0,认为样本来自的总体与指 定的分布无显著差异。
2.两独立样本的K-S检验
两独立样本的K-S检验能够对两独立样本的总 体分布情况进行比较。其零假设是H0为样本来 自的两独立总体分布没有显著差异。
两独立样本的K-S检验实现方法是:首先将两 组样本数据(X1,X2,…,Xm)和(Y1, Y2,…,Yn)混合并按升序排列(m和n是两组 样本的样本容量),分别计算两组样本秩的累 计频率和每个点上的累计频率;最后将两个累 计频率相减,得到差值序列数据。
(2)输出的结果文件中第二个表格如下。
10.2 二项分布检验 10.2.1 统计学上的定义和计算公式
现实生活中有很多数据的取值只有两类, 如医学中的生与死、患病的有与无、性别中的 男性和女性、产品的合格与不合格等。从这种 二分类总体中抽取的所有可能结果,要么是对 立分类中的这一类,要么是另一类,其频数分 布称为二项分布。调用SPSS中的二项分布检验 (Binomial)可对样本资料进行二项分布分析。
1.两独立样本的Mann-Whitney U检验
两独立样本的Mann-Whitney U检验的零假设 H0为样本来自的两独立总体均值没有显著差异。
两独立样本的Mann-Whitney U检验主要通过 对平均秩的研究来实现推断。秩简单地说就是 名次。如果将数据按照升序进行排序,这时每 一个具体数据都会有一个在整个数据中的位置 或名次,这就是该数据的秩,数据有多少个, 秩便有多少个。
研究问题 某村发生一种地方病,其住户沿一条河排 列,调查时对发病的住户标记为“1”,对非 发病的住户标记为“0”,共35户,其取值如 表10-3所示。
表10-3
住 1 2 3 4 5 6 7 8 9 10 11 12 户
35名住户发病情况
发病情况 1 0 1 1 1 1 0 0 0 0 1 1 住 户 13 14 15 16 17 18 19 20 21 22 23 24 发病情况 1 1 1 1 0 0 1 1 0 0 1 1 住 25 26 27 28 29 30 31 32 33 34 35 户 发病情况 1 1 0 1 0 0 1 0 0 0 0
SPSS将自动计算Z统计量,并给出相应的 相伴概率值。如果相伴概率小于或等于用户的 显著性水平α ,则应拒绝零假设H0,认为样本 来自的总体分布形态与指定的二项分布存在显 著差异;如果相伴概率值大于显著性水平,则 不能拒绝零假设H0,认为样本来自的总体分布 形态与指定的二项分布不存在显著差异。
SPSS二项分布检验的数据是实际收集到的样本 数据,而非频数数据。
这种不是针对总体参数,而是针对总体的 某些一般性假设(如总体分布)的统计分析方 法称非参数检验(Nonparametric Tests)。 非参数检验根据样本数目以及样本之间的关系 可以分为单样本非参数检验、两独立样本非参 数检验、多独立样本非参数检验、两配对样本 非参数检验和多配对样本非参数检验几种。
图10-2 “Weight Cases”对话框
图10-3 在菜单中选择“Chi-Square”命令
图10-4 “Chi-Square Test”对话框
图10-5 “Chi-Square Test:Options”对话框
10.1.3 结果和讨论
(1)本例输出结果中有两个表格,其中 第一个表格如下。
SPSS二项分布检验就是根据收集到的样本 数据,推断总体分布是否服从某个指定的二项 分布。其零假设是H0:样本来自的总体与所指 定的某个二项分布不存在显著的差异。
SPSS中的二项分布检验,在样本小于或等 于30时,按照计算二项分布概率的公式进行计 算;样本数大于30时,计算的是Z统计量,认 为在零假设下,Z统计量服从正态分布。Z统计 量的计算公式如下
3
4 5 6
1
1 1 1
15
16 17 18
1
1 0 0
27
28 29 30
0
0 0 0
7
8 9 10
0
0 0 0
19
20 21 22
0
0 0 0
31
32 33 34
1
0 0 0
11
12
1
1
23
24
1
1
35
0

实现步骤
图10-6 在菜单中选择“Binomial Test”命令
图10-7 “Binomial Test”对话框
SPSS 16实用教程
第10章 非参数检验
10.1 总体分布的卡方(Chi-square)检验 10.2 10.3
二项分布检验 SPSS单样本变量值随机性检验 SPSS单样本K-S检验 两独立样本非参数检验 多独立样本非参数检验
10.4
10.5 10.6Fra bibliotek10.7
10.8
两配对样本非参数检验
多配对样本非参数检验
在SPSS单样本变量值的随机性检验中, SPSS将利用游程构造Z统计量,并依据正态分 布表给出对应的相伴概率值。如果相伴概率小 于或等于用户的显著性水平α ,则应拒绝零假 设H0,认为样本值的出现不是随机的;如果相 伴概率值大于显著性水平,则不能拒绝零假设 H0,认为变量值的出现是随机的。
10.3.2 SPSS中实现过程
本章将介绍总体分布的卡方(Chisquare)检验、二项分布(Binomial)检验、 单样本K-S(Kolmogorov-Smirnov)检验、单 样本变量值随机性检验(Runs Test)、两独 立样本非参数检验、多独立样本非参数检验、 两配对样本非参数检验、多配对样本非参数检 验等8类常用的非参数检验方法。其中前4种属 于单样本非参数检验。
如果计算出的游程数相对比较小,则说明 样本来自的两总体的分布形态存在较大差距; 如果得到的游程数相对比较大,则说明样本来 自的两总体的分布形态不存在显著差距。
SPSS将自动计算游程数得到Z统计量,并 依据正态分布表给出对应的相伴概率值。如果 相伴概率小于或等于用户的显著性水平,则 应拒绝零假设H0,认为两个样本来自的总体分 布有显著差异;如果相伴概率值大于显著性水 平,则不能拒绝零假设H0,认为两个样本来自 的总体分布无显著差异。
单样本K-S检验可以将一个变量的实际频 数分布与正态分布(Normal)、均匀分布 (Uniform)、泊松分布(Poisson)、指数 (Exponential)分布进行比较。其零假设H0 为样本来自的总体与指定的理论分布无显著差 异。
相关主题