当前位置：文档之家› SPSS学习教程PPT10非参数检验

SPSS学习教程PPT10非参数检验

定义：两独立样本的非参数检验是在对总体分布不很了解的情况下，通过分析样本数据，推断样本来自的两个独立总体分布是否存在显著差异。一般用来对两个独立样本的均数、中位数、离散趋势、偏度等进行差异比较检验。
两个样本是否独立，主要看在一个总体中抽取样本对另外一个总体中抽取样本有无影响。如果没有影响，则可以认为两个总体是独立的。 SPSS提供了4种两独立样本的非参数检验方法。
10.1 总体分布的卡方（Chi-square）检验
在得到一批样本数据后，人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断，则需要使用非参数检验的方法。其中总体分布的卡方检验（也记为χ 2 检验）就是一种比较好的方法。
两独立样本的K-S检验将关注差值序列。SPSS 将自动计算K-S Z统计量，并依据正态分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平，则应拒绝零假设H0，认为两个样本来自的总体分布有显著差异；如果相伴概率值大于显著性水平，则不能拒绝零假设H0，认为两个样本来自的总体分布无显著差异。

实现步骤
图10-12 在菜单中选择“1-Sample K-S”命令
图10-13 “One-Sample Kolmogorov-Smirnov Test”对话框
图10-14 “One-Sample K-S：Options”对话框
10.4.3 结果和讨论
（1）本例输出结果如下表所示。
10.5 两独立样本非参数检验 10.5.1 统计学上的定义和计算公式
图10-8 “Binomial Test：Options”对话框
10.2.3 结果和讨论
10.3 SPSS单样本变量值随机性检验 10.3.1 统计学上的定义和计算公式
定义：单样本变量值的随机性检验是对某变量的取值出现是否随机进行检验，也称为游程检验（Run过程）。
单样本变量值的随机性检验是由Wald提出的，它的零假设为H0：总体某变量的变量值出现是随机的。单样本变量值的随机性检验通过游程（Run）数来实现。所谓游程是样本序列中连续出现的变量值的次数。
10.1.2 SPSS中实现过程
研究问题某地一周内各日患忧郁症的人数分布如表 10-1所示，请检验一周内各日人们忧郁数是否满足1:1:2:2:1:1:1。
表10-1
学生的数学成绩周日 1 2 3 4 5 患者数 31 38 70 80 29
6
7
24
31

实现步骤
图10-1 在菜单中选择“Weight Cases”命令
10.2.2 SPSS中实现过程
研究问题某地某一时期内出生35名婴儿，其中女性19名（定Sex=0），男性16名（定Sex=1）。问这个地方出生婴儿的性别比例与通常的男女性比例（总体概率约为0.5）是否不同？数据如表102所示。
表10-2
婴 1 2 儿
35名婴儿的性别
Sex 1 0 婴 13 14 儿 Sex 1 1 婴儿 25 26 Sex 1 1
SPSS在统计中将计算K-S的Z统计量，并依据K-S分布表（小样本）或正态分布表（大样本）给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平α ，则应拒绝零假设H0，认为样本来自的总体与指定的分布有显著差异；如果相伴概率值大于显著性水平，则不能拒绝零假设H0，认为样本来自的总体与指定的分布无显著差异。
2．两独立样本的K-S检验
两独立样本的K-S检验能够对两独立样本的总体分布情况进行比较。其零假设是H0为样本来自的两独立总体分布没有显著差异。
两独立样本的K-S检验实现方法是：首先将两组样本数据（X1，X2，…，Xm）和（Y1， Y2，…，Yn）混合并按升序排列（m和n是两组样本的样本容量），分别计算两组样本秩的累计频率和每个点上的累计频率；最后将两个累计频率相减，得到差值序列数据。
（2）输出的结果文件中第二个表格如下。
10.2 二项分布检验 10.2.1 统计学上的定义和计算公式
现实生活中有很多数据的取值只有两类，如医学中的生与死、患病的有与无、性别中的男性和女性、产品的合格与不合格等。从这种二分类总体中抽取的所有可能结果，要么是对立分类中的这一类，要么是另一类，其频数分布称为二项分布。调用SPSS中的二项分布检验（Binomial）可对样本资料进行二项分布分析。
1．两独立样本的Mann-Whitney U检验
两独立样本的Mann-Whitney U检验的零假设 H0为样本来自的两独立总体均值没有显著差异。
两独立样本的Mann-Whitney U检验主要通过对平均秩的研究来实现推断。秩简单地说就是名次。如果将数据按照升序进行排序，这时每一个具体数据都会有一个在整个数据中的位置或名次，这就是该数据的秩，数据有多少个，秩便有多少个。
研究问题某村发生一种地方病，其住户沿一条河排列，调查时对发病的住户标记为“1”，对非发病的住户标记为“0”，共35户，其取值如表10-3所示。
表10-3
住 1 2 3 4 5 6 7 8 9 10 11 12 户
35名住户发病情况
发病情况 1 0 1 1 1 1 0 0 0 0 1 1 住户 13 14 15 16 17 18 19 20 21 22 23 24 发病情况 1 1 1 1 0 0 1 1 0 0 1 1 住 25 26 27 28 29 30 31 32 33 34 35 户发病情况 1 1 0 1 0 0 1 0 0 0 0
SPSS将自动计算Z统计量，并给出相应的相伴概率值。如果相伴概率小于或等于用户的显著性水平α ，则应拒绝零假设H0，认为样本来自的总体分布形态与指定的二项分布存在显著差异；如果相伴概率值大于显著性水平，则不能拒绝零假设H0，认为样本来自的总体分布形态与指定的二项分布不存在显著差异。
SPSS二项分布检验的数据是实际收集到的样本数据，而非频数数据。
这种不是针对总体参数，而是针对总体的某些一般性假设（如总体分布）的统计分析方法称非参数检验（Nonparametric Tests）。非参数检验根据样本数目以及样本之间的关系可以分为单样本非参数检验、两独立样本非参数检验、多独立样本非参数检验、两配对样本非参数检验和多配对样本非参数检验几种。
图10-2 “Weight Cases”对话框
图10-3 在菜单中选择“Chi-Square”命令
图10-4 “Chi-Square Test”对话框
图10-5 “Chi-Square Test：Options”对话框
10.1.3 结果和讨论
（1）本例输出结果中有两个表格，其中第一个表格如下。
SPSS二项分布检验就是根据收集到的样本数据，推断总体分布是否服从某个指定的二项分布。其零假设是H0：样本来自的总体与所指定的某个二项分布不存在显著的差异。
SPSS中的二项分布检验，在样本小于或等于30时，按照计算二项分布概率的公式进行计算；样本数大于30时，计算的是Z统计量，认为在零假设下，Z统计量服从正态分布。Z统计量的计算公式如下
3
4 5 6
1
1 1 1
15
16 17 18
1
1 0 0
27
28 29 30
0
0 0 0
7
8 9 10
0
0 0 0
19
20 21 22
0
0 0 0
31
32 33 34
1
0 0 0
11
12
1
1
23
24
1
1
35
0

实现步骤
图10-6 在菜单中选择“Binomial Test”命令
图10-7 “Binomial Test”对话框
SPSS 16实用教程
第10章非参数检验
10.1 总体分布的卡方（Chi-square）检验 10.2 10.3
二项分布检验 SPSS单样本变量值随机性检验 SPSS单样本K-S检验两独立样本非参数检验多独立样本非参数检验
10.4
10.5 10.6Fra bibliotek10.7
10.8
两配对样本非参数检验
多配对样本非参数检验
在SPSS单样本变量值的随机性检验中， SPSS将利用游程构造Z统计量，并依据正态分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平α ，则应拒绝零假设H0，认为样本值的出现不是随机的；如果相伴概率值大于显著性水平，则不能拒绝零假设 H0，认为变量值的出现是随机的。
10.3.2 SPSS中实现过程
本章将介绍总体分布的卡方（Chisquare）检验、二项分布（Binomial）检验、单样本K-S（Kolmogorov-Smirnov）检验、单样本变量值随机性检验（Runs Test）、两独立样本非参数检验、多独立样本非参数检验、两配对样本非参数检验、多配对样本非参数检验等8类常用的非参数检验方法。其中前4种属于单样本非参数检验。
如果计算出的游程数相对比较小，则说明样本来自的两总体的分布形态存在较大差距；如果得到的游程数相对比较大，则说明样本来自的两总体的分布形态不存在显著差距。
SPSS将自动计算游程数得到Z统计量，并依据正态分布表给出对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平，则应拒绝零假设H0，认为两个样本来自的总体分布有显著差异；如果相伴概率值大于显著性水平，则不能拒绝零假设H0，认为两个样本来自的总体分布无显著差异。
单样本K-S检验可以将一个变量的实际频数分布与正态分布（Normal）、均匀分布（Uniform）、泊松分布（Poisson）、指数（Exponential）分布进行比较。其零假设H0 为样本来自的总体与指定的理论分布无显著差异。

e商务文档

SPSS学习教程PPT10非参数检验

相关文档推荐：