当前位置:
文档之家› spss教程相关分析与回归模型的建立与分析
spss教程相关分析与回归模型的建立与分析
图 3.1 Correlate
相关分析菜单
§3.1.1 简单相关分析
两个变量之间的相关关系称简单相关关系。有两种方法可以反映简单相关关系。 一是通过散点图直观地显示变量之间关系, 二是通过相关系数准确地反映两变量的关 系程度。
§3.1.1.1 散点图
SPSS软件的绘图命令集中在 Graphs菜单。下面通过例题来介绍具体操作方法。
Bivariate 打开 Bivariate
图 3.5 Bivariate : Correlation 两变量相关分析对话框
2、从左边的变量框中选择需要考察的两个变量进入 Variables 框内,从
Correlation Coefficients
栏内选择相关系数的种类,有 Pearson相关系数,
例 2:为了考察火柴销售量的影响因素,选择煤气户数、卷烟销量、蚊香销量、 打火石销量作为影响因素, 得数据表 3.2 。试求火柴销售量与煤气户数的偏相关系数 .
表 3.2 火柴销量及影响因素表(见参考文献 {1} )
年份
68 69 70 71 72 73 74 75 76 77 78 79 80 81 82
Simple 简单散点图
Matrix 矩阵散点图
Overlay 重叠散点图
3-D 三维散点图
图 3.2 散点图对话框
如果只考虑两个变量, 可选择简单的散点图 Simple ,然后点击 Define ,打开 Simple Scatterplot 对话框 , 如图 3.3 所示。
图 3.3 Simple Scatterplot
对话框
选择变量分别进入 X 轴和 Y 轴,点击 OK后就可以得到散点图,见图 3.4。
从下面输出的人均国内生产总值与城镇居民消费额的散点图 出,两个变量之间有强正相关的线性关系。
3.4中可以粗略地看
8000
7000 6000
5000 4000
3ห้องสมุดไป่ตู้00
2000
城镇居民(元)
1000
0
0
2000
4000
Kendall ′ s一致性系数和 Spearman等级相关系数。 从检验栏内选择检验方式, 有双尾
检验和单尾检验两种。
3、单击 Options 按纽, 选择输出项和缺失值的处理方式。 本例中选择输出基本统 计描述,见图 3.6 所示。
图 3.6 Bivariate Correlation
:Options 对话框
4、单击 OK,可以得到相关分析的结果。 从表 3.1 (a)可以得到两个变量的基本统计描述,从表 (b) 中可以得到相关系数 及对相关系数的检验结果, 由于尾概率就小于 0.01 ,故说明两变量之间存在着显著的 线性相关性。
表 3.1 ( a)基本统计描述
Descriptive Statistics
(Bivariate )和偏相关分析( Partial )。 2、建立因变量和自变量之间回归模型 (Regression ),其中包括线性回归分析
(Linear )和曲线估计( Curve Estimation )。 数据条件 :参与分析的变量数据是数值型变量或有序变量。
§3.1 相关分析
在 SPSS中,可以通过 Analyze 菜单进行相关分析( Correlate ),Correlate 菜 单如图 3.1 所示。
Sig. (2-tailed)
.
人均国内生产总值(元)
N Pearson Correlation
25 .998(**)
Sig. (2-tailed)
.000
N
25
** Correlation is significant at the 0.01 level (2-tailed).
人均国内生产总值(元) .998(**) .000 25 1 . 25
火柴销售量 (万件) 23.69 24.1 22.74 17.84 18.27 20.29 22.61 26.71 31.19 30.5 29.63 29.69 29.25 31.05 32.28
6000
8000
人均 国内生产总值(元)
图 3.4 散点图
10000
12000
§3.1.1.2 简单相关分析操作
简单相关分析是指两个变量之间的相关分析, 主要是指对两变量之间的线性相关 程度作出定量分析。 仍然数据 SY-8为例,说明居民收入与某商品的销售量两变量的相 关分析过程,具体操作如下:
1、打开数据库 SY-8后,单击 Analyze Correlate 对话框,见图 3.5 所示。
从表 3.1 (b)中可以看到两个变量相关性分析的结果:相关系数是 0.998 ,相关 程度非常高,且假设检验的 P值远远地小于 0.05 ,可以认为居民收入与某产品的销量 存在线性正相关关系。
§3.1.2 偏相关分析
简单相关关系只反映两个变量之间的关系,但如果因变量受到多个因素的影响 时,因变量与某一自变量之间的简单相关关系显然受到其它相关因素的影响, 不能真 实地反映二者之间的关系, 所以需要考察在其它因素的影响剔除后二者之间的相关程 度,即偏相关分析。
城镇居民消费额(元) 人均国内生产总值(元)
Mean
Std. Deviation
N
2582.2800
2335.96384
25
3689.8800
3701.50798
25
表 3.1 ( b)相关系数检验
Correlations
城镇居民消费额(元)
Pearson Correlation
城镇居民消费额(元) 1
例 1:数据库 SY-8中的变量 X表示山东省人均国内生产总值, Y表示山东省城镇居 民的消费额(资料来源:山东省 2003年统计年鉴),现画出散点图来观察两个变量的 关联程度。具体操作步骤如下:
首先打开数据 SY-8,然后单击 Graphs Scatter, 打开 Scatter plot 散点图对话 框,如图 3.2 所示。然后选择需要的散点图,图中的四个选项依次是:
第三章 相关分析与回归模型的建立与分析
相关分析和回归分析是统计分析方法中最重要内容之一, 是多元统计分析方法的 基础。相关分析和回归分析主要用于研究和分析变量之间的相关关系, 在变量之间寻 求合适的函数关系式,特别是线性表达式。
本章主要内容: 1、对变量之间的相关关系进行分析( Correlate)。其中包括简单相关分析