当前位置:文档之家› SPSS5-相关与回归分析

SPSS5-相关与回归分析

用F值作为标准
在回归方程中包括常项 缺失值的处理方式
用均值代替缺失值
一、线性回归分析( Linear Regression)
2、一元线性回归:
示例1:教材P260数据:20章_数据1.sav
识字量对阅读能力的影响有多大?
步骤:
(1)依据散点图检验线性关系 (2)操作过程:Analyze-Regression-Linear (3)结果输出观察重点:
二、双变量相关分析(Bivariate)
示例1:大学生人格(神经质、内外向程度) 与心理健康(SCL-90总分)之间有无相关?
SPSS操作:
1、绘制散点图,判定两变aphs-Scatter
2、打开Bivarite Correlations主对话框
偏相关分析的思想:控制其它变量的变化,即在剔 除其它变量影响的情况下,计算两变量之间的相 关关系。
两个变量间的线性相关关系,用偏相关系数表示。 应用条件:均为连续性变量。
Partial Correlations 对话框
分析变量
显著性检验 显示实际的显著性水平
控制变量
Options 对话框
均值及标准差 零阶相关矩阵(即:Pearson相关矩阵)
Model 1
Regression Residual Total
Sum of Squares 1845.333 899.634 2744.967
a. Predictors: (Constant), 识 字 量
b. Dependent Var iable: 阅 读 能力
ANOV Ab
df 1
28 29
解释回归平方和在总平方各中所占的比率,即解释回 归效果, r2=0.672,则表示因变量(阅读能力)的 变异中有67.2%是由自变量(识字量)而引起的。
结果输出
回归模型的方差分析:ANOVA(b)
用于检验回归模型与数据的拟合程度。P小于0.05,表 明因变量与自变量之间存在很强的线性关系,即回归 方程显著。
家庭经济状况与专业满意度的相关系数为0.028,P值 为0.428,说明两者之间无相关关系。
相关系数
三、偏相关分析 (Partial Correlation)
1、概述
由于多个变量的相互作用,难以体现出某两个变 量的真实相关关系,因此,在研究两个变量之间 的线性关系时需要控制可能对其产生影响的其它 变量。
Unstandardiz ed Coef f icients
Standardized Coef f icients
Model
B
Std. Error
Beta
1
(Cons tant)
-.593 11.162
识 字量
.031
.004
.820
a. Dependent Variable: 阅 读能 力
非标准化回归系数
成对剔除带有缺失值的观测量 剔除所有带有缺失值的观测量
输出结果:
神经质、内外向与SCL总分的相关系数分别为0.170,0.095,P值为0.000,说明两者之间具有显著相关关系。
二、双变量相关分析(Bivariate)
(二)等级相关: 1、等级相关种类
Spearman等级相关:秩相关系数,属于非参数统 计方法,适用范围较Pearson相关系数要广。
示例2:大学生家庭经济状况与专业满意度之间 有无相关?
Bivariate Correlations 对话框
适用于正 态分布等 间隔测度
的变量
分析变量
选项
用于计算分类变 量的秩相关,考 虑结点的影响
相关系数
用于计算分类 变量的秩相关
显著性检验
双尾检验
单尾检验 标识有显著意义的相关系数
输出结果:选项均为系统默认
二、双变量相关分析(Bivariate)
(一)积差(距)相关
1、概述
Pearson积差(距)相关:表示的是两个正态 分布且呈线性关系的连续型变量之间的相关关 系。
例如:语文与数学成绩均以百分制表示,若两 者均呈正态分布,且它们之间呈线性关系,就 可用Pearson积差相关来表示它们的变化关系。
估计标准误、 进入方程后对R2
ANOVA表等
和F值的影响
关于回归系数的选择项
与回归系数相关的统计量 非标准化回归系数95%置信限 非标准化回归系数的方差-协方差
描述性统计量 部分相关和偏相关
共线性诊断
德宾-沃森检验 观测值诊断
Linear Regression对话框
标准化预测值 标准化残差 剔除残差 调整预测值 学生化残差 学生化剔除残差
Kendall’s tau-b等级相关:两变量均为等级变 量或有序分类数据
统计效能较Pearson相关系数要低一些。
二、双变量相关分析(Bivariate)
2、等级相关系数的适用条件:
不满足要求的连续性变量;两个变量为顺序变量 (等级变量),或一个是顺序变量,另一个是连 续变量的数据;
数据总体并不是正态分布; 样本容量小于30时
自变量和因变量均为连续性变量 线性趋势;独立性;正态性;方差齐性
一、线性回归分析 ( Linear Regression)
(五)线性回归分析的应用: 1、回归分析方法:
Enter:强迫引入法,所有自变量全部进入方程 Stepwise:逐步回归法,最常用。在计算过程中逐步加
入有显著性意义的变量和剔除无显著性意义的变量。 Remove:强迫剔除法 Backward:向后逐步法 Forward:向前逐步法
t -.053 7.579
Sig. .958 .000
回归方程的建立
阅读能力=-0.593+0.031*识字量
常数
Coe fficientsa
标准化回归系数
Unstandardiz ed Coef f icients
Standardized Coef f icients
Model
B
Std. Error
(二) 回归的统计原理
两个定距变量的回归是用函数
y= f(x)
来分析的。我们最常用的是一元回归方程
y a bx
其中x为自变量;y为因变量;a为截距,即常量;b 为回归系数,表明自变量对因变量的影响程度。
以工资为因变量,工龄为自变量的回归模型
工资 440 430 420 410 400 390 380 370 360
二、双变量相关分析(Bivariate)
(一)积差(距)相关
2、Pearson积差相关系数的适用条件:
两个变量都是连续型随机变量 两个变量的总体都呈正态分布或接近正态分布,至少
是单峰对称的正态 必须是成对数据,而且每对数据之间相互独立 两个变量之间呈线性关系 要排除共变因素的影响 样本容量 n ≥30, Pearson积差相关系数才有意义。
示范练习:
SPSS操作:
打开Analyze-Correlate-Partial主对话框
示例1:在控制内外向变量的情况下研究情绪稳定性与 心理健康(SCL-90总分)状况之间的相关关系。
例2:在控制情绪稳定性变量的情况下研究社会支持与 心理健康(SCL-90总分)状况之间的相关关系。
作业:
回归方程:158.344-3.34*自尊+15.118*消极应对0.819*社会支持+0.235*神经质
结果输出
决定系数
Model Sum m ary
Model 1
R
R Square
.820a
.672
A djuste d R Square
.661
a. Predict ors : (Constant), 识 字 量
Std. Error of the Estimate
5.668
回归模型描述:Model Summary-决定系数r2
0
Y=350+20x
1
2
3
4 工龄 5
在统计学中,这一方程中的系数是靠x与y变量的大 量数据拟合出来的。
Y
Y=a+bx
(x,y)
X
比如通过工龄和工资的关系计算得出下列的回 归公式:
y=472+14.8x
就可知工龄每增长1年,工资会增加14.8元; 也可推测,工龄为15年的人,工资收入应为
Beta
1
(Cons tant)
-.593 11.162
识 字量
.031
.004
.820
a. Dependent Variable: 阅 读能 力
非标准化回归系数
t -.053 7.579
Sig. .958 .000
一、线性回归分析( Linear Regression)
3、多元线性回归:
在现实研究中,影响因变量的因素往往有多个, 需同时用多个自变量来预测因变量的变化。
Linear Regression对话框 (Analyze Regression linear)
因变量
指定回归方法
指定选择参与回归 分析观测量的变量
指定作为观测 量标签的变量
加权最小平方法
自变量
全部选入 逐步回归 强行剔除 向后剔除 向前选择
Linear Regression对话框
提供判定系数、 显示每个自变量
472 + 14.8 *15=694元。
一、线性回归分析( Linear Regression)
(三)回归分析的作用:
1、描述两变量的关系:寻找因变量数值随自变 量变化而变化的直线趋势。通过回归方程解释 两变量之间的关系会显得更为精确。
2、通过回归方程可以进行预测和控制。
(四)基本的适用条件:
示例2: 大学生心理调查.sav
人格、社会支持、消极应对、积极应对、自尊、自 我态度对心理健康的影响有多大?
相关主题