相关分析与回归分析及其应用
SPSS操作分析步骤如下
1、建立数据文件
•建立两个变量: 变量X:年龄,数值型 变量Y:尿肌酸含量,数值型
2、统计分析
(1)散点图的制作
graph scatter simple
通过散点图可看出两个变量间有直线趋势,可作两因素相关分析。
(2)相关分析操作
①菜单选择
Analyze 分析
Correlate 相关
SPSS操作分析步骤如下
1、建立数据文件
•建立6个变量: 1、四个自变量: X1、X2、X3、X4,数值型 2、一个应变量Y: 空腹血糖,数值型 3、一个病历号变量case,数值型
(2)回归分析操作
①菜单选择
analyze
regression
Linear regression主对话框
练习题
2
a Y bX l XY
X Y X X Y Y XY
n
二、直线回归中的统计推断
回归方程的假设检验:有方差分析和t检验方法。 总体回归系数β的可信区间 利用回归方程进行估计和预测
例题
SPSS操作分析步骤如下
1、建立数据文件
326.26 388.54
正相关
负相关
零相关 完全正相关 完全负相关
相关系数的意义与计算
相关系数:以符号r 表示样本相关系数,符号ρ表示 其总体相关系数。样本相关系数的计算公式为
r
X X Y Y X X Y Y
2
2
l XY l XX lYY
相关系数没有单位,其值为-1≤r ≤1。r 值为正表示 正相关,r 值为负表示负相关,r 的绝对值等于1为完 全相关,r =0为零相关。
•建立两个变量: X变量:年龄,数值型 Y变量:尿肌酸含量,数值型
2、统计分析
(1)散点图的制作
graph scatter simple
通过散点图可看出两个变量间有直线趋势,可作两因素相关分析。
(2)直线回归分析操作
①菜单选择
analyze
regression
Linear regression主对话框
练习题
第三节 多元线性回归分析及其应用
Байду номын сангаас
一元直线回归分析研究的是两个变量之间是否 存在线性关系。但在实际研究中,经常会遇到 一个因变量与多个自变量之间的相互关系问题。 如肺活量可能与身高、体重、胸围等因素有关 等,因此,需要采用多元线性回归进行研究。 多元线性回归就是通过作出多元线性回归方程, 描述一个因变量与多个自变量之间线性依存关 系的统计方法。
5
6 7 8
14.25
12.75 12.50 12.25
58.80
43.67 54.89 86.12
456.55
395.78 448.70 440.13
9
10 11 12 13 14 15 16 17
12.00
11.75 11.50 11.25 11.00 10.75 10.50 10.25 10.00
•SPSS程序 ③主要输出结果及解释
决定系数(R2)
在直线回归与相关中一个重要的统计量,是指回归平 方和与总平方和之比,用R2表示其计算公式为:
2 2 SS回 l XY / l XX l XY SS总 lYY l XX lYY
R2
R2取值在0和1之间且无单位,其数值大小反映了回归 贡献的相对程度,也就是在Y的总变异中回归关系所能 解释的百分比。如本例R2=0.778,表示年龄可解释尿 肌酐含量变异性的77.8%,另外约22%的变异不能用年 龄来解释。
SPSS中的相关分析
“Analyze”菜单的“Correlate”子菜单中,该菜单包 括三个部分。①bivariate模块:主要用于两个或多个 变量间的相关分析。如果是多个变量,则给出两两变量 间相关分析的结果。该模块是进行相关分析的最常用的 模块。②partial模块:是专门用于偏相关分析,即控 制了混杂因素或影响因素后得到的两个变量间相关关系 的结果。③distance模块:一般不单独使用,当数据复 杂时,可以用此模块进行数据的初步处理,应用少。
60.35
54.04 61.23 60.17 69.69 72.28 55.13 70.08 63.05
394.40
405.60 446.00 383.20 416.70 430.80 445.80 409.80 384.10
18
19 20
9.75
9.50 9.25
48.75
52.28 52.21
342.90
多元线性回归模型一般形式为:
Y=β0+ β1X1+ β2X2+ …+βmXm+e 多元线性回归分析步骤:
1.根据样本数据求得模型参数β0, β1,β2, …,βm 的估计值b0,b1,b2,…bm,从而得到表示应变量Y与 自变量X1,X2,…,Xm数量关系的表达式——多元 线性回归方程。 2.对回归方程及各自变量作假设检验,并对方程 的拟合效果及各自变量的作用大小作出评价。
一、直线回归方程的求法
从散点图中看,求解a、b实际上就是怎样“合理地” 找到一条能最好地代表数据点分布趋势的直线。 通常取各点残差平方和最小的直线为所求直线—— “最小二乘法”原则。 方程中常数项和回归系数的求法:
l XY b l XX
X X Y Y X X
第六章 相关与回归分析及其应用
血药浓度与时间的关系 年龄与其收缩压的关系 年龄与其身高的关系 ……….常用相关与回归分析 本章将介绍两个数值变量呈直线或曲线关 系的分析方法。
第一节 直线相关及其应用
直线相关:又称简单相关,是研究两个变量间线性关 系的一种常用统计方法。 直线相关分析的是两变量之间是否存在直线相关关系, 以及相关的方向和程度。直线相关系数又称Pearson相 关系数,是描述两变量线性相关关系程度和方向的统 计量。 作直线相关分析要求资料服从双变量正态分布。对于 不符合双变量正态分布的资料,不能直接计算Pearson 相关系数,可用非参数统计方法,即计算Kendall相关 系数或Spearman相关系数。
1)对回归方程的假设检验及评价: 检验:方差分析 评价:决定系数 2)对自变量的假设检验及评价: 检验:偏回归平方和或t检验法 评价:标准化回归系数。用来比较自变量对应变 量的影响强度。
例题:27名糖尿病病人的血清总胆固醇、甘油三 酯、空腹胰岛素、糖化血红蛋白、空腹血糖的测 量值如表,试建立空腹血糖与其他几项指标关系 的多元线性回归方程。
• 20名儿童血红蛋白Y与微量元素钙X1(μg/100ml) 和铁X2(μg/100ml)的测定结果如表,试做多 元线性回归。
序号 1 2 3 4
血红蛋白Y 13.50 13.00 13.75 14.00
钙X1 54.89 72.49 83.81 64.74
铁X2 448.70 467.30 452.61 469.80
Bivariate 双变量
Bivariate correlations 双变量相关主对话框
•SPSS程序 ③主要输出结果及解释
相关系数的统计推断
相关系数的假设检验 常用统计量t值,计算公式为:
r 0 t Sr
r 1 r 2 n2
,v n 2
练习题
第二节 一元线性回归及其应用