spss多元线性回归分析
作者: 日期:
SPSS多元线性回归分析试验
在科学研究中,我们会发现某些指标通常受到多个因素的影响,如血压值除了受年龄影响之外,还受到性别、体重、饮食习惯、吸烟情况等因素的影响,用方程定量描述一个因变量y与多个自变量x1、x2、x3 之间的线性依存关系,称为多元线性回归。
有学者认为血清中低密度脂蛋白增高是引起动脉硬化的一个重要原因。
现测量30名怀疑患有动脉硬化的就诊患者的载脂蛋白A、载脂蛋白B、载脂蛋白E、载脂蛋白C、低密度脂蛋白中的胆固醇含量。
资料如下表所示。
求低密度脂蛋白中的胆固醇含量对载脂蛋白A、载脂蛋白E、载脂蛋白E、载脂蛋白C的线性回归方程。
表1 30名就诊患者资料表
spss数据处理步骤:
(1)打开spss输入数据后,点击“分析”—“回归”—“线性”。
然后将“低密度脂蛋白”选入因变量框,将“载脂蛋白A” “载脂蛋白E” “载脂蛋白E” “载脂蛋白C”依次选入自变量框。
方法选为“逐步”。
(2)单击“统计量”选项,原有选项基础上选择“R方变化”。
在残差中选“Durbin-Watson”,单击“继续”。
i [粘贴(E)] i ss (印11取消i L
帮助
(3)单击“绘制”,将“DEPENDNT ”选入“X2”中,将“*SRESID ”选入“Y 中,在标准残差图选项中选择“直方图”和“正态概率图”。
单击“继续”。
S3
闵蠢墨fD):
制IK
DEPEHDNT T ZPRED *ZF?ESID PRESID •ADdPRED
怡尺匚SID 怡口穆
ESILJ
呵直方便(比
“正态槪率副曰
继续
将(3),,
取卷 帮肋
銭性回归
册回归:圏
踰点1的1
厂产空所有制分團(巳
(4)单击“选项”,在原有选项的基础上单击“继续”,最后单击“确定”,就完 成了。
数据处理结果如下:
a.因变量低密度脂蛋白
上图为统计的基本信息
c
a. 预测变量:(常量),载脂蛋白B
b. 预测变量:(常量),载脂蛋白B,载脂蛋白C
c. 因变量:低密度脂蛋白
上图列出了模型的R、R方、调整R方。
R方值越大所反映的两变量的共变量比率越高,模型与数据的拟合程度越好。
结果显示:自变量和因变量之间的相关系数为0.733,拟合线性回归的确定性系数为0.538,经调整后的确定性系数为0.503。
c
a. 预测变量:(常量),载脂蛋白B
b. 预测变量:(常量),载脂蛋白B,载脂蛋白C
c. 因变量:低密度脂蛋白
上图是对拟合的两个模型的方差分析检验结果,两个SIG都小于0.05,说明两
个模型都有统计学意义,模型有统计学意义不等于模型内所有的变量都有统计学意义,还需要进一步对各自变量进行检验。
a.因变量低密度脂蛋白
上图为对两个模型中各个系数检验的结果,蛋白B、C其后的SIG都小于0.05, 均有统计学意义。
所以最后的回归方程为y=41.841+1.254x2-2.341x4
其后的标准系数可以用来比较自变量对因变量的影响强度,标准系数的绝对值越大说明说明对因变量的贡献越大,本例中B对因变量的影响最大,其次是C。
c
a. 模型中的预测变量常量载脂蛋白B。
b. 模型中的预测变量:(常量),载脂蛋白B,载脂蛋白C
c. 因变量:低密度脂蛋白
fl: Zr M
r.L;ftiri
上表为残差的直方图,可见残差分布比较均匀,近似服从正态分布,符合多元回归的条件。
I 叫归标准化残漿的标准巴P
图
囚变晟:低密度脇蛋门
1.0-1 -------------------------------------------------
0 .fl
fl .6-
Q OO
0 2-
i
i
i
r~
0.0 0?
04
06
08
观测的蚩枳槪率
上图为残差的正态PP 图,可见残差基本呈直线趋势,可以认为因变量呈正态分 布。
上图为低密度脂蛋白胆固醇对学生化残差的散点图,可见残差围绕均线均匀分 布,把部分残差绝对值在2以内,提示方差齐。
0 4-
i.£i
120
n
150 u
1M
低倉血册蚩白
園喪锻;低冷废船镒门
sedo=。