多元线性回归分析ppt课件
多元线性回归
多元线性回归是用线性方程表达一个因变量与多 个自变量之间数量关系的统计分析方法。如:儿 童的心象面积,除与年龄有关外,还与性别、身 高、体重、胸围等因素有关。
复习直线回归(一)
直线回归是研究一个因变量与一个自变量之间线性趋势数量 关系的回归分析方法。 1、直线回归方程为ŷ=a+b*x,反映的是x和y之间数量依存 变化关系; 2、a是截距,b是回归系数,a和b是利用最小二乘法原理计 算而来; 3、用决定系数R2来说明回归模型的好坏,R2 =SS回/SS总。
S ig. .646 .002 .633
回归方程的假设检验(一)
与直线回归类似,根据y总变异的分解对回归方程进行方 差分析。 在回归分析中,y方面的总变异lyy分解为回归贡献U和剩余 变异Q:lyy=U + Q Q是总变异中不能由自变量解释的残差平方和, U是总变异中由自变量所引起的一部分变异。 自变量的作用是否显著,或整个方程是否有意义,就看回 归所能解释的变异U比剩余变异Q大多少而定,即进行方 差分析。
复习直线回归(二)
PAN.sav数据库是某地29名13岁男童的体重x (kg) 和肺 活量y(L)资料,试建立体重与肺活量的直线回归方程。 SPSS程序:Analyze Regression Linear,打开对 话框,把肺活量y放入应变量栏中,体重x放入自变 量栏中。 建立的直线回归方程为:ŷ= -0.009+0.060x a= -0.009 ;b= 0.060,表示体重每增加1kg ,肺活 量平均增加0.060L。 R2 = 0.542。 经t检验,体重对肺活量有影响,P = 0.000 < 0.05。
回归分析的步骤
1、建立线性回归方程; 2、回归方程的假设检验; 3、偏回归系数的假设检验与区间估计; 4、比较自变量对因变量的作用大小; 5、因变量的区间估计; 6、残差分析。 Analyze→Regression → Linear
建立线性回归方程(一)
即计算截距a和回归系数bi ,应用最小二乘 法原理,即要求残差平方和达到最小。 以 PAN.sav为例,作身高、体重对肺活量影 响的多元线性回归分析。 选择变量的方法有强迫引入法(系统默认)、 强迫剔除法、向前引入法、向后剔除法、 逐步回归法。
建立线性回归方程(二)
前进法:事先给一个挑选自变量进入方程的标准,开始时方程中除常数项外没 有自变量,然后按自变量对Y的贡献大小依次挑选进入方程,一直到方程外没有 变量进入为止,进入变量不再删除;
后退法:事先给一个剔除自变量的标准,开始时自变量全部在方程中,然后按自 变量对Y的贡献从小到大依次删除,一直到方程内没有变量删除入为止;删除 变量不再进入方程; 逐步向前法:每进入一个变量都要对已经在模型中的变量进行检验,对低于剔 除标准的变量要逐一剔除,直到方程内没有变量被剔除,方程外没有变量被引 入为止; 逐步向后法:是每剔除一个变量,都要对方程外的变量进行检验,对符合入选标 准的变量都要重新考虑引入。直到方程内没有变量被剔除,方程外没有变量被 引入为止;
多元线性回归模型(二)
设因变量为y,自变量为xi(i= 1,….,m),m元线 性回归方程为: ŷ=a+b1*x1+b2*x2+….+bm*xm, 或y=ŷ+e。 ŷ 是y的估计值或预测值; e是残差,不能由现有的自变量决定的部分; a为常数项或截距; bi为样本偏回归系数,即在其它自变量固定不变 情况下,xi改变一个单位,因变量平均改变bi 个单 位。对应的总体偏回归系数为βi,若βi =0,则该 自变量xi与因变量y之间无线性关系,即xi对因变 量y无影响 。
多元线性回归 分析
(一)对多变量资料进行多元分析的优点: 1、减少假阳性错误; 2、可以得到一个综合结论; 3、考虑了变量间的相互关系。 总而言之,是对多个相关变量同时进行分析。
(二)多元线性回归分析的应用条件 1.应变量与自变量之间的关系是线性的(linear) 2.各自变量之间相互独立(indedpendent) 3.各变量满足正态性(此条件可以放宽) (normality) 4.方差齐性(homogeneity or equal variance) 简称为LINE
“Coefficients”的表格
a s Coefficient
Unstandardized S tanda rdized Coeffic ients Coeffic ients Model B S td. Er ror Beta t 1 (Constant) -.577 1.241 -.465 体重 .054 .016 .666 3.377 身高 .005 .011 .095 .484 a. Dependent Variable : 肺 活 量
建议用各种方法、多种引入或剔除水准处理同一问题,若一些变量常被选中, 它们就值得重视。
建立线性回归方程(三)
SPSS中常用的对话框有:“Statistics”对话框中的 “Estimates” 和“Confidence intervals” 、 “Model” 选项。 自变量只有两个,应用系统默认的强迫引入法进行 分析,得出二元线性回归方程为: ŷ= -0.577+0.005x1 +0.054x2 对应SPSS的结果中标题为“Coefficients”的表格。
多元线性回归模型(一)
举例(见 PAN.sav): 根据某地29名13岁男童的身高x1(kg)、体重x2(cm) 和肺活量y(L)建立的二元线性回归方程为: ŷ= -0.577+0.005x1 +0.054x2 a= -0.577 ; b1= 0.005,表示在体重不变的情况下,身高每增 加1cm ,肺活量平均增加0.005L; b2= 0.054,表示在身高不变的情况下,体重每增 加1kg ,肺活量平均增加0.054L。
ቤተ መጻሕፍቲ ባይዱ
回归方程的假设检验(二)
方差分析的步骤如下: H0:总体中所有偏回归系数均为0; H1:总体中偏回归系数不为0或不全为0。 α = 0.05。 F=MS回归 / MS剩余 ,得P值大小; 若P≤ 0.05,则拒绝H0,接受H1,说明回归方程成立,因变 量与自变量之间有线性关系; 若P> 0.05,则不拒绝H0,说明回归方程不成立,因变量与 自变量之间无线性关系。 对应SPSS的结果中标题为“ANOVA”的表格,p=0.000。