当前位置:文档之家› 十二、多重线性回归模型解读

十二、多重线性回归模型解读


多变量线性回归方程的评价
• 建立了多变量线性回归方程后,只要将x1、x2、 x3、... ...xk的值代入方程
即可求得y的估计值 • 多变量回归方程建立后,需对其作出评价,包括三个方面: • (1)评价整个方程在α水准下有否显著性,可用F检验。 • 回归均方 • F = ─────,ν1 = k,ν2 = n-k-1 • 剩余均方 • 上式中k = 自变量的数目 • n = 观察的样本数
• y = b0 + b1x 或 • 上式y = 因变量拟合值(或预期的估计值) • • • x = 自变量观察值 a 或 b0 = 方程式中的截距,其含义是x = 0时的y值 b 或 b1 = 回归系数,相当于回归直线的斜率,它的含义 是指x每改变一个单位时,y的相应变化
回归系数b的估计
• Σ(yi-y)(xi-x) • b = ────────── • Σ(xi - x)2
• (j = 0,1,2,3……k)
• (i = 观察对象序号)
• 上式 y = 因变量(连续变量)
• b0 = 常数项,其含义同简单直线回归中的a


b1、b2、b3......bk = 偏回归系数
e = 误差项
偏回归系数bk的含义
• b1的含义是指当b2、b3......的作用保持恒定后,x1改变一个单位时,y将


求各个变量与其均数的离均差平方和、离均差积和
按最小二乘法原理,用逆矩阵法解出
• 已有现成的计算机软件可敷应用,十分方便,关键在于掌握
适用条件、正确解释结果。
标化偏回归系数
• • 偏回归系数bi的大小与自变量xj的取值范围宽窄有关 偏回归系数是有量纲的,由于各自变量的单位(量纲)不同,它们的偏回归系数 无法直接比较

ν= 自由度
• 算得F值后,查F值表即可知P值
直线回归方程的评价(ຫໍສະໝຸດ )• t检验 • b b • t = ── = ───────────,ν= n-2 • sb √[Σ(yi-y)2 /(n-2)]
• 上式 b = 回归系数 • • • sb = 回归系数b的标准误 用于衡量y的估计值yi的精确性 可用于估计b的可信区间

• • • • • • • •
如欲比较,需求标准化偏回归系数bsj,其与xj的单位无关
Σ(xj- x)2 /(n-1) bsj = bj × √[───────────] / sy Σ(yi- y)2 /(n-1) √[Σ(xj- x)2] = bj×───────── / sy。 √[Σ(yi- y)2] 或bsj= bjsj÷σy,或 bsj = bisj / √var by 式中sj为xj的标准差,σy为yi的标准差。
多变量线性回归分析
多变量线性回归分析
• 如果对因变量y(发生疾病或死亡或其它结局效应)能产生 影响的自变量x(或称预测变量、危险因素、混杂因素、效 应修饰因素)的数目不止1个,而有k个 • 上述(简单)直线回归方程即可写成多变量线性回归方程
多变量线性回归方程
• y = b0 + b1x1 + b2x2 + b3x3......+ bkxk + e • = b0 + Σbjxj + e
• 算得t值后,查t值表即可知P值。
直线回归方程的评价(续)
• (2)计算决定系数(R2,coefficient of determination) • Σ(yi-y)2 回归平方和 • R2 = ───── = ────── • Σ(yi-y)2 总平方和 • R2数值上与相关系数 r的平方相等,取值在0~1之间 • R2含义是“回归方程总变异中可由x解释部份所占百分比”。
标化偏回归系数(续)
• bj÷σy表示xj改变一个标准差时yi的改变 • 如xj以克表示与xj以千克表示时,前者的bj只有后者的1/1000, 而后者的σy也较前者大1000倍 • 但bj /σy不变,即bj /σy与单位无关 • 比较不同自变量的bj /σy大小,可找出绝对值最大的bj /σy • 其相应的xj即为对y作用最大的自变量
多重线性回归模型
直线回归分析
直线回归的回顾
• 最简单的直线回归分析是研究两个变量之间的依存关系。 • 如果因变量y(某种疾病或健康危害或其它结局效应)与自变 量x(某种病因或危险因素)之间有依存关系,且在散点图上 呈直线趋势,x与y的关系可用简单直线回归方程式来表示。
简单直线回归方程式
• y = a + bx 或
直线回归分析的例子
• 某研究显示的成人收缩血压与体重间依存关系的直线回归方程如下:


y = 90.243 + 0.275x
• 上式y = 收缩血压(mm Hg) x = 体重(磅)

• •
a = 90.243
b = 0.275 sb = 0.0816

t = 3.371,P = 0.0050
• 据此,知道了个体的体重即可估计其收缩血压 • R2 = 0.4664,说明体重可解释方程总变异的约46%
相应平均改变的(b1个)单位
• 或是在x2、x3、......xk与x1、以及x2、x3、…...xk与y的线性关系除去后,
x1改变一个单位时,y将相应平均改变b1个单位 • 多变量线性回归中,估计某个自变量的作用时,调整了其它变量的影响 • b1为正时,随x1增加y也增加 • b1为负时,随x1增加y就减少
• •
Σxiyi -(Σyi)(Σxi)/ n = ────────────
• Σxi2 -(Σxi)2 / n • a = y - bx
线性回归图示
(IMT与SBP)线性回归散点图
直线回归方程的评价
• 求出回归方程后,需对方程的意义作出评价,包括两方面:
• (1)回归系数的显著性(假设)检验: • 可用方差分析的F检验,也可用t检验,两者的结论一致 • F检验 • Σ(yi-y)2 / 1 • F = ─────────,ν1 = 1,ν2 = n -2 • Σ(yi-y)2 /(n-2) • 上式中n = 观察的样本数
偏回归系数bk的含义
• b2的含义是指当b1、b3、......bk的作用保持恒定后,x2改变一 个单位时,y将相应平均改变b2个单位
• b3、......bk的含义可依次类推
多变量线性回归分析(续)
• 建立多变量线性回归方程的关键是求出各个偏回归系数bj • 偏回归系数估计方法: • 先收集一组变量的原始数据
相关主题