多元线性回归分析课件
(2)各观测值Y j j 1,2,,n 之间相互独立; (3)残差 服从均数为 0、方差为 2 的正态分布,
它等价于对于任意一组自变量 X 1 , X 2 , X m ,应
变量Y 均服从正态分布且方差齐。
注意:虽然模型要求因变量是连续数值变量,但对自变量的类型不限。若 自变量是分类变量,特别是无序分类变量,要转化为亚变量才能分析。对 于自变量是分类变量的情形,需要用广义线性回归模型分析。
SS回归=b1l1y+ b2l2y + b3l3y + b4l4y =0.1424×67.6962+0.3515×89.8025+0.2706×142.4347+0.6382 ×84.5570 =133.7107;
ν回归=m=4
多元线性回归分析
1、对模型的假设检验—F检验
b0 11.9259 0.1424 5.8126 0.3515 2.8407 0.2706 6.1467 0.6382 9.1185
= 5.9433
线性回归方程模型为:
Yˆ 5.9433 0.1424X1 0.多3元5线1性5回X归分2析 0.2706X3 0.6382X 4
的线性关系而使因变量Y 变异减小的部分;
SS回归 b1l1Y b2l2Y bmlmY biliy
SS剩余 表示剩余平方和,说明除自变量外,其它随机因素
对 Y 变异的影响。 SS剩余 SS总 SS回归
多元线性回归分析
各变量的离差矩阵
b1 0.1424 , b2 0.3515 , b3 0.2706 , b4 0.6382
多元线性回归分析
多元回归分析数据格式
编号 X 1
X2
┅
1
X 11
X 12
┅
2
X 21
X 22
┅
┇
┇
┇
┇
Xj
┅
X1j
┅
X2j ┅
┇
┇
Xm Y
X 1m
Y1
X 2m Y2
┇
┇
i
X i1
X i2
┅
X ij
┅
X im
Yi
┇
┇
┇
┇
┇
┇
┇
┇
n
X n1
Xn2 ┅
Xnj ┅
X nm Yn
注:患者编号为 i (i 1,2,, n) ;变量个数为 j ( j 1,2,, m)
多元线性回归分析
各变量的离差矩阵
多元线性回归分析
求解后得 b1 0.1424 , b2 0.3515 , b3 0.2706 , b4 0.6382
各变量均值分别为: X1 5.8126 , X 2 2.8407 , X 3 6.1467 , X 4 9.1185 ,Y 11.9259 , 则常数项:
多元线性回归分析
二、多元线性回归分析的步骤
(一)估计各项参数,建立多元线性回归方程模型 (二)对整个模型进行假设检验,模型有意义的前提下,再分 别对各偏回归系数进行假设检验。 (三)计算相应指标,对模型的拟合效果进行评价。
多元线性回归分析
方程求方组回程中归中:系参数lij 数b1l,的bji2估,计(bXm可的i 用方X最法i )小(X二j 乘X法j )求得X,i X j [(Xi )(X j )]/ n
(二)对模型及偏回归系数的假设检验 1、对模型的假设检验—F检验 2、对偏回归系数的假设检验—F检验和t 检验 3、标准偏化回归系数
多元线性回归分析
1、对模型的假设检验—F检验
检验统计量为 F : F
SS回归 / m
SS剩余 /( n m 1)
SS回归 为回归项的平方和,反映由于方程中 m 个自变量与因变量Y
是也求就解是正求规liy出方程能(组使X(i估no计Xrmi值)a(lYYeˆqu和aYti实)on际s):观Xi察Y 值[(Xi )(Y)]/ n
Y的bb11ll误1211 差bb22平ll1222方和Qbbmmll12m(m (Y一l1l2yy)Yˆ)模2 为型最的小参值数估计
的一组回归系数
b1lm1 b2lm2
变量保持不变的条件下,自变量 X改i 变一个单位时因变量Y
的平均改变量。 为随机误差,又称残差(residual),它表
示 的Y变化中不能由自变量
Xii1,2,解 m 释的部分。
多元线性回归分析
y
Y ˆb0b1X1b2X2
x1
x2
多元线性回归分析
应用条件:
多元线性回归模型应满足以下条件:
(1) Y 与 X 1 , X 2 , X m 之间具有线性关系;
多元线性回归分析
一、多元线性回归方程模型
假定因变量Y与自变量 X1,X2,Xm间存在如下关系:
Y 0 1 X 1 2 X 2 m X m
式中, 0 是常数项, 1,2,m 称为偏回归系数(partial regression coefficient)。 ii1,2, m 的含义为在其它自
第十四章 多元线性回归分析
Muቤተ መጻሕፍቲ ባይዱtivariate linear regression
多元线性回归分析
一个变量的变化直接与另一组变量的变化有关:
如:
➢人的体重与身高、胸围
➢血压值与年龄、性别、劳动强度、饮食习惯、吸烟 状况、家族史
➢糖尿病人的血糖与胰岛素、糖化血红蛋白、血清总 胆固醇、甘油三脂
➢射频治疗仪定向治疗脑肿瘤过程中,脑皮质的毁损 半径与辐射的温度、 照射的时间
b1 ,b2 ,bm
bmlmm lmy
值。
常数项 b0 Y b1X1 b2 X2 ... bm Xm 多元线性回归分析
例14.1
27名糖尿病患者的血 清总胆固醇(x1)、 甘油三酯(x2)、空 腹胰岛素(x3)、糖 化血红蛋白(x4)、 空腹血糖(y)的测量 值列于表中,试建立 血糖与其它几项指标 关系的多元线性回归 方程。
多元线性回归分析
Multivariate linear regression
概念: 多元线性回归分析也称复线性回归分析(multiple linear regression analysis),它研究一组自变量如何直接影响一个 因变量。
自变量(independent variable)是指独立自由变量的变量,用向量X 表示;因变量(dependent variable)是指非独立的、受其它变量影响 的变量,用向量Y表示;由于模型仅涉及一个因变量,所以多元线性回 归分析也称单变量线性回归分析(univariate linear regression analysis)