多元线性回归分析(正式)
b0Y ( b1X 1b2X 2 )
用最小二乘法解正规方程组,使残差平方和Q最小。
Q Y Y ˆ 2 Y b 0 b 1 X 1 b 2 X 2 2
13
Y ˆ b 0 b 1 X 1 b 2 X 2 b m X m
l1 b 1 1 l1 b 2 2 l1 m b m l1 Y l2b 1 1l2b 22 l2 m b m l2Y lm 1 b 1 lm 2 b 2 lm b m m lmY
第15章
多元线性回归分析
Multiple Linear Regression Analysis
华中科技大学同济医学院公共卫生学院 流行病学与卫生统计学系
蒋红卫 Email: jhwccc@1Fra bibliotek讲课内容
第一节 多元线性回归(重点) 第二节 自变量选择方法(重点) 第三节 多元线性回归的应用及注
意事项
2
第一节 多元线性回归
一、多元线性回归模型
3
表 15-2 27 名糖尿病人的血糖及有关变量的测量结果
序号 i
总胆固醇 甘油三酯
(mmol/L) (mmol/L)
X1
X2
胰岛素 糖化血红蛋白 血糖
(U/ml)
(%)
(mmol/L)
X3
X4
Y
1
5.68
1.90
4.53
8.2
11.2
2
3.79
1.64
67.3601872.364-89.492296.728869.8025
lij -53.952-39.4923950.31-5076.38-61342.434
31.368276.728-567.386836.440874.5570
67.696829.802-1542.438447.5572022.551
b 1 0 .14 b 2 2 0 .34 5 b 3 1 0 .2 57 b 4 0 0 .66 3
17
b10.142b2 40.351b3 50.270b4 60.6382 X15.812X262.840X 736.146X 749.1185 Y1.1 9259
b 0 Y ( b 1 X 1 b 2 X 2 b m X m ) 5 .94
Y ˆ 5 . 9 4 0 . 1 3 X 4 1 3 0 . 3 2X 5 4 2 0 . 2 1X 7 5 3 0 . 6 0X 3 6 4
18
三、多元线性回归方程的 假设检验及评价
19
(一)回归方程的假设检验及评价 1.方差分析法
H0 :1 2 m 0 H 1 : j ( j 1,2, , m ) 不全为0。 S S 回 b 1l 1Y b 2 l 2 Y b m l mY SS残 SS总 SS回
b 0 Y ( b 1 X 1 b 2 X 2 b m X m )
14
用最小二乘法解正规方程组, 使残差平方和Q最小。
Q Y Y ˆ2
Y b0b 1X 1b2X 2bm X m2
15
表 15-2 27 名糖尿病人的血糖及有关变量的测量结果
序号 i
总胆固醇 甘油三酯
(mmol/L) (mmol/L)
66.010b1367.3b620-583.9b532331.3b648677.696 67.3b61 01872.3b26-498.49b32926.7b248869.802 -53.9b51-293.49b229350.3b31-0567.3b846-3142.43 31.3b618276.7b228-567.38b36386.4b440874.557
9
Y
Y ˆ abX
X
Y ˆ b0b1X1
10
Y ˆ b0b1X1
b(XX)(YY)lXY aYbX
(XX)2
lXX
b1
l1Y l 11
l11 b1 l1Y
b0 Yb1X1
11
Y
Y ˆb0b1X 1b2X 2
X1
X2
X ˆ2 b0b1X1
12
Y ˆb0b1X 1b2X 2
l1b 11l1b 22l1Y l2b 11l2b 22l2Y
MS
F
总变异 26 222.5519
回 归 4 133.7107 33.4277 8.28
残 差 22 88.8412 4.0382
P <0.01
F0.01(4,22)=4.31
22
2.决定系数R2
R2 SS回13.731070.6008 SS总 22.52519
7.32
6.9
8.8
3
6.02
3.56
6.95
10.8
12.3
27
3.84
1.20
6.45
9.6
10.4
4
例号 1 2 n
表 15-1 多元回归分析数据格式
X1
X2
Xm
X11
X12
X1m
X21
X22
X2m
Xn1
Xn2
Xnm
多元回归:多个Y,多个X 多重回归:一个Y,多个X
Y Y1 Y2 Yn
5
X1
X2
胰岛素 糖化血红蛋白 血糖
(U/ml)
(%)
(mmol/L)
X3
X4
Y
1
5.68
1.90
4.53
8.2
11.2
2
3.79
1.64
7.32
6.9
8.8
3
6.02
3.56
6.95
10.8
12.3
27
3.84
1.20
6.45
9.6
10.4
16
66.010367.360-583.952331.368677.6962
F
SS 残
SS回 /( n
/m m
1)
MS MS
回 残
20
表 15-3 多元线性回归方差分析表
变异来源 自由度 SS
MS
FP
总变异 n-1 SS 总
回归
m
SS 回
SS 回/m MS 回/MS 残
残 差 n-m-1 SS 残 SS 残/(n-m-1)
21
表 15-4 多元线性回归方差分析表
变异来源 自由度 SS
1.Y与X1,X2, ,Xm之间具有线性关系; 2.各个Yi间相互独立; 3.e服从均数为0、方差为2的正态分布。
7
多元线性回归分析步骤:
1.根据样本数据求得模型参数估计值:
Y ˆ b 0 b 1 X 1 b 2 X 2 b m X m
2.对回归方程及各Xj作假设检验。
8
二、多元线性回归方程的建立
Y 0 1 X 1 2 X 2 m X m e
β0 常数项 βj 偏回归系数(partial regression coefficient):
在其它自变量保持不变时,Xj增加或减少 一个单位时Y的平均变化量。
e 去除m个自变量对Y影响后的随机误差。
6
多元线性回归模型应用条件: