当前位置:文档之家› 多重线性回归模型

多重线性回归模型


编号
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29
医用多元统计分析方法
身高(cm) x1
135.1 163.6 156.2 167.8 145.0 165.5 153.3 160.5 147.6 155.1 143.0 160.8 158.2 144.5 156.5
体重(kg) x2 32.0 46.2 37.1 41.5 33.0 49.5 41.0 47.2 40.5 44.7 31.5 40.4 37.5 34.7 32.0
n
n
Q
yi yˆ i 2
yi b0 b1 x1 b2 x2 bm xm 2
i 1
i 1
医用多元统计分析方法
2 偏回归系数的估计
最小二乘法(least square, LS) 基本思想
残差平方和(sum of squares for residuals)最小
医用多元统计分析方法
xm2
xmn
n( m
1)
B
b1 bm (
m
E
1)1
e2
en
n1
Y XB E=Yˆ E
Yˆ XB
yˆ a b1 x1 b2 x2 bm xm
医用多元统计分析方法
回归方程的矩阵形式
1.75
2.00
Y
2.75
1.75
1
1
X
1
1
135.1 139.9 163.6
156.5
32.0
30.4
46.2
0.5657 B 0.005017
32.0
0.05406
31
Y XB E
1.75 0.5657 0.005017135.1 0.05406 32.0 0.0920 2.00 0.5657 0.005017139.9 0.05406 30.4 0.2204
➢ ei ~ N(0, 2),即正态性(Normality); ➢ Var(ei)= 2,即方差齐性(Equal variance);
LINE
医用多元统计分析方法
回归模型的应用条件
Y 成年后的身高(英寸)
71
69
67
65
63
30
32
34
36
38
40
ห้องสมุดไป่ตู้
X 两岁时的身高(英寸)
2岁身高X与成年后身高Y的散点图
多重线性回归模型
Multiple Linear Regression Model
主要内容
1 多重线性回归模型简介 2 偏回归系数的估计 3 方程的假设检验 4 偏回归系数的假设检验 5 决定系数与剩余标准差 6 回归与t检验、方差分析的关系 7 标准偏回归系数与自变量的贡献
医用多元统计分析方法
某地13岁男童身高,体重,肺活量的实测数据(部分)
-------------------------------------------------------------------------
y|
Coef. Std. Err.
t P>|t|
[95% Conf. Interval]
--------+----------------------------------------------------------------
2 偏回归系数的估计
正规方程及矩阵计算法
nb0 x1ib0 x2ib0
x1ib1
x12i b1
x1i x2ib1
x2ib2 x1i x2ib2 x22ib2
xmi bm x1i xmi bm x2i xmi bm
yi x1i yi x2i yi
医用多元统计分析方法
1 多重线性回归模型简介
小结:
yi yˆi ei b0 b1x1i b2 x2i L bm xmi ei
医用多元统计分析方法
主要内容
1 多重线性回归模型简介 2 偏回归系数的估计 3 方程的假设检验 4 偏回归系数的假设检验 5 决定系数与剩余标准差 6 回归与t检验、方差分析的关系 7 标准偏回归系数与自变量的贡献
医用多元统计分析方法
2 偏回归系数的估计
最小二乘法(least square, LS) 基本思想
残差平方和(sum of squares for residuals)最小!
医用多元统计分析方法
成都市男中小学生12个年龄组的平均身高
紫外光对新生小鼠背皮ATP酶阳性的郎格汉斯细胞(LC)照 射不同时间的细胞密度(个/mm3)
当x1=150,x2=32时,yˆ =1.9168, 表示对所有身高为150cm,体重为32kg的13 岁男童,估计平均肺活量为1.9168(L)。
医用多元统计分析方法
回归模型
包含误差项的回归模型 回归模型的应用条件 回归模型的矩阵形式
医用多元统计分析方法
包含误差的回归模型
yˆ a b1x1 b2 x2 L bm xm
y|
Coef. Std. Err.
t P>|t|
[95% Conf. Interval]
--------+----------------------------------------------------------------
x1 | .0299623 .0101372
2.96 0.011
.0080622 .0518624
医用多元统计分析方法
问题:
身高、体重两者与肺活量有无线性关系? 用身高和体重同时预测肺活量有多高的精度? 身高的贡献大,还是体重的贡献大?
医用多元统计分析方法
单变量分析的局限性:
复杂性疾病致病机制 遗传因素? 环境暴露? 交互作用?
医用多元统计分析方法
主要内容
1 多重线性回归模型简介 2 偏回归系数的估计 3 方程的假设检验 4 偏回归系数的假设检验 5 决定系数与剩余标准差 6 回归与t检验、方差分析的关系 7 标准偏回归系数与自变量的贡献
156.5
32.0 30.4
46.2
32.0
1
1
1
X ' 135.1 139.9 163.6
32.0 30.4 46.2
医用多元统计分析方法
1 156.5
32.0
2 偏回归系数的估计
29.00 4424.70 1076.70 X X 4424.70 677060.37 165239.80
免疫球蛋白A(IgA,g)与火箭电泳高度(Y,mm)的关系
建湖县1978~1985年疟疾逐月发病数
月 发 病 人 数
月份
2 偏回归系数的估计
直线回归方程:残差(residual)
Y 体重增量(g)
190 180 170 160 150 140 130 120 110
600
医用多元统计分析方法
Yˆ 23.9472 0.2305X
肺活量(L) y
1.75 2.75 2.75 2.75 2.50 3.00 2.75 2.25 2.00 2.75 1.75 2.75 2.00 2.25 1.75
身高与肺活量的关系
3
2.5
y
2
1.5 130
医用多元统计分析方法
140
150
160
170
身高(x1)
身高与肺活量的关系
. reg y x1
2
1.5 30
医用多元统计分析方法
35
40
45
50
体重(x2)
体重与肺活量的关系
. reg y x2
Source |
SS
df
MS
-------------+------------------------------
Model | 1.28270887
1 1.28270887
Residual | 1.45062446 13 .111586497
yi yˆi ei b0 b1x1i b2 x2i L bm xmi ei
实测值
预测值
残差
医用多元统计分析方法
回归模型的应用条件
yi yˆi ei b0 b1x1i b2 x2i L bm xmi ei
ei 称为残差:
➢ 自变量与因变量的关系是线性的(Linear); ➢ Cov(ei,ej)=0,即独立性(Independence);
xmi b0 x1i xmi b1 x2i xmi b2 xm2 i bm xmi yi
XXB XY
B ( X X )1 X Y
医用多元统计分析方法
2 偏回归系数的估计
正规方程及矩阵计算法
1.75 2.00
Y
2.75
1.75
1
1
X
1
1
135.1 139.9 163.6
700
800
900
X 进食量(g)
1000
2 偏回归系数的估计
6.5
Yˆ l2
6.0
5.5
Yˆ l1
Yˆ a bX
Y Y
5.0
11
12
13
14
15
16
点到回归直线的纵向距离平方和为最小!
医用多元统计分析方法
2 偏回归系数的估计
最小二乘法(least square, LS) 基本思想
残差平方和(sum of squares for residuals)最小
-------------+------------------------------
Total | 2.73333333 14 .195238095
相关主题