当前位置:文档之家› 第12章-多重线性回归分析

第12章-多重线性回归分析

8
6 因变量总变异的分解
P
(X,Y)

Y
(Y Y) (Y Y)

(Y Y)
Y X

Y
Y
9
Y的总变异分解
Y Y Yˆ Y Y Yˆ
Y Y 2 Yˆ Y 2 Y Yˆ 2
总变异 SS总
回归平方和 剩余平方和
SS回
SS剩
10
Y的总变异分解
病程 (X2)
10.0 3.0 15.0 3.0 4.0 6.0 2.9 9.0 5.0 2.0 8.0 20.0
表 12-1 脂联素水平与相关因素的测量数据
空腹
回归模空型腹 ?
瘦素
脂联 BMI 病程 瘦素
脂联
(X3)

血糖 (X4)
素(Y)
(X1)
(X2)
(X3)
血糖 素(Y) (X4)
5.75 13.6 29.36 21.11 9.0 4.90 6.0 17.28
H 0: 1 2 3 4 0 ,即总体中各偏回归系数均为0; H 1:总体中各偏回归系数不为0或不全为0;
= 0.05。
2 计算检验统计量: 3 确定P值,作出推断结论。
拒绝H0,说明从整体上而言,用这四个自变量构成 的回归方程解释糖尿病患者体内脂联素的变化是有统 计学意义的。
的平方和 (Y Yˆ)2为最小。
只有一个自变量
两个自变量
例12-1 为了研究有关糖尿病患者体内脂联素水平的影响因 素,某医师测定30例患者的BMI、病程、瘦素、空腹血糖, 数据如表12-1所示。
BMI (X1)
24.22 24.22 19.03 23.39 19.49 24.38 19.03 21.11 23.32 24.34 23.82 22.86
X1
1
-1.030
0.530 -1.942 0.064
X2
1
-0.132
0.211 -0.625 0.538
X3
1
-0.811
0.253 -3.209 0.004
X4
1
-0.579
0.447 -1.294 0.208
做出统计推断:这四个变量中,变量X1、X2
和X4的偏回归系数无统计学意义,而X3对脂联 素水平的影响有统计学意义。
37
Fj

SS回(X j )/1 SS残 / (n m 1)
1 1, 2 n m 1
SS回 ( X j ) 表示偏回归平方和,其值愈大说 明相应的自变量愈重要。
一般情况下,m-1 个自变量对 Y 的回归平方 和由重新建立的新方程得到,而不是简单地把 b j X j 从有 m 个自变量的方程中剔出后算得。
3
给定X时,Y是正态分布、等方差示意图
y x
4
2 回归模型的前提假设
线性(linear) 独立(independent) 正态(normal) 等方差(equal variance)
恰好为“LINE”。
5
(1)a 为回归直线在 Y 轴上的截
距。
➢a > 0,表示直线与纵轴的交点在
原点的上方;
➢a < 0,则交点在原点的下方; ➢a = 0,则回归直线通过原点。
1.2 回归模型的前提假设
线性(linear) 独立性(independent) 正态性(normal) 等方差性(equal variance)
恰好为“LINE”。
1.3 估计回归参数,建立回归模型
最小二乘法(least square estimation,LSE)
基本思想:使各实测值Y与对应的估计值 Yˆ 之差
38
2.3.2偏回归系数的假设检验---t检验
检验假设:
H0: βi=0
H1: βi≠0 = 0.05。
检验统计量:
tbi

bi S bi
v n m 1
2.3.2偏回归系数的假设检验---t检验
表 12-3 偏回归系数的 t 检验
变量 自由度 回归系数 标准误
t值
P值
截距
1
58.199 0.11.578 5.027 0.000
第十二章 多重线性回归分析
1
复习
简单线性回归
回归模型的建立 回归系数的假设检验和区间估计
2
1 概述
Y 因变量 (dependent variable, response variable) X 自变量 (independent variable)
简单回归的形式:Yˆ a bX
简单回归是回归分析中最基本、最简单的一种, 又称直线回归。
35
2.3 各自变量的假设检验与评价
方差分析和决定系数检验所有自变量整体对应 变量的相关程度。
未指明方程中的每一个自变量对Y的影响。
而在实际工作中往往会关心的是每个变量的解 释。
36
2.3.1. 偏回归平方和
含义 回归方程中某一自变量 X j 的偏回归 平方和表示模型中含有其它 m-1 个自变量 的条件下该自变量对 Y 的回归贡献,相当于 从回归方程中剔除 X j 后所引起的回归平方 和的减少量,或在 m-1 个自变量的基础上新 增加 X j 引起的回归平方和的增加量。
2.3.2偏回归系数的假设检验---t检验
对同一资料,不同变量的t值间可以相互 比较,t的绝对值越大,说明该变量对回 归所起作用越大。
41
变量
截距 X1 X2 X3 X4
表 12-3 偏回归系数的 t 检验
自由度 回归系数 标准误
t值
1
58.199 0.11.578 5.027
1
-1.030
0.530 -1.942
对于两变量,R2=r2
13
回归系数的 t 检验
tb

b0 sb

n2
sb
sY .X l XX
sYX
Y Yˆ 2 n2
14
回归系数与相关系数的假设检验
结果等价:
tb tr
15
直线回归中三种假设检验间的关系
在直线回归中,相关系数的假设检验, 回归系数的假设检验,以及回归方程 的方差分析结果等价。
X2
1
-0.132
0.211 -0.625
X3
1
-0.811
0.253 -3.209
X4
1
-0.579
0.447 -1.294
P值
0.000 0.064 0.538 0.004 0.208
标准化 偏回归系

-0.343 -0.067 -0.566 -0.139
44
2.3.4 偏相关系数 partial correlation coefficient
2.1整体回归效应的假设检验---方差分析
Y的总变异分解
总变异SS总: (Y Y )2

剩余平方和SS剩或残差平方和: (Y Y )2

回归的贡献,回归平方和SS回: (Y Y )2
Y的总变异分解
SS总 SS回 SS剩
总 回 剩
总 n 1,回 m, 剩 n m 1
9.32 6.2 14.31 23.32 5.0 3.54 6.7 30.25
2.50 11.1 26.08 24.34 2.0 4.51 7.2 24.28
5.66 9.7 19.62 24.22 3.0 9.32 6.2 14.31
2.83 7.3 42.82 19.03 15.0 2.50 11.1 26.08
b0为截距(intercept),表示各自变量均为0时y的的估计值。 bi称为偏回归系数(partial regression coefficient),是βi的估 计值,表示当方程中其他自变量保持常量时,自变量Xi变化 一个计量单位,反应变量Y的平均变化量。
Yˆ 称为 X=(X1, X2, , Xk)时,反应变量Y的估计值。
4.51 7.2 24.28 24.38 6.0 6.86 7.3 22.76
8.47 9.1 18.94 23.82 8.0 8.47 9.1 18.94
9.92 8.1 16.08 22.86 20.0 9.92 8.1 16.08
1.3 估计回归参数,建立回归模型
变量 截距
X1 X2 X3 X4
回归方程的方差分析表
表 12-2 检验回归方程整体意义的方差分析表
变异来源
SS
自由度
MS
F
P
回归模型 1773.343
4
443.336
17.000
<.0001
残差
651.958
25
26.078
总变异
2425.301
29
R2 SS回 0.7312 SS总
R SS回 0.8551 SS总
自由度 1 1 1 1 1
回归系数 58.199 -1.030 -0.132 -0.811 -0.579
Yˆ 58.199 1.030X1 0.132X 2 0.811X3 0.579X 4
2.多重线性回归的假设检验
整体回归效应的假设检验---方差分析 偏回归系数的假设检验---t检验
1
-0.132
0.211 -0.625
1
-0.811
0.253 -3.209
1
-0.579
0.447 -1.294
P值
0.000 0.064 0.538 0.004 0.208
2.3.3 标准化偏回归系数
将原始观测数据进行标准化:X
* i

Xi
Si
相关主题