当前位置:文档之家› 多重回归分析

多重回归分析


H1:各 i (i=1、2、…、m)不全为 0
α =0.05
F
SS误差 / n m 1
表 13-3 多重线性回归方差分析表
SS回归 / m
变异来源 回 归 误 差 总变异
自由度 m n-m-1 n-1
SS SS 回 SS 误 SS 总
MS
F
P
SS 回/m MS 回/MS 误 SS 误/(n-m-1)
偏回归系数的假设检验
H0: i =0 H1: i ≠0(i=1、2 、…、m) α =0.05
构造 t 统计量
t bi
bi S bi
bi 为前面所求得的偏回归系数, S bi 是 bi 的标准误。在 H0 成立的前提下, tbi 服从
自由度为υ =n-m-1 的 t 分布。如果 t bi t / 2,n m 1 ,则在α 水平上拒绝 H0,可认 为 i ≠0,Xi 与 Y 之间有线性回归关系。
多重线性回归方程为:
ˆ 2.78990 0.03736 y X 1 0.05215 X 2 0.00206 X 3 0.03181 X4

多重线性回归方程的假设检验 总体模型的假设检验 偏回归系数的假设检验
总体模型的假设检验
H0: 1 = 2 =.…= i =…= m =0
第十三章 多因素对某数值变量 指标的影响分析 (P206)
用于分析一个应变量与多个自变 量之间的线性关系的研究方法
第一节 多重线性回归分析 (multiple linear regression )
一、多重线性回归模型
如果因变量Y与自变量X1、X2、…、Xm 间存 在有如下线性关系,则有:
Y 0 1 X 1 i X i m X m
表 13-2 30 名中学生的身体测量数据
编 号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X1 148.00 160.00 159.00 153.00 151.00 140.00 158.00 137.00 149.00 160.00 151.00 157.00 157.00 144.00 139.00 X2 41.00 49.00 45.00 43.00 42.00 29.00 49.00 31.00 47.00 47.00 42.00 39.00 48.00 36.00 32.00 X3 72.00 77.00 80.00 76.00 77.00 64.00 78.00 66.00 82.00 74.00 73.00 68.00 80.00 68.00 68.00 X4 78.00 86.00 86.00 83.00 80.00 74.00 83.00 73.00 79.00 87.00 82.00 80.00 88.00 76.00 73.00 Y 3.04 3.28 3.12 2.86 2.97 1.58 2.85 1.64 2.77 2.64 2.78 3.10 2.89 2.23 1.89 编 号 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 X1 139.00 149.00 142.00 150.00 139.00 161.00 140.00 152.00 145.00 156.00 147.00 147.00 151.00 141.00 148.00 X2 34.00 36.00 31.00 43.00 31.00 47.00 33.00 35.00 35.00 44.00 38.00 30.00 36.00 30.00 38.00 X3 71.00 67.00 66.00 77.00 68.00 78.00 67.00 73.00 70.00 78.00 73.00 65.00 74.00 67.00 70.00 X4 76.00 79.00 76.00 79.00 74.00 84.00 77.00 79.00 77.00 85.00 78.00 75.00 80.00 76.00 78.00 Y 1.78 1.97 1.77 2.56 1.60 2.88 1.77 2.10 2.40 2.88 2.25 1.86 2.38 2.10 2.64
满Xi、…、Xm之
间具有线性关系; 残差 ~ N (0, 2 ) ,即要求对任意一组自变量X1、 X2、…、Xi、…、Xm值所对应的应变量Y应相 互独立、服从正态分布、方差相等。

二、多重线性回归分析的一般步骤

多重线性回归方程的建立
由 n 例实际观测值用最小二乘法可求得式 (13-1) 中模型参数 0 、 …、 2 、 1 、
i 、…、 m 的估计值 b0 、 b1 、 b2 、…、 bi 、…、 bm ,从而得到 Y 的估计表达式:
ˆ b b X b X b X Y 0 1 1 i i m m
例13-1测量了30名中学生的身高X1(cm)、体重X2(kg)、胸 围X3(cm)、坐高X4(cm)与肺活量Y(L),数据见表13-2 。 试对Y与X1、X2、X3、X4做多重线性回归分析。
Y 0 1 X 1 i X i m X m
式中 0 是常数项,1 、 2 、 …、 i 、 …、 m 称为偏回归系数 (partial regression coefficient) ,是待定参数。 i (i=1、2、…、m)表示在其它自变量固定的条 件下,自变量 Xi 每改变一个单位时引起 Y 的平均改变量,即 Y 在 Xi 上的变化率。 ε 为随机误差,又称为残差(residual) ,它表示在 Y 的变化中不能用自变量 Xi (i=1、2、…、m)所解释的部分。
标准化偏回归系数的概念*

由于各自变量Xi一般具有不同的单位,不能直接通过偏回归系数
的绝对值大小来比较各自变量Xi对应变量Y的影响大小。此时可 通过对原始数据的标准化变换:
相关主题