第九章2 多元回归分析
M od e l 1
(Constant) x1 x2
B .488 .576 4.769
Std. Error 2.218 .136 1.983
x3
-2.145
1.016
a. Dependent Variable: y
Stan d a rd i ze d Co effi ci e nts
Beta
.803 .470 -.416
yi yi 2 yi yˆi 2 yˆi y2
TSS RSS ESS
❖ 例2中,方差分析表为:Residual-残差:预测值与实测值的差
ANOVAb
M od e l
1
Re gre ssi o n
Sum of Squares 803.816
Re si du a l
204.734
Total
C oe f fi c ie n tsa
Unstandardized Coefficients
Model
B
Std. Error
1
(Constant) -1353.546
162.576
X1
.544
.075
X2
1.207
.217
a. Dependent Variable: Y
Standardized Coefficients
E( ξ i)=0 var(ξ i)=E(ξ i -E(ξ i))2=E(ξ i)2=σ2 3. 随机误差项在不同样本点之间是相互独立的,不存在 序列相关
cov(ξ i, ξ j)=0 i≠j i,j=1,2,…n cov(ξ i, ξ j)=E((ξ i -E(ξ i)(ξ j -E(ξ j))
=E(ξ i ξ j) =E(ξ i )E(ξ j) =0
1 x11 x21 … xp1 x= 1 x12 x22 … xp2
1 x1n x2n … xpn
ξ1 ξ2 e= …
bp
ξn
❖ 则 Y=XB+e
一、多元线性回归模型的基本假定
1. 解释变量x1,x2,…,xp是确定性变量,不是随机变量, 而且解释变量之间互不相关
2. 随机误差项具有零均值和同方差
若︱t︱<t α /2,则接受原假设.
❖ 如果一次t检验后,模型中存在多个不重要变量,一般是 将t值最小的变量删除掉,再重新进行检验,每次只剔除1 个变量.
Fi
bi2 aii
RSS n p 1
❖ aii是(X`X)-1主对角线上第i+1个元素
六、复相关系数和偏相关系数
复相关系数R是由ESS和TSS构造的统计量,用 来表示回归方程对原有数据拟合程度的好坏, 衡量作为一个整体的x1,x2,…,xp与y的线性关系 的大小。
如果解释变量对被解释变量的影响不显著,应从模型中删除,如果 解释变量对被解释变量的影响显著,应保留在模型中.
利用t统计量进行参数显著性检验的步骤如下:
(1) 假设: H0: bi=0 (2)构造统计量:
(3)检验
t bi sbi
sbi
s2y
xi xi 2
对给定α,若︱t︱>t α /2,说明拒绝原假设
❖ Yi= b0+b1x1i+b2x2i+…+bpxpi+ξi Y1=b0+b1x11+b2x21+…+bpxp1+ ξ1 Y2=b0+b1x12+b2x22+…+bpxp2+ ξ2 …
Yn=b0+b1x1n+b2x2n+…+bpxpn+ ξn
❖令 y1
❖ Y= y2
yn
b0 b1 ❖ B= …
❖ 回归统计量
(1)estimates:显示回归系数及相关的指标 (2)confidence intervals:显示未标准化回 归系数的置信区间
(3)covariance matrix: 未标准化回归系数 的方差—协方差矩阵 (4)model fit:模型检验
❖ 回归统计量
(5)R squared change:每引进一个x引起 的回归 (6)descriptive:显示变量的均值、标准差等 (7)Part and partial correlations:偏相关 (8)collinearity diagnostics:共线性诊断 (9)Durbon_waston:D.w.检验统计量
t .220 4.245 2.404 -2.111
Si g. .829 .001 .029 .051
Y=0.488+0.576x1+4.769x2-2.145x3 (4.245) (2.404) (-2.111)
Coefficientsa
Un stan d ard i ze d Co effi ci e nts
rp1 rp2 rpp
r11 r12 r1p r1y r21 r22 r2 p r2 y rp1 rp2 rpp rpy ry1 ry2 ryp ryy
r ij .12 i1i1 j 1 j 1 p
ij ii jj
r yi.12 i1i1 p
iy ii yy
❖ 简单相关系数只是一种表面上的数量的相关系数,而 并非本质的东西。偏相关系数才真正反映两个变量的 本质联系。
1008.550
a. Predictors: (Constant), x3, x1, x2
b. Dependent Variable: y
df 3 16 19
Mean Square 267.939 12.796
F 20.939
Si g. .000a
❖ 1.方程显著性检验(F检验)
❖ F检验是以方差分析为基础,对回归总体线性关系是否显著的一 种假设检验,是解释模型中被解释变量与所有解释变量之间的线 性关系在总体上是否显著的方法
检验的判定时,一般采用调整的R2,以消除自变量的个数以及
样本量的大小对R2的影响。
R2 ESS 1 RSS
TSS
TSS
❖
调整的R2
R 2 1 n 1 RSS
n p 1 TSS
❖ 其它变量被固定后,计算任意两个变量之间的 相关系数,这种相关系数称为偏相关系数。
r11 r12 r1p r21 r22 r2 p
yi yi 2 yi yˆi 2 yˆi y2 2yi yˆi yˆi y yi yˆi yˆi y ei yˆi y ei yˆi ei y
ei bˆ0 bˆ1x1i bˆp xpi bˆ0 ei bˆ1 ei x1i bˆp ei xpi 0
❖令
(最小二乘法)
Q
2 i
Q bˆ
0
Q 即 bˆ0
2
yi bˆ0 bˆ1x1i bˆp x pi 0
Q
bˆ1
2
yi bˆ0 bˆ1x1i bˆp x pi x1i 0
Q
bˆp
2
yi bˆ0 bˆ1x1i bˆp x pi x pi 0
4. 随机误差项与解释变量之间不相关
cov(xi, ξ i)=0 5. 随机误差项服从零均值,同方差的正态分布 ξ i~N(0,σ2 )
❖ 二、建立回归方程
❖设
Yˆ i bˆ 0 bˆ1x1i bˆ 2x2i bˆ pxpi
i yi yˆi yi bˆ 0 bˆ1x1i bˆ 2x2i bˆ pxpi
第九章 回归问题
❖ 第一节 一元线性回归 ❖ 第二节 多元线性回归 ❖ 第三节 可化为多元线性回归的问题 ❖ 第四节 曲线回归
§2 多元回归分析
❖ 一元线性回归只是回归分析中的一种特例。 ❖ 若某公司管理人员要预测来年该公司的销售额y时,
研究认为影响销售额的因素不只是广告宣传费x1,还 有消费人群个人可支配收入x2,价格x3,研究与发展 费用x4,各种投资x5,销售费用x6. ❖ ————多元回归问题。
0
xe 0
Y XB e X Y X XB X e
X XB X Y
Bˆ X X 1 X Y
❖ 三、多元线性回归模型的建模方法 ❖ 1.打开文件或新建文件
❖ 2.Analyze
regression
linear 3.建模方法
(1)enter:强迫进入法—如果因子数不多且符合多项回归条件 (2)stepwise:逐步选择法 (3)remove:强迫消除法 (4)backward:向后剔除法 (5)forward:向前引入法
R
ESS TSS
yˆi y2 yi y2
❖ 回归方程的拟合优度检验就是要检验样本数据点聚集在回归直 线周围的密集程度,从而评价回归方程对样本数据的代表程度。
由决定系数R2(有称复相关系数)来实现。
❖ 实际中,随着自变量个数的不断增加,必然会使得R2不断变化, 于是出现的问题是,R2变化是由于数学习性决定的,还是确实 是由于引入了好的变量进入方程而造成的。因此在作拟合优度
Beta
1.804 -.149 .913 1.062 -2.644 .182
t -2.634 3.292
-.416 2.341 2.703 -2.932 2.595
Si g. .039 .017 .692 .058 .035 .026 .041
Y=-13534.1+0.209x1-0.06x2+0.763x3+0.141x40.855x5+0.227x6
M od e l
B
Std. Error
1
(Constant) -13534.1 5138.920
x1
.209
.063
x2
-.060
.144
x3
.763
.326