当前位置:文档之家› 最新934-回归分析概述

最新934-回归分析概述


(2) 其他因素和试验误差的影响。
20
1. 偏差平方和的分解
为检验以上两方面中哪一个对 Y 取值的影响是主要的, 就需要将它们各自对 Y 取值的影响,从 yi 总的差异中分 解出来。
与方差分析类似地,可以用总的偏差平方和
ST (yiy)2
来表示全部观察值 yi 间总的差异量。 将 ST 作如下分解:
反映了全部观察值与回归直线间总的偏离程度。 显然,Q 的值越小,就说明回归直线对所有样本数据的
拟和程度越好。 所谓最小二乘法,就是要使
Q(ˆ0,ˆ1) 为最小。
只要令
Q
ˆ0
0

Q
ˆ1
0
,
就可求出 βˆ0 , βˆ1 。
17
最小二乘法原理示意图
要找一条直线,使
y
(yi yˆi)2min 。
。。


。。 。
记 βˆ0 , βˆ1 分别是参数 0 和 1 的点估计,并记 Yˆ 为 Y 的条件期望 E( Y|X ) 的点估计,则由(8.2-1)
式, 有
Yˆˆ0ˆ1X
(8.2-2)
称(5.2-2) 式为回归方程。 并称 βˆ0 , βˆ1 为回归方程的 回归系数。
对每一 xi 值,由回归方程可以确定一个回归值
。。 。

yi
yˆ i
0
xi
x
18
四. 最小二乘估计的性质
可以证明,在满足经典假设的条件下
1. βˆ0和βˆ1 分别是参数 0 和 1 的最小方差无偏估计。
2. βˆ0 和βˆ1 的方差分别为:
D (β ˆ0)σ2[N 1 (xx i 2x)2], D(βˆ1)(xσi 2 x)2
以上两式说明, 回归系数 βˆ0 和βˆ1 的估计精度不仅 与 σ 2 及样本容量 N 有关,而且与各 xi 取值的分散程 度有关。 在给定样本容量下,xi 的取值越分散,则估
2. 解释变量是可以精确观察的普通变量(非随机变 量);
3. 解释变量与随机误差项是各自独立对被解释变 量产生影响的。
称满足以上条件的回归模型为经典回归模型。 本章仅讨论经典回归模型。
但在经济领域中,经济变量间的关系通常是不会完 全满足上述条件的。
例如家庭消费支出 Y 与家庭收入 X 间的回归模型就 不会是同方差的。
如何解释截距和斜率? 解 截距=35.0表示当学生不为期末考试做准备的话, 期末考试平均成绩是35.0。斜率=3表示每增加1小时 学习时间,期末考试平均成绩就变化+3.0。换句话说, 每增加1小时学习时间,期末成绩就增加3.0。
12
三. 回归模型的经典假设条件
1. 各 i ~ N( 0, 2 ),且相互独立;
13
四. 回归分析的主要内容和分析步骤 1. 根据问题的实际背景、专业知识或通过对
样本数据的分析,建立描述变量间相关关系的 回归模型;
2. 利用样本数据估计模型中的未知参数,得 到回归方程;
3. 对模型进行检验; 4. 利用通过检验的回归方程对被解释变量进 行预测或控制。
14
§8.2 一元线性回归
S T ( y i y ˆ i) 2 ( y ˆ i y ) 2 ˆSESR
Y = 0 + 1X
间的偏差是由其他一些无法控制的因素和观察误差引起的。
因此可以建立 Y 与 X 之间关系的如下线性回归模型
Y = 0 + 1X +
X —— 解释变量(自变量)
(8.1-1)其中
Y —— 被解释变量(因变量)
0, 1 —— 模型中的未知参数
—— 随机误差项
9
随机误差项产生的原因
一. 一元线性回归模型
设被解释变量 Y 与 解释变量 X 间存在线形相关关 系,则
Y = 0 + 1X + ; ~N(0, 2 )
其中 X 是普通变量。

Y ~ N( 0+ 1X, 2 )
称 Y 的条件期望
E( Y|X ) = 0 + 1X
为 Y 对 X 的回归。
(8.2-1)
15
二. 回归方程
yˆi βˆ0βˆ1xi
16
三. 回归模型的参数估计
回归模型中的参数估计,采用的是“最小二乘法”, 其原理如下:
Y 的各观察值 yi 与回归值 yˆ i 之差 yi yˆi 反映了 yi 与回归直线之间的偏离程度, 从而全部观察值与回归值
的残差平方和
Q (β ˆ0 ,β ˆ1 ) (y i y ˆi)2 (y i β ˆ0 β ˆ1 x i)2
计的方差就越小,即对参数 0 和 1 的估计就越精确;
反之估计的精确就差。 了解这一点,对指导试验或抽样调查是非常重要的。
19
五. 回归方程的显著性检验
通过参数估计得到回归方程后,还需要对回归方程进 行检验,以确定变量间是否存在显著的线性关系。
对一元线性回归模型,如果变量 Y 与 X 之间并不存在
yi = 0 + 1xi + i ; i =1, 2, ···, N (8.1-2) 其中 i 是其他因素和试验误差对 yi 影响的总和。
11
例 解释截距和斜率一名统计学教授打算运用学生 为准备期末考试而学习统计学的小时数(X)预测其 期末考试成绩(Y)。依据上学期上课班级中收集的 数据建立的回归模型如下:
(1) 模型中忽略的其他因素对 Y 的影响; (2) 模型不准确所产生的偏差; (3) 模型中包含了对 Y 无显著影响的变量; (4) 对变量的观察误差; (5) 其他随机因素的影响。
10
线性回归模型的数据结构 当 X 取不完全相同的值 x1, x2, ···, xN 时,得
到 Y 的一组相应的观察值 y1, y2, ···, yN 。显然, 每一对观察值 (xi, yi) 都应满足(5.1-1)式。 因此 一元线性回归模型有如下的数据结构:
934-回归分析概述
本章主要内容:
§8.1 回归分析概述 §8.2 一元线性回归 §8.3 曲回归 §8.4 多元线性回归
本章内容重点:
最小二乘法的原理;回归方程和回归系数的显著性 检验;多元线性回归及其预测和控制;软件的求解分 析。
2
二. 线性回归模型
由图可知,该食品家庭月平均消费量 Y 与价格 X 间基本呈 线性关系。这些点与直线
线性相关关系,则模型中的一次项系数 1 应为 0;反之, 则 1≠0。
故对一元线性回归模型,要检验的原假设为
H0:1 = 0
以上检验称为对回归方程的显著性检验,使用的仍然 是方差分析方法。
Y 的观察值 y1, y2, …, yN 之间的差异是由两方面的原因 引起的:
(1) 解释变量 X 的取值 xi 不同;
相关主题