当前位置：文档之家› 最新934-回归分析概述

最新934-回归分析概述

(2) 其他因素和试验误差的影响。
20
1. 偏差平方和的分解
为检验以上两方面中哪一个对 Y 取值的影响是主要的，就需要将它们各自对 Y 取值的影响，从 yi 总的差异中分解出来。
与方差分析类似地，可以用总的偏差平方和
ST (yiy)2
来表示全部观察值 yi 间总的差异量。将 ST 作如下分解：
反映了全部观察值与回归直线间总的偏离程度。显然，Q 的值越小，就说明回归直线对所有样本数据的
拟和程度越好。所谓最小二乘法，就是要使
Q(ˆ0,ˆ1) 为最小。
只要令
Q
ˆ0
0
；
Q
ˆ1
0
,
就可求出 βˆ0 , βˆ1 。
17
最小二乘法原理示意图
要找一条直线，使
y
(yi yˆi)2min 。
。。
。
。
。。。
记 βˆ0 , βˆ1 分别是参数 0 和 1 的点估计，并记 Yˆ 为 Y 的条件期望 E( Y|X ) 的点估计，则由(8.2-1)
式，有
Yˆˆ0ˆ1X
(8.2-2)
称(5.2-2) 式为回归方程。并称 βˆ0 , βˆ1 为回归方程的回归系数。
对每一 xi 值，由回归方程可以确定一个回归值
。。。
。
yi
yˆ i
0
xi
x
18
四. 最小二乘估计的性质
可以证明，在满足经典假设的条件下
1． βˆ0和βˆ1 分别是参数 0 和 1 的最小方差无偏估计。
2. βˆ0 和βˆ1 的方差分别为：
D (β ˆ0)σ2[N 1 (xx i 2x)2], D(βˆ1)(xσi 2 x)2
以上两式说明，回归系数 βˆ0 和βˆ1 的估计精度不仅与 σ 2 及样本容量 N 有关，而且与各 xi 取值的分散程度有关。在给定样本容量下，xi 的取值越分散，则估
2. 解释变量是可以精确观察的普通变量(非随机变量)；
3. 解释变量与随机误差项是各自独立对被解释变量产生影响的。
称满足以上条件的回归模型为经典回归模型。本章仅讨论经典回归模型。
但在经济领域中，经济变量间的关系通常是不会完全满足上述条件的。
例如家庭消费支出 Y 与家庭收入 X 间的回归模型就不会是同方差的。
如何解释截距和斜率？解截距=35.0表示当学生不为期末考试做准备的话，期末考试平均成绩是35.0。斜率=3表示每增加1小时学习时间，期末考试平均成绩就变化+3.0。换句话说，每增加1小时学习时间，期末成绩就增加3.0。
12
三. 回归模型的经典假设条件
1. 各 i ～ N( 0， 2 )，且相互独立；
13
四. 回归分析的主要内容和分析步骤 1. 根据问题的实际背景、专业知识或通过对
样本数据的分析，建立描述变量间相关关系的回归模型；
2. 利用样本数据估计模型中的未知参数，得到回归方程；
3. 对模型进行检验； 4. 利用通过检验的回归方程对被解释变量进行预测或控制。
14
§8.2 一元线性回归
S T ( y i y ˆ i) 2 ( y ˆ i y ) 2 ˆSESR
Y = 0 + 1X
间的偏差是由其他一些无法控制的因素和观察误差引起的。
因此可以建立 Y 与 X 之间关系的如下线性回归模型
Y = 0 + 1X +
X —— 解释变量(自变量)
(8.1-1)其中
Y —— 被解释变量(因变量)
0, 1 —— 模型中的未知参数
—— 随机误差项
9
随机误差项产生的原因
一. 一元线性回归模型
设被解释变量 Y 与解释变量 X 间存在线形相关关系，则
Y = 0 + 1X + ；～N(0， 2 )
其中 X 是普通变量。
则
Y ～ N( 0+ 1X， 2 )
称 Y 的条件期望
E( Y|X ) = 0 + 1X
为 Y 对 X 的回归。
(8.2-1)
15
二. 回归方程
yˆi βˆ0βˆ1xi
16
三. 回归模型的参数估计
回归模型中的参数估计，采用的是“最小二乘法”，其原理如下：
Y 的各观察值 yi 与回归值 yˆ i 之差 yi yˆi 反映了 yi 与回归直线之间的偏离程度，从而全部观察值与回归值
的残差平方和
Q (β ˆ0 ,β ˆ1 ) (y i y ˆi)2 (y i β ˆ0 β ˆ1 x i)2
计的方差就越小，即对参数 0 和 1 的估计就越精确；
反之估计的精确就差。了解这一点，对指导试验或抽样调查是非常重要的。
19
五. 回归方程的显著性检验
通过参数估计得到回归方程后，还需要对回归方程进行检验，以确定变量间是否存在显著的线性关系。
对一元线性回归模型，如果变量 Y 与 X 之间并不存在
yi = 0 + 1xi + i ； i =1, 2, ···, N (8.1-2) 其中 i 是其他因素和试验误差对 yi 影响的总和。
11
例解释截距和斜率一名统计学教授打算运用学生为准备期末考试而学习统计学的小时数（X）预测其期末考试成绩（Y）。依据上学期上课班级中收集的数据建立的回归模型如下：
(1) 模型中忽略的其他因素对 Y 的影响； (2) 模型不准确所产生的偏差； (3) 模型中包含了对 Y 无显著影响的变量； (4) 对变量的观察误差； (5) 其他随机因素的影响。
10
线性回归模型的数据结构当 X 取不完全相同的值 x1, x2, ···, xN 时，得
到 Y 的一组相应的观察值 y1, y2, ···, yN 。显然，每一对观察值 (xi, yi) 都应满足(5.1-1)式。因此一元线性回归模型有如下的数据结构：
934-回归分析概述
本章主要内容：
§8.1 回归分析概述 §8.2 一元线性回归 §8.3 曲回归 §8.4 多元线性回归
本章内容重点：
最小二乘法的原理；回归方程和回归系数的显著性检验；多元线性回归及其预测和控制；软件的求解分析。
2
二. 线性回归模型
由图可知，该食品家庭月平均消费量 Y 与价格 X 间基本呈线性关系。这些点与直线
线性相关关系，则模型中的一次项系数 1 应为 0；反之，则 1≠0。
故对一元线性回归模型，要检验的原假设为
H0：1 = 0
以上检验称为对回归方程的显著性检验，使用的仍然是方差分析方法。
Y 的观察值 y1, y2, …, yN 之间的差异是由两方面的原因引起的：
(1) 解释变量 X 的取值 xi 不同；

e商务文档

最新934-回归分析概述

相关文档推荐：