当前位置:
文档之家› 空间分析原理与应用:第五章 空间回归分析
空间分析原理与应用:第五章 空间回归分析
5.2.2 总体回归函数
例子:不同家庭收入水平下的学生数学SAT成绩
家庭年收入与数学S.A.T分数
总体回归函数PRF
E(Y | X i ) B1 B2 X i
(2-1)
Y的条件期望,可简写为E(Y)
B1和B2是参数(parameters),也称回归系数 (regression coefficients)。
ui
.....................
ui
ui
uj
.............................
uj
.
. . ..
........................
uj
a)
b)
c)
无自相关假定表明随机扰动项ui是纯随机的。
• 自相关的性质:
自相关:在时间(如在时间序列数据中)或者空间 (如在横截面数据中)按顺序所列观察值序列
假定3.3 给定Xi,随机扰动项的期望为零。即
Eu | X i 0
假定3.4 同方差假定,即
Varui 2
假定3.5 无自相关假定,即
cov
u i
,u
j
0
i j
假定3.6 回归模型是正确设定的。即实证分析的
模型不存在设定误差或设定错误。
扰动项的条件分布
同方差和异方差的对比
自相关
例如:中国的国内生产总值与印度的人口之间具 有较强的相关性(相关系数较高),因为二者都以较 快的速度增长,但显然二者之间不具有因果关系。
回归分析的应用
(1)通过已知变量的值来估计应变量的均值 (2)根据经济理论建立适当的假设并对其进行检 验 (3)根据自变量的值对应变量的均值进行预测 (4)上述多个目标的综合
E(Y ) B1 B2 Xi 2
E(Y ) B1 B2 1 Xi
2. 参数线性
非线性举例:
E(Y
)
B1
B2 2
Xi
5.2.7 参数估计:普通最小二乘法
普通最小二乘法(OLS)
最小二乘原理
总体回归方程: Yi B1 B2 Xi ui 样本回归函数: Yi b1 b2 Xi ei
因而 ei Yi Yˆi Yi b1 b2 Xi
来自表2-1总体的两个随机样本
两个独立样本的回归线
总体回归线与样本回归线
Y
.Y1
需 求 量
. e1
u1
Yˆi b1 b2 Xi
.Yˆ1
EY | X B1 B2 Xi
A
..un Yn . en
Yˆn
0
X1 价格
Xn
X
5.2.6 “线性”回归的特殊含义
解释变量线性与参数线性
1. 解释变量线性 非线性举例:
的各数据间存在着相关。或者简单说,序列自 身前后期数据间存在相关性,称为自相关。
总体回归函数PRF E(Y | X i ) B1 B2 X i (2-1)
随机总体回归方程(stochastic PRF)
Yi B1 B2 X i ui
(2-2)
如何估计总体回归函数,即求参数B1、B2呢?
如果已知整个总体的数据,如上例,问题就比较简单, 但在实际中,我们往往不能得到整个总体的数据,只有 来自总体的某一个样本数据,我们该怎么做?
Yi B1 B2 X i ui
(2-2)
ui表示随机误差项(random error term),简称误差项。
5.2.4 随机误差项的性质
(1)在解释变量中被忽略的因素的影响; (2)变量观测值的观测误差的影响; (3)其它随机因素的影响包括人类行为中的一些 内在随机性;
5.2.5 样本回归函数
第五章 空间回归分析
5.1 一个回归例子
人均国内生成总值(GDP)与民主水平的关系 民主水平采用POLITY指数,它将国家按照一系列制度 标准划分成不同的类型。-10代表最不民主的社会,10代表 最民主的社会。
2002年世界各 国民主水平 与GDP
民主水平
人均GDP
回归方程:
POLITYscore 0 1 ln GDPpercapita
最小二乘原理就是选择合适参数使得全部观察值的残差平 方和(RSS)最小,数学形式为:
min{
ei2} min{
(Yi
Yˆi
2
)
}
min{ Yi b1 b2 Xi 2} (2-11)
普通最小二乘法就是寻找使RSS达到最小时的参数 作为参数估计值的一种方法。
利用极值原理可以得到:
正规方程
例如研究商品的需求量与该商品的价格、消费者 的收入以及其他同类商品的价格之间的关系。
通常我们用Y表示应变量,用X表示自变量。
回归分析是用来处理一个应变量与另一个或多个 自变量的关系,但它并不一定表明因果关系的存在。 两个变量是否存在因果关系,哪一个是应变量,哪一 个是自变量是由正确的理论决定的。
需要注意的是具有因果关系的变量之间一定具有 数学上的相关关系,而具有相关关系的变量之间并不 一定具有因果关系。
B1又称为截距(intercept),B2又称为斜率(slope)。 斜率度量了X每变动一个单位,Y的条件均值的变化率。
注意:回归分析是条件回归分析(conditional regression analysis)。
5.2.3 总体回归函数的统计或随机设定
随机总体回归方程(stochastic PRF)
Yi nb1 b2 X i
YiXi b1
Xi b2
X
2 i
求解得到: b1 Y b2 X
b2
xiyi xi2
Xi X Yi Y Xi X 2
(2-12)
2 i
nX
2
(2-15)
5.2.8 经典线性回归模型的假定(CLRM)
OLS估计结果:
空间相关的探测
5.2 回归分析方法回顾
5.2.1 回归的含义
回归分析是用来研究一个变量(称之为被解释变 量explained variable 或应变量 dependent variable)与 另一个或多个变量(称之为解释变量 explanatory variable 或自变量 independent variable)之间关系的 一种分析方法。
满足如下基本假定的线性回归模型称为古典线性回归模 型(Classical Linear Regression Model, CLRM)。
基本假定:
假定3.1 回归模型是参数线性的,但不一定是变量线性的。模
型形式如下:
Yi
B1
B2 X i
u i
假定3.2 解释变量X与随机扰动项u不相关。(X是确定性变量 时自然成立。)