当前位置:
文档之家› 李子奈计量经济学课件 Eviews使用介绍 第二章 回归分析基本方法
李子奈计量经济学课件 Eviews使用介绍 第二章 回归分析基本方法
2、回归分析的基本概念
回归分析(regression analysis)是研究一个变量关于另一个 回归分析 是研究一个变量关于另一个 变量的具体依赖关系的计算方法和理论。 (些)变量的具体依赖关系的计算方法和理论 其用意:在于通过后者的已知或设定值,去估计和(或)预 其用意:在于通过后者的已知或设定值,去估计和( 测前者的(总体)均值。 测前者的(总体)均值 这里:前一个变量被称为被解释变量(Explained Variable) 被解释变量( 被解释变量 ) 或应变量(Dependent Variable), 应变量( ),后一个(些)变量被称为解 应变量 ), 解 Variable) 自变量 自变量( 释变量( 释变量(Explanatory Variable)或自变量(Independent Variable)。 ) 回归分析构成计量经济学的方法论基础,其主要内容包括: 回归分析构成计量经济学的方法论基础,其主要内容包括: (1)根据样本观察值对经济计量模型参数进行估计,求得回 回 归方程; 归方程; (2)对回归方程、参数估计值进行显著性检验; ) (3)利用回归方程进行分析、评价及预测。
总体回归模型n个随机方程的矩阵表达式为 总体回归模型 个随机方程的矩阵表达式为 个随机方程的矩阵表达式
Y = X β+ μ
其中
1 1 X = M 1 X 11 X 12 M X 1n X 21 X 22 M X 2n L L L X k1 X k2 M X kn n × ( k +1 )
二、一元总体回归函数
回归分析关心的是根据解释变量的已知或 回归分析关心的是根据解释变量的已知或 给定值,考察被解释变量的总体均值,即当解 给定值,考察被解释变量的总体均值 释变量取某个确定值时,与之统计相关的被解 释变量所有可能出现的对应值的平均值。
概念: 概念:
在给定解释变量Xi条件下被解释变量Yi的期望 轨迹称为一元总体回归线 一元总体回归线(population regression 一元总体回归线 line),或更一般地称为一元总体回归曲线 一元总体回归曲线 一元 (population regression curve)。 相应的函数:
负相关 1 ≤ ρ XY ≤ 1 正相关 非线性相关 不相关 负相关
▲注意: 注意: 注意
①不线性相关并不意味着不相关; ②有相关关系并不意味着一定有因果关系; 回归分析/相关分析 相关分析研究一个变量对另一个 ③回归分析 相关分析 (些)变量的统计依赖关系,但它们并不意味着一定 有因果关系。 相关分析对称地对待任何(两个)变量,两个 ④相关分析 变量都被看作是随机的。回归分析 回归分析对变量的处理方法 回归分析 存在不对称性,即区分应变量(被解释变量)和自变 量(解释变量):前者是随机变量,后者不是。
第二章 回归分析的基本方法
回归分析概述 线性回归模型及假定 线性回归模型的参数估计
§2.1 回归分析概述
一、变量间的关系及回归分析的基本概念 二、一元总体回归函数 三、随机扰动项 一元样本回归函数 SRF) 样本回归函数( 四、一元样本回归函数(SRF)
§2.1 回归分析概述
一、变量间的关系及回归分析的基本概念 1、变量间的关系 经济变量之间的关系,大体可分为两类: (1)确定性关系 函数关系 : 研究的是 确定性关系或函数关系 确定性关系 函数关系: 确定现象非随机变量间的关系。
或
e1 e e= 2 M e n
Y = Xβ+ e
其中: 其中:
β0 = β1 β M β k
二、多元线性回归模型的基本假定
假设1,解释变量是非随机的或固定的,且各 X之间互不相关(无多重共线性)。 假设2,随机误差项具有零均值、同方差及不 序列相关性
函数形式: 函数形式:
可以是线性或非线性的。
E (Y | X i ) = β 0 + β 1 X i
为一线性函数。其中,β0,β1是未知参数,称为 线性函数。 线性函数 回归系数(regression coefficients)。 。 回归系数
三、随机扰动项
记
i = Yi E (Y | X i )
方程表示:各变量X值固定时Y的平均响应。 方程表示:各变量X值固定时Y的平均响应。
β j 也被称为 偏回归系数 , 表示在其他解释变 也被称为偏回归系数 偏回归系数,
个单位时, 量保持不变的情况下, 每变化1个单位时 量保持不变的情况下 , Xj 每变化 个单位时 , Y 的均值E(Y)的变化 的变化; 的均值 的变化 给出了X 的单位变化对Y均值的 均值的“ 或者说 βj给出了 j 的单位变化对 均值的 “ 直 不含其他变量)影响。 接”或“净”(不含其他变量)影响。
i=1,2…,n
其中:k为解释变量的数目,βj称为回归参数 回归参数 (regression coefficient)。 习惯上:把常数项 常数项看成为一虚变量 虚变量的系数,该 习惯上 常数项 虚变量 虚变量的样本观测值始终取1。这样: 模型中解释变量的数目为( + 模型中解释变量的数目为(k+1)
E (Y | X i ) = f ( X i )
称为(双变量)一元总体回归函数(population 一元总体回归函数( 一元总体回归函数 regression function, PRF)。 )
含义: 含义:
回归函数(PRF)说明被解释变量Y的平均状 态(总体条件期望)随解释变量X变化的规律。
正相关 不相关
对变量间统计依赖关系的考察主要是通过相关分析 对变量间统计依赖关系的考察主要是通过相关分析(correlation 统计依赖关系的考察主要是通过相关分析 analysis)或回归分析 来完成的: 或回归分析(regression analysis)来完成的: 来完成的
线性相关 统计依赖关系 相关系数: 有因果关系 无因果关系 回归分析 相关分析
▼回归分析的主要目的 回归分析的主要目的:根据样本回归函数SRF,估计 回归分析的主要目的 总体回归函数PRF。 即,根据 估计
Yi = Yi + ei = β 0 + β 1 X i + ei
Yi = E (Y | X i ) + i = β 0 + β 1 X i + i
注意: 注意:这里PRF可能永 远无法知道。
i ~ N (0, σ 2 )
上述假设的矩阵符号表示 上述假设的矩阵符号表示 式: 假设1,n×(k+1)矩阵X是非随机的,且X的秩ρ=k+1, 即X满秩。 假设2,
1 E ( 1 ) E (μ = E M = M = 0 ) E ( ) n n 1 12 L 1 n E (μ ′ ) = E M (1 L n ) = E M μ O M L 2 n n n 1
四、一元样本回归函数(SRF) 一元样本回归函数( 回归函数 )
总体的信息往往无法掌握,现实的情况只能是在 一次观测中得到总体的一个样本。 问题: 问题:能从一次抽样中获得总体的近似的信息吗? 如果可以,如何从抽样中获得总体的近似信息?
该样本的散点图 散点图(scatter diagram): 散点图
称i为观察值Yi围绕它的期望值E(Y|Xi)的离差 离差 (deviation),是一个不可观测的随机变量,又称 ) 为随机干扰项(stochastic disturbance)或随机误 随机干扰项( 随机干扰项 ) 随机误 差项( 差项(stochastic error)。 )
(*)
(*)式称为一元总体回归函数(方程)PRF的随 一元总体回归函数(方程)PRF的随 一元总体回归函数 机设定形式。 机设定形式。表明被解释变量除了受解释变量的系统 性影响外,还受其他因素的随机性影响。 性影响外,还受其他因素的随机性影响。 由于方程中引入了随机项,成为计量经济学模型, 因此也称为一元总体回归模型。 一元总体回归模型。 一元总体回归模型
Yi = β 0 + β 1 X 1i + β 2 X 2i + L + β ki X ki + ei
ei称为残差或剩余项 称为残差 剩余项(residuals),可看成是总 残差或 , 的近似替代。 体回归函数中随机扰动项i的近似替代。 样本回归函数的矩阵表达: 样本回归函数的矩阵表达:
Y = Xβ
Yi = β 0 + β 1 X 1i + β 2 X 2 i + + β k X ki + i
也被称为总体回归函数的随机表达形式。 也被称为总体回归函数的随机表达形式。它 的 总体回归函数 非随机表达式为 非随机表达式为:
E (Yi | X 1i , X 2 i , L X ki ) = β 0 + β 1 X 1i + β 2 X 2 i + + β k X ki
§2.2 线性回归模型
一、多元线性回归模型 二、多元线性回归模型的基本假定
一模型中的 多元线性回归模型 解释变量有多个。 一般表现形式: 一般表现形式
Yi = β 0 + β 1 X 1i + β 2 X 2 i + + β k X ki + i
E ( i ) = 0
Var ( i ) = E ( i2 ) = σ 2
Cov( i , j ) = E ( i j ) = 0
i ≠ j i, j = 1,2,L, n
假设3,解释变量与随机项不相关
Cov( X ji , i ) = 0
j = 1,2 L, k
假设4,随机项满足正态分布
样本散点图近似于一条直线,画一条直线以尽好地拟合该 散点图,由于样本取自总体,可以该线近似地代表总体回归线。 该线称为一元样本回归线(sample regression lines)。 一元样本回归线( )。 一元样本回归线 记样本回归线的函数形式为: Yi = f ( X i ) = β 0 + β 1 X i 称为一元样本回归函数(sample regression function, 一元样本回归函数( 一元样本回归函数 , SRF)。 )