计量经济学复习提纲一、导论相关关系和因果关系。
变量间具有相关性并不等于具有因果性。
计量经济学:计量经济学是数学、经济理论和统计学三者的结合。
计量经济学建模的步骤:(1)理论模型的建立;(3)模型参数的估计;(4)模型的检验。
(5)模型的应用模型的检验包括:经济意义检验、统计学检验、计量经济学检验(经典线性回归模型假设不满足的情况)和预测检验。
统计学检验包括:拟合优度检验、单个变量显著性检验、方程整体显著性检验 计量经济学检验包括:多重共线性检验、异方差性检验、自相关性检验。
假设检验包括两种方法:置信区间法和显著性检验法。
进行统计推断时可能发生两类错误:第一类错误(拒绝一个为真的零假设,也可称为弃真错误)和第二类错误(接受一个为假的零假设,或称取伪错误)。
二、线性回归基本思想:双变量回归模型1、 基本概念:回归。
总体回归模型和样本回归模型。
“线性”一词的含义:解释变量线性和参数线性。
我们所说线性回归模型中的“线性”指的是参数线性。
随机的总体线性回归方程:n i u X Y ii i ,,110 =++=ββ随机的样本线性回归方程:n i u X Y i ii ,1ˆˆˆˆ10 =++=ββ2、 参数估计方法:普通最小二乘法(Ordinary Least Squared ,OLS ) 普通最小二乘法原理:使残差平方和∑2ˆiu(SSR )最小对于样本回归方程:n i u X Y i ii ,1ˆˆˆˆ10 =++=ββ使其残差平方和最小,()()21022ˆˆˆˆmin∑∑∑--=-=iiii i X Y Y Y u ββ 对上式求偏导,可得正规方程组:∑∑+=i iX n Y10ˆˆββ∑∑∑+=210ˆˆi i iiX X XY ββ可求得,最小二乘估计量0ˆβ,1ˆβ为: X Y 10ˆˆββ-=, ()()()∑∑∑∑--=---=2221ˆX n X Y X n Y X X X Y Y X X ii i iiiβ3、 经典线性回归模型(Classical Linear Regression Model )假设,即最小二乘法的基本假定假定一:线性回归模型,回归模型是参数线性的。
假定二:在重复抽样中,X 值是固定的。
假定X 是非随机的。
该假定意味着所有的回归都是条件回归,是以X 的给定值作为条件。
假定三:随机误差项i u 的均值为零。
()0|=i i X u E假定四:随机误差项i u 的方差相等。
()2|var σ=i i X u假定五:各误差项之间无自相关。
()0,|,cov =ji j i XX u u j i ≠假定六:i u 和i X 协方差为零或()0=i i X u E ,即随机误差项和解释变量之间不相关。
假定七:观测次数n 必须大于待估计的参数个数或解释变量个数。
假定八:X 值要有变异性。
假定九:正确地设定了回归模型。
假定十:没有完全的多重共线性,即解释变量之间没有完全的线性关系(针对多元回归模型而言)。
以上十个假定为经典线性回归模型的基本假定。
假定十一:随机误差项i u 服从正态分布。
(由中心极限定理推导可得。
)4、 最小二乘估计量的精度或标准差统计学中估计量的精度由标准误差(标准误)来衡量,它是估计量方差的正的开方。
最小二乘估计量的方差和标准差:()222)(ˆvar σβ∑∑-=X X n Xi i, ()()0ˆvar ˆββ=se ()()∑-=221ˆvar X Xiσβ , ()()11ˆvar ˆββ=se 其中,2σ为随机误差项i u 的方差,是一个常数,无法直接获得,但在双边量模型中可由下列公式估算:2ˆˆ22-=∑n uiσ,2ˆσ为真实的2σ的估计值,n 为样本容量,n-2为残差平方和的自由度。
若∑2ˆi u已知,则2ˆσ可知。
()()21022ˆˆˆˆ∑∑∑--=-=iiii i X Y Y Y u ββ或()∑∑∑∑∑∑-=-=22222122ˆˆii i iii ixy x y x y uβ。
其中,X X x i i -=,Y Y y i i -=,分别代表变量与其样本均值的离差。
5、最小二乘估计量的性质高斯—马尔科夫定理:给定经典线性回归模型的基本假定,则在所有的线性无偏估计量中,最小二乘估计量是最优线性无偏估计量(BLUE ,the Best Linear Unbiased Estimators )。
线性:0ˆβ和1ˆβ为随机变量Y 的线性函数。
无偏性:最小二乘估计量的期望值等于其真实值。
最小方差性:即有效性,最小二乘估计量0ˆβ和1ˆβ的方差在所有线性无偏估计量中方差最小。
6、判定系数2R :拟合优度的度量,描述被解释变量Y由解释变量X所解释的程度。
拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。
2R 的取值范围:102≤≤R 。
()()∑∑--==222ˆY YYY SSTSSE R ii恒等式:SSR SSE SST +≡SSR 为残差平方和, SSE 为回归平方和,SST 为总平方和 由恒等式可得,SSTSSRR -=12样本相关系数r :判定系数2R 的开方,两变量间线性关系的度量。
∑∑∑----±=22)()())((Y Y X X Y Y X X r iii i, 11≤≤-r7、假设检验:对一个样本进行考察,从而决定它能否合理地被认为与假设相符,这一过程叫做假设检验单个变量的显著性检验,即检验斜率是否为零。
其零假设(虚拟假设)为:真实值为零;备择假设为:真实值不为零。
检验方法有两种:a 、置信区间法:在一定的置信水平α下,选双边备择假设,查出t临界值,构造置信区间。
β0的(1-α)%置信区间: )ˆ(ˆ)ˆ(ˆ02,20002,0βββββααse t se t n n ⋅+≤≤⋅--- β1的(1-α)%置信区间: )ˆ(ˆ)ˆ(ˆ12,21112,21βββββααse t se t n n ⋅+≤≤⋅---b 、显著性检验:如果有*110:ββ=H ,*111:ββ≠H ,则t 统计量服从自由度为(n-2)的t 分布,即()21*11~ˆ--=n t se t βββ。
根据备择假设与一定显著性水平查出相应临界值,若t统计量大于临界值,则拒绝零假设。
8、预测给定X 0,求Y 0。
三、多元线性回归模型n i X X X Y E kik i i i ,,2,1)(22110 =++++=ββββ 或 n i X X X Y kik i i i ,,2,122110 =++++=ββββ1、 偏回归系数保持模型中其他解释变量不变(为常数)时,某一个解释变量对应变量Y 的平均影响。
2、 多元线性回归模型的假定:参考课件 3、 参数的估计:普通最小二乘法OLS 估计量的性质:在线性回归模型假定下,OLS 估计量仍为最优线性无偏估计量。
以二元线形回归模型为例(了解):n i u X X Y i ii i ,1ˆˆˆˆˆ22110 =+++=βββ()()22211022ˆˆˆˆˆ∑∑∑---=-=ii iii i X X Y Y Y u βββ 求解正规方程组:22110ˆˆˆX X Y βββ++= ∑∑∑∑++=i i i i ii X X X X XY 212211101ˆˆˆβββ ∑∑∑∑++=222211202ˆˆˆi i i i iiX X X X XY βββ得到:22110ˆˆˆX X Y βββ--=, ()()()()()()()22122212122212ˆ∑∑∑∑∑∑∑-⋅-⋅=iiiiiiii iii x x x x x x x y x x y β()()()()()()()22122212112122ˆ∑∑∑∑∑∑∑-⋅-⋅=iiiiiiii iii x x x x x x x y x x y β最小二乘估计量的方差与标准差(见课件)二元线形回归模型中:3ˆˆ22-=∑n u iσ∑∑∑∑--=i i i i i ix y x y y u221122ˆˆˆββ4、 判定系数与校正的判定系数判定系数2R :拟合优度的度量,描述被解释变量Y由解释变量X所解释的程度。
取值范围:102≤≤R 。
拟和优度:()()∑∑--==222ˆY YY YSSTSSE R ii二元线形回归模型中:∑∑∑+=222112ˆˆi ii i i y x y x y R ββ(了解)恒等式:SSR SSE SST +≡校正的判定系数: )1()1(12----=n SST k n SSR R 或()111122-----=k n n R R2R 性质:若22,1R R k ≤>则;2R 不一定为正数。
5、 单个变量的显著性检验:t 检验单个变量的显著性检验,即检验斜率是否为零,即零假设为:真实值为零;备择假设为:真实值不为零。
在回归假定下,*0:j j H ββ=,*1:jj H ββ≠,则t 统计量服从自由度为(n-k-1)的t 分布,即()1*~ˆˆ---=k n jj j t se t βββ。
根据备择假设与一定显著性水平查出相应临界值,若t 统计量大于临界值,则拒绝零假设。
6、 方程整体显著性检验:F 检验F 检验:0:210====k H βββ ,F 统计量服从分子自由度为k ,分母自由度为(n-k-1)的F 分布,即()1,~....--=k n k F f d SSR f d SSE FF 检验的零假设是一个联合假设,0:210====k H βββ 等同于0:20=R H 。
二元线形回归模型方差分析表:用四、多重共线性1、 完全多重共线性和不完全多重共线性⑴完全多重共线性:解释变量之间存在完全线形关系。
后果:无法模型参数;参数估计量的方差无穷大。
⑵不完全多重共线性:解释变量之间存在部分线形关系。
后果:估计的模型参数可以估计,但不稳定;估计参数的方差增大;假设检验失效;所估计参数的经济意义不合理。
2、 原因。
⑴经济变量自身性质导致;⑵滞后解释变量的引入;⑶样本资料原因多重共线性是一个样本特征。
多重共线性不是一个有无的问题,而是一个程度问题。
3、 检验多重共线性的经验法则⑴R 2较高但t 值显著的不多;⑵解释变量两两高度相关;⑶辅助回归;⑷逐步回归法。
4、 多重共线性的处理方法:删除不重要的解释变量;获取额外的数据或新的样本;重新考虑模型;利用先验信息;变量变换等。
多重共线性一定不好吗?答案取决于研究目的。
五、异方差性1、 异方差性:2)var(i i u σ=异方差性在横截面数据中比在时间序列数据中较为常见。
2、 异方差性的后果最小二乘法估计的参数仍为线性无偏,但不再是有效的;假设检验失效;预测失效。
3、 异方差检验方法图示法;帕克检验;戈里瑟检验;怀特检验;戈德菲尔德—匡特检验。