计量经济学复习资料一、基本概念1、计量经济学以经济理论为指导,以事实为依据,以数学和统计推断为方法,以电脑技术为工具,以建立经济计量模型为手段,定量分析研究具有随机性特征的经济变量关系的经济学科。
2、相关关系当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。
3、因果关系一个变量(y)的变化是另一个变量(x)的变化所引起的,这两个变量间的关系称为因果关系4、解释变量影响研究对象的变量,它解释了研究对象的变动。
5、被解释变量是作为研究对象的变量,又称因变量。
它的变动是由解释变量做出的解释。
6、总体回归线在给定解释变量Xi 条件下因变量Yi 的条件均值或期望的轨迹。
7、总体回归函数:总体回归线所对应的函数E(Y/X i )=f(X i )称为总体回归函数。
总体回归函数(PRF )说明被解释变量Y 的平均状态(总体条件期望)随解释变量X 变化的规律。
8、拟合优度检验:就是检验模型对样本观测值的拟合程度。
(拟合优度检验的方法:通过构造一个可以表征拟合程度的统计量来实现。
)9、判定系数2r :是告诉人们样本回归函数对数据拟合效果的一个总度量。
2r 表示在Y 的总变异中由回归模型解释的那个部分所占的比例或百分比。
10、调整后的判定系数:由于增加解释变量个数引起的R 2的增大与拟合好坏无关,从而对2R 所进行的调整。
调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:22222211)1(1)1/()/(1Y i i Se k n n R n y k n uR ΛΛΛ--=----=---=∑∑δ 11、置信区间:求两个正数δ和)1,0(,∈αα,使得随机区间),(22δβδβ+-ΛΛ包含真实2β的概率为α-1,如果这样的区间存在,就被称为置信区间。
12、偏回归系数:在多元回归i i i i u X X Y +++=33221βββ中,2β、3β称为偏回归系数。
如2β度量着保持X 3不变的情况下, X 2每变化1单位时,Y 的均值E(Y | X 2, X 3)的变化。
13、偏相关系数:简单相关系数是指双变量回归模型中因变量与自变量的线性相关程度的度量;偏相关系数是其它变量保持不变,两个变量之间的相关程度的度量。
14、方差分析:TSS=ESS+RSS。
对TSS的这些构成部分的研究从回归的观点叫做方差分析P】一个回归模型所包含的回归元都是虚拟变量或定型变量,这种(ANOVA)。
【ANOVA表127模型被称为方差分析(ANOVA)模型。
15、协方差分析:若回归方程同时含有定性和定量的变量称为协方差分析。
16、虚假序列相关:由于随机项的序列相关往往是在模型设定中遗漏了重要的解释变量或对模型的函数形式设定有误,这种情形可称为虚假序列相关,应在模型设定中排除。
避免产生虚假序列相关性的措施是在开始时建立一个一般的模型,然后逐渐剔除确实不显著的变量。
二、基本思想一、数理经济模型和计量经济模型的区别数理经济学是用数学形式来表达经济理论中的确定性关系,而不管理论是否可以量化或是能够得到实证支持。
计量经济学利用数学方程表达经济变量间的非确定性关系,并用实际数据验证经济理论。
二、时间序列数据和横截面数据有何不同?时间序列数据是对一个变量在不同时间取值的一组观测结果。
(往往不能满足回归分析的基本假定:平稳性,均值和方差不随时间而系统地变化)横截面数据是指对一个或多个变量在同一时间点上收集的数据。
(可以近似假定,是从总体中通过随机抽样获得)三、回归分析与相关分析的区别与联系联系:回归分析和相关分析都是研究变量间关系的统计学课题。
区别:1)回归分析中需要区别自变量和因变量;相关分析中不需要区分 2)相关分析中所涉及的变量y与x全是随机变量。
而回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量。
3)相关分析的研究主要是为刻画两类变量间线性关系的密切程度。
而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。
四、随机误差项包含哪些因素影响。
随机误差项是模型遗漏的而又一起影响着Y的全部变量的替代物。
1.理论的含糊性。
有些影响Y的变量我们不是一无所知就是不太确定,因此用模型所排除或忽略的全部变量的替代变量。
2.数据的欠缺。
有些变量的信息很难得到。
3.核心与周边变量。
一些变量的影响很小,充其量是一种非系统或随机的影响,将其映入模型划不来,故把它们的共同影响当作一个随机变量来看待。
4.人类行为的内在随机性。
即使我们成功地把所有有关的变量都引进到模型中来,在个别Y中仍不免有一些解释不了的“内在” 随机性,干扰项可以很好地反映这种随机性。
5.糟糕的替代变量。
一些变量的实际数据会受到测量误差的干扰,甚至有些不可直接观测,只能利用替代变量。
这时干扰项可用来代表测量误差。
6.节省原则。
我们想保持一个尽可能简单的回归模型,若我们能用两三个变量“基本上”解释Y的行为,且我们的理论还未完善到足以提出可以包含进来的其他变量,就让代表其他变量。
7.错误的函数形式。
人们可能不确定回归元和回归子之间应该采用哪种函数形式。
五、最小二乘法和最大似然法的基本原理。
1.最小二乘法:用使估计的剩余平方和最小的原则确定样本回归函数,称为最小二乘准则。
2.最大似然法:用产生该样本概率最大的原则去确定样本回归函数,称为最大或然法。
六、为什么要计算调整后的可决系数?是模型中解释变量或回归元个数的非减函数,即随着回归元个数增加,必然增加或永不减少。
调整的对中平方和所涉及到的自由度进行调整,随着X变量个数的增加,调整的比未调整的增加的慢些。
将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响。
七、拟合优度检验(P3章)与方程显著性检验(P8章)的区别与联系。
区别:拟合优度检验就是检验模型对样本观测值的拟合程度,用判定系数来度量。
方程显著性检验旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立做出推断,用F检验来判断显著性水平。
联系:F与R2同向变化:R2越大,F值也越大。
当R2=0时,F=0;当R2=1时,F为无穷大;因此F检验是回归方程总的显著性的一个度量,也是R2的一个显著性度量。
八、正态性检验的方法(P132)1.残差直方图。
2.正态概率图3.统计量(安德森-达林正态性检验)4.正态性的雅克-贝拉检验(JB检验)九、什么是虚拟变量?它在模型中有什么作用?(书上定义)虚拟变量是一种基于性质或属性(性别、婚姻状况、种族和宗教信仰等)而将一个样本分为不同子群的数据分类方法。
并暗含地容许对每个子群分别进行回归。
(PPT上定义)虚拟变量,是一种离散结构的量,用来描述所研究变量的发展或变异而建立的一类特殊变量,常用来表示职业、性别、季节、灾害、经济结构变化、受教育程度等的影响。
也称为指标变量、二值变量、范畴变量、定性变量和二分变量。
虚拟变量的量化方法通常是赋值“1”和“0”。
使用虚拟变量可以使得我们在模型中引入定性回归元,使得模型更精确。
10、引入虚拟解释变量的两种基本方式是什么?它们各适用于什么情况?(1)以相加的形式引入虚拟变量来区分两个时期的截距,引入的虚拟变量的参数被称为级差截距系数;(2)以相乘的形式引入虚拟变量来区分两个时期的斜率系数,引入的虚拟变量的参数被称为级差斜率系数。
11、简述多重共线性的含义。
如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。
大致的说,多重共线性指的是X变量之间有准确的或近似准确的线性关系。
12、简述多重共线性的后果。
书上:如果X之间有完全多重共线性,则它们的回归系数是不确定的,并且它们的标准误没有定义。
然而,这些系数的线性组合是可以估计的。
如果共线性是高度的而不是完全的,则回归系数的估计是可能的,但趋向于有很大的标准误。
PPT上:参数估计值的方差与标准差变大;容易使通过样本计算的t值小于临界值,误导作出参数为0的推断;虽然t统计量不显著,但其拟合优度高;OLS估计量及标准误差对数据的敏感性大;预测值的置信区间较大,预测精确度较差。
13、列举多重共线性的检验方法简单相关系数法;综合统计检验法;判定系数检验法;本征值与病态指数;容许度与方差膨胀因子;14、列举多重共线性的解决办法第一类方法:排除引起共线性的变量:逐步回归法(逐步回归的基本思想是有进有出。
具体做法是以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。
然后,根据拟合优度的变化决定新引入的变量是否独立。
如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量;如果拟合优度变化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。
每一步都要进行F检验,以确保每次引入新的变量之前回归方程中只包含显著的变量。
)第二类方法:差分法(对于以时间序列数据为样本、以直接线性关系为模型关系形式的计量经济学模型,将原模型变换为差分模型,可以有效地消除存在于原模型中的多重共线性。
一般讲,增量之间的线性关系远比总量之间的线性关系弱得多。
)第三类方法:减少参数估计量的方差、岭回归方法(太复杂应该不用掌握)(多重共线性的主要后果是参数估计量具有较大的方差,所以采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。
)15、简述异方差性的含义对于不同的样本点i,随机误差项的方差不再是常数,则认为出现了异方差μ都是随机变量,服从均值为0的正态分性。
对于每一个样本点i,随机误差项i布;所谓异方差性,是指这些随机变量服从不同方差的正态分布。
16、简述异方差性的后果<1>考虑异方差的OLS估计:能使估计量标准差减少,预测区间变窄<2>忽视异方差性的OLS估计:a.普通最小二乘法参数估计量仍然具有无偏性,但不具有效性。
而且,在大样本情况下,参数估计量仍然不具有渐近有效性,这就是说参数估计量不具有一致性。
b.变量的显著性检验失去意义c.模型的预测失效(一方面,由于上述后果,使得模型不具有良好的统计性σ。
所质;另一方面,在预测值的置信区间中也包含有随机误差项共同的方差2以,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y 的预测误差变大,降低预测精度,预测功能失效。
)17、简述异方差性检验方法的共同思路由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。
那么,检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。
18、列举异方差性的检验方法<1>图示检验法Y-X图X-残差图Y-残差图<2>样本排序比较法斯皮尔曼的等级相关检验哥德菲尔德-匡特检验<3>残差回归检验法帕克检验格莱泽检验怀特检验(或者,图示法,帕克检验,格莱泽检验,斯皮尔曼等级相关法,戈德菲尔德—匡特检验,布劳殊—培干—戈弗雷检验和怀特检验)19、列举异方差性的解决方法当方差2i为已知时采用加权最小二乘法;未知时采用稳健性标准误差方法20、简述序列相关性的含义如果一个模型不满足OLS要求计量模型的随机误差项相互独立或不相关的假设,则我们称随机误差项之间存在自相关。