计量经济学1、一元线性回归模型:建立两个变量的数学模型:Yi=β₁+β₂Xi +μi ,Yi 为被解释变量。
Xi 为解释变量。
μi 为随机误差项(随机扰动项或随机项、误差项)。
β₁,β₂为回归系数(待定系数、待定参数),这样的模型含有一个解释变量,而且变量之间的关系又是线性的,所以上式称为一元线性回归模型。
2、线性回归模型的基本假设:假设1、解释变量X 是确定性变量,不是随机变量;假设2、随机误差项μi 具有零均值、同方差和不序列相关性:E(μi )=0 i=1,2, …,n 。
Var(μi )= δu² i=1,2, …,n 。
Cov(μi ,μj)=0,i≠j i,j= 1,2, …n,假设3、随机误差项μi 与解释变量X之间不相关:Cov(Xi,μi)=0 i=1,2, …,n,假设4、μi 服从零均值、同方差、零协方差的正态分布: μi -N(0,δu²)i=1,2, …,n 。
注意:1、如果假设1、2满足,则假设3也满足;2、如果假设4满足,则假设2也满足。
3、普通最小二乘法(OLS ):为了研究总体回归模型中变量X 和Y 之间的线性关系,需要求一条拟合直线,一条好的拟合直线应该是使残差平方和达到最小,以此为准则,确定X 与Y之间的线性关系。
4、回归系数:β₁=1/n ﹙∑Yi -β₂∑Xi ﹚,β₂=n∑XiYi -∑Xi∑Yi /n∑Xi²-﹙∑Xi ﹚²5、常用结果:1、∑ei=0即残差项ei 的均值为0,2、∑eiXi=0即残差项ei 与解释变量Xi 不相关。
3、样本回归方程可以写成Yi º-¯Y¯=β₂(Xi-¯X¯)即样本回归直线过点(¯X¯, ¯Y¯)4、¯Yi º¯=¯Y¯即被解释变量的样本平均值等于其估计值的平均值6、样本可决系数:对样本回归直线与样本观测值之间拟合程度的检验。
样本观测值距回归曲线越近,拟合优度越好,X 对Y 的解释程度越强。
TSS=∑(Yi- ¯Y¯)²,RSS=∑(Yi º-¯Y¯)²,ESS=∑(Yi- Yi º)²其中TSS 为总离差平方和,RSS 为回归平方和(为样本回归线解释的部分),ESS 为残差平方和(样本回归线不解释的部)R²=RSS /TSS=1-∑ei²/∑yi²=β₂²∑xi²/∑yi=(∑xiyi) ²/∑xi²∑yi²,可决系数的取值范围:[0,1],R²越接近1,说明实际观测点离样本线越近,拟合优度越高。
7、样本相关系数:R=∑xiyi /(∑xi²∑yi²)½ 检验相关系数的t 统计量t=R(n-2) ½/(1-R ²)½~t(n-2)8、置信区间:β₁~N (β·, δu²∑Xi²/n∑xi ²), β₂~﹙βº, δu²/∑xi²﹚令δu²=∑ei²/n-2,t=β₂-βº/δβ₂~t(n-2),==≥βº∈[β₂-tα/2δβ₂,β₂+tα/2δβ₂],β·∈[β₁-tα/2δβ₁,β₁+tα/2δβ₁]9、回归系数估计值的显著性检验-t 检验:t=β₂-βº/δβ₂~t(n-2),提出假设H0:βº=0,H1:βº≠0 计算t=β²/δβ₂,然后比较t 与tα/2(n-2)的大小10、一元线性回归方程的预测:(1)点预测。
将X 的一个特定值 代入样本回归方程,计算得出的 就是 的点预测(2)区间预测。
是求出 的点预测值 之后在一定置信度下求 落在以为中心的的一个区间,从而可以分析 与的接近程度,分析结果的可靠性。
(1)单个值的预测区间Var(e º)=se ²[1+1/n+( - ) ²/∑xi ²],t= - /δ(e º) ~t(n-2), ∈[ -t α/2δ(e º), + t α/2δ(e º) ](2)均值的预测区间Var(δ0)= se ²[1/n+( - )²/∑xi ²],,t=E( )- /δ0~t(n-2), E( ) ∈[ - t α/2δ0, + t α/2δ0] 11、回归系数的经济意义:β₁表示边际倾向,表示Xi 每增加或减少一单位,Yi 便增加或减少β₁个单位,β₂是样本回归线在y 轴的截距,表示Yi 不受Xi 影响的情况下自发产生的行为。
12、多元线性回归模型的基本假定:1、E (ui )=0,即随机误差项是一个期望值或平均值为零的随机变量。
2、var(ui)=E(ui ²) =δ²即对于解释变量X1、X2、·····Xk 的所有观测值,随机误差项有相同的方差3、cov(ui,uj)=E(uiuj)=0即随机误差项彼此之间不相关。
4、cov(Xij,uj)=0即解释变量X1、X2、····Xk 是确定性变量,不是随机变量,与随机误差项彼X 0Y ˆ0Y 0Y 0Y ˆ0Y 0Y ˆ0Y ˆ0Y 0X 0X Y 0Y ˆ0Y 0Yˆ0Y ˆ0X 0X Y 0Y ˆ0Y 0Y ˆ0Y ˆ0此之间不相关5、rank(X)=k+1<n 即解释变量X1、X2、·····Xk 之间不存在精确的(完全的)线性关系,解释变量的样本观测值矩阵X 是满秩矩阵6、ui ~N (0,δ²)即随机误差项服从正态分布,被解释变量也服从正态分布。
N 为一多维正态分布。
13、多元线性回归模型的偏回归系数为:β=(X ’X ) -¹X ’Y14、R ²=1-ESS /TSS=β’x ’y /y ’y (原可决系数)一般来说,可决系数越接近于1,拟合程度越好,但随着解释变量的增多,可决系数会逐渐增大,这样就导致可决系数不能真实反应模型的拟合优度。
为什么在模型中增加一个解释变量, R2往往增大?因为没有考虑三个平方和的自由度。
R ²的调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:R ²=1-ESS /﹙n-k-1﹚/TSS ﹙n-1﹚其中n-k -1为残差平方和的自由度,n -1为总体平方和的自由度15、回归方程的显著性检验(F 检验):检验统计量:)1/(/F --=k n RSS k ESS 结论:给定显著性水平 ,如果 则否定原假设,即认为总体回归方程存在显著的线性关系。
16、拟合优度检验与方程显著性检验关系:与可推出或F 与R ²同向变化:当R ²=0时,F=0,R ²越大,F值也越大,当R ²=1时,F 无穷大,因此,F 检验是所估计回归的总显著性的一个度量,也是R ²的一个显著性检验,即检验H0:β₁=0、β₂=0、……, βk=0等价于检验R ²=0 17、解释变量的显著性检验(t 检验): 如果 则否定原假设,即认为解释变量对被解释变量有显著影响,否则,认为解释变量对被解释变量不存在显著影响。
(注意:一元线性回归中,t 检验与F 检验一致 )18、F 检验与t 检验的联系(一元线性方程):一方面,t 检验与F 检验都是对相同的原假设H0:β1=0 进行检验;另一方面,两个统计量之间有如下关系:F 检验:回归方程的显著性检验是指在一定显著性水平下,从总体上对模型中被解释变量与解释变量之间的线性关系是否显著进行的一种统计检验对回归模型,F 检验:检验总体回归方程是否显著的线性关系。
T 检验:解释变量的显著性检验,是指在一定显著性水平下,检验模型的解释变量是否对被解释变量有显著影响的一种统计检验。
回归方程线性关系的显著性,并不意味着解释变量对被解释变量的影响都是显著的,因此有必要对每个解释变量进行显著性检验。
T 检验是检验解释变量对被解释变量是否有显著影响。
19、多元回归系数的置信区间: ),1(~)(ˆˆ---=k n t S i i iit βββ,对于给定的α分布表可从t 查出相应自由度),(水平的双侧分位数为ναναt k n 2,1--=置信度为则βi-1 222212221222122212212ˆ)2(ˆ)2(ˆ)2(ˆ)2(ˆt x n e x n e x n e n e x n e y F i i i i i i i i i i =⎪⎪⎭⎫ ⎝⎛⋅-=⎪⎪⎪⎭⎫ ⎝⎛-=-=-=-=∑∑∑∑∑∑∑∑∑∑ββββ)1/()1(/22---=k n R k R F kF k n n R +----=1112)1/(/--=k n RSS k ESS F )1/()1/(12----=n TSS k n RSS R α)1,(F F -->k n k α)S(ˆˆββi i i t =)(2n tt i α>的置信α)()(ˆˆ2ββναii S t ⋅±区间的两个端点为 20、异方差的概念:对于不同的样本点,随机误差项的方差不再是常数,则认为出现了异方差性。
21、异方差的来源与后果:来源:(1)异方差常来源于截面数据(2)有时异方差来源于测量误差和模型中被省略的一些因素对被解释变量的影响(3)此外,用分组数据来估计计量模型也是异方差性的一个重要来源。
后果:1、计量经济模型中若存在异方差性,采用最小二乘法估计模型参数,估计量仍具有线性性和无偏性,但不具有最小方差性(即有效性)2、变量的显著性检验失去意义3、模型的预测失效22、G-Q 检验以F 检验为基础,适用于样本容量较大、异方差递增或递减的情况。
G-Q 检验的思想:先将样本一分为二,对子样①和子样②分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。
由于该统计量服从F 分布,因此假如存在递增的异方差,则F 远大于1;反之就会等于1(同方差)、或小于1(递减方差)。
G-Q 检验的步骤:①将n对样本观察值(Xi,Yi)按解释变量观察值Xi 的大小排队②将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2 ③,对每个子样分别求回归方程,并计算各自的残差平方和4、提出假设5、构造统计量6、检验(117)23、异方差性的修正方法:加权最小二乘法24、自相关的定义:如果Cov (ui , uj ) ≠ 0, (i ≠ j) ,则称误差项ut 存在自相关自相关又称序列相关。