计量经济学多重共线性
例6.4.1 在电力消费量函数中,电力消费量与收入和
住房面积之间可能是对数形式的模型,而不是线性模型。我 们利用对数模型拟合上述数据,结果如下:
表6.4.1 回归结果
与方程(6.3.8)相比,在对数模型中,收入和住房面积系数在统 计上都是显著的,回归模型在整体上也是显著的。说明我们原先设计 的线性回归模型是有误的。
第六讲 多重共线性
6.1 多重共线性及其产生的原因
6.1.1 多重共线性(Multicollinearity)的定义
6.1.2 多重共线性产生的原因
根据经验,多重共线性产生的经济背景和原因有以下几个方面: 1.经济变量之间往往存在同方向的变化趋势 2.经济变量之间往往存在着密切的关联度 3.在模型中引入滞后变量也容易产生多重共线性
根据经济理论或其他信息,找出参数间的某种关系,并将这种关系作为约束 条 件 与 样 本 信 息 结 合 起 来 , 进 行 有 约 束 的 最 小 二 乘 估 计 。 例 如 , 著 名 的 CobbDouglas生产函数中:
6.4.3 变换模型的形式
对原设定的模型进行适当的变换,也可以消除或削弱原 模型中解释变量之间的相关关系。具体有三种变换方式,一 是变换模型的函数形式;二是变换模型的变量形式;三是改 变变量的统计指标。
年人均家庭电力消耗 量(千瓦小时) 21.2 23.2 26.4 31.2 35.3 42.4 46.9 54.6 61.2 72.7 83.5 93.1 101.8
人均居住面积 (平方米)
12.45 13.02 13.49 13.94 14.42 14.87 15.44 15.64 16.99 16.65 17.25 17.82 18.33
CN=最大特征值/最小特征值
这两个指标都反映了特征值的离散程度,数值越大,表明多重共线性 越严重。一般的经验法则是:CI>10即认为存在多重共线性,大于30认为存 在严重的多重共线性。
6.3.5 根据回归结果判断
下的临界值,而发现:(1)系数估计值的符号与理论分析结果相违背;; (2)某些变量对应的回归系数t值偏低或不显著;(3)当一个不太重要 的解释变量被删除后,或者改变一个观测值时,回归结果显著变化,则 该模型可能存在多重共线性。
4.在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性
6.2 多重共线性造成的影响
6.2.1 完全共线性下参数估计量不存在
多元线性回归模型
6.2.2 近似共线性造成的影响
1.增大最小二乘估计量的方差
2.参数估计量经济含义不合理 3.变量的显著性检验和模型的预测功能失去意义
在多元线性回归模型中,参数显著性检验的t统计量为
Correlations。
6.3.2 辅助回归模型检验
解释变量之间存在多重共线性可以看做是一个解释变量对其余解释变量 的近似线性组
6பைடு நூலகம்3.3 方差膨胀因子检验
6.3.4 特征值检验
考察解释变量的样本数据矩阵:
利用特征值还可以构造两个用于检验多重共线性的指标:条件数(或病态 数)CN(Condition Number)和条件指数(或病态指数)CI(Condition lndex)。其指标定义为
GNP(当年价) 8989.1 10201.4 11954.5 14922.3 16917.8 18598.4 21662.5 26651.9 34560.5 46670.0 57494.9 66850.5 73142.7 78017.8
进口总额IM 1257.8 1498.3 1614.2 2055.1 2199.9 2574.3 3398.7 4443.3 5986.2 9960.1 11048.1 11557.4 11806.5 11622.4
表6.3.3 相关系数
X1与X2相关系数高达0.963124,两者高度正相关。
图6.3.1 住房面积与收入之间的关系图 (2)辅助回归模型检验:将住房面积对收入进行回归,住房面积与收入之间 存在显著的线性关系。
(3)方差膨胀因子检验:
6.4 多重共线性的解决方法
6.4.1 保留重要的解释变量,去掉次要的或可替代的解释变量 6.4.2 利用先验信息改变参数的约束形式
间估计用于判断参数估计值的可靠性失去意义。变大的方差容易使预测的 “区间”变大,从而降低预测精度,使预测失去意义。
4.回归模型缺乏稳定性
6.3 多重共线性的检验
6.3.1 相关系数检验法(Klein判别法)
EViews软件中可以直接计算(解释)变量的相关系数矩阵: [命令方式] COR 解释变量名 [菜单方式] 将所有解释变量设置成一个数组,并在数组窗口中点击View\
年人均可支配收入 指数(1978=100)
243.17 254.28 265.39 277.61 273.49 281.33 289.71 307.66 321.07 339.33 356.58 383.95 399.85
首先,作家庭电力消耗量电量与家庭可支配收入的回归模型,结果如下:
可见,收入对用电量有很好的解释作用。 然后,作用电量与住房面积的的回归方程,结果如下:
例6.4.2 根据表6.4.2,建立我国进口需求与GNP和消费价格指数之
间的关系模型。 表6.4.2 我国进口支出与GNP和消费价格指数 (单位:亿元人民币)
年份 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
例6.3.1 分析我国居民家庭电力消耗量与可支配收入及居住面积的
关系,以预测居民家庭对电力的需求量(具体数据见表6.3.1)。 表6.3.1 我国居民家庭电力消耗量与可支配收入及居住面积统计资料
年度
1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997
同样,住房面积对电力也有很好的解释作用。作二元回归方程,结果如下: 表6.3.2 回归结果
住房面积的系数在方程(6.3.7)中是显著的,在方程(6.3.8)中不显著; 从F统计量值可以看出,收入和住房面积对电力消费量的共同影响是显著 的。
(1)相关 系数 检验: 数组 窗 口中点 击 View \ Correlations ,结 果如 表 6.3.3所示: