当前位置:文档之家› EVIEWS案例:(消除异方差)医疗机构数与人口数的回归模型

EVIEWS案例:(消除异方差)医疗机构数与人口数的回归模型

第五章 案例分析
一、问题的提出和模型设定
根据本章引子提出的问题,为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。

假定医疗机构数与人口数之间满足线性约束,则理论模型设定为
i i i u X Y ++=21ββ (5.31)
其中i Y 表示卫生医疗机构数,i X 表示人口数。

由2001年《四川统计年鉴》得到如下数据。

表5.1 四川省2000年各地区医疗机构数与人口数
地区
人口数(万人) X
医疗机构数(个)
Y
地区
人口数(万人) X
医疗机构数(个)
Y
成都 1013.3 6304 眉山 339.9 827 自贡 315 911 宜宾 508.5 1530 攀枝花 103 934 广安 438.6 1589 泸州 463.7 1297 达州 620.1 2403 德阳 379.3 1085 雅安 149.8 866 绵阳 518.4 1616 巴中 346.7 1223 广元 302.6 1021 资阳 488.4 1361 遂宁 371 1375 阿坝 82.9 536 内江 419.9 1212 甘孜 88.9 594 乐山
345.9
1132 凉山 402.4
1471 南充 709.2
4064
二、参数估计
进入软件包,确定时间范围;编辑输入数据;选择估计方程菜单,估计样本回归函数如下
表5.2
估计结果为
56.69,2665.508..,7855.0)
3403.8()
9311.1(3735.50548.563ˆ2===-+-=F e s R X Y i
i (5.32) 括号内为t 统计量值。

三、检验模型的异方差
本例用的是四川省2000年各地市州的医疗机构数和人口数,由于地区之间存在的不同人口数,因此,对各种医疗机构的设置数量会存在不同的需求,这种差异使得模型很容易产生异方差,从而影响模型的估计和运用。

为此,必须对该模型是否存在异方差进行检验。

(一)图形法 1、软件操作。

由路径: ,进入 窗口,键入“y c x ”,确认并“”,得样本回归估计结果,见表5.2。

(1)生成残差平方序列。

在得到表5.2估计结果后,立即用生成命令建立序列2
i e ,记为e2。

生成过程如下,先按路径: ,进入 对话框,即
图5.4
然后,在对话框中(如图5.4),键入“e2=()^2”,则生成序列2
e。

i
(2)绘制2t e对t X的散点图。

选择变量名X与e2(注意选择变量的顺序,先选的变量将在图形中表示横轴,后选的变量表示纵轴),进入数据列表,再按路径,可得散点图,见图5.5。

图5.5
2、判断。

由图5.5可以看出,残差平方2i e对解释变量X的散点图
主要分布在图形中的下三角部分,大致看出残差平方2i e 随i X 的变动呈
增大的趋势,因此,模型很可能存在异方差。

但是否确实存在异方差还应通过更进一步的检验。

(二)检验 1、软件操作。

(1)对变量取值排序(按递增或递减)。

在菜单里选 命令,出现排序对话框,如果以递增型排序,选,如果以递减型排序,则应选,键入X ,点。

本例选递增型排序,这时变量Y 与X 将以X 按递增型排序。

(2)构造子样本区间,建立回归模型。

在本例中,样本容量21,删除中间1/4的观测值,即大约5个观测值,余下部分平分得两个样本区间:1—8和14—21,它们的样本个数均是8个,即821==n n 。

在菜单里,将区间定义为1—8,然后用方法求得如下结果
表5.3
在菜单里,将区间定义为14—21,再用方法求得如下结果
表5.4
(3)求F 统计量值。

基于表5.3和表5.4中残差平方和的数据,即 的值。

由表5.3计算得到的残差平方和为∑=9.14495821i
e
,由表
5.4计算得到的残差平方和为∑=8.73435522i
e
,根据检验,F 统计量

066
.59
.1449588
.734355212
2==
=
∑∑i
i e e F (5.33)
(4)判断。

在05.0=α下,式(5.33)中分子、分母的自由度均为6,查F 分布表得临界值为28.4)6,6(05.0=F ,因为
28.4)6,6(066.505.0=>=F F ,所以拒绝原假设,表明模型确实存在异方差。

(三)检验
由表5.2估计结果,按路径 ( ),进入检验。

根据检验中辅助函数的构造,最后一项为变量的交叉乘积项,因为本例为一元函数,故无交叉乘积项,因此应选 ,则辅助函数为
t t t t v x x +++=2
2102ααασ (5.34)
经估计出现检验结果,见表5.5。

从表5.5可以看出,0694.182
=nR ,由检验知,在05.0=α下,查2
χ
分布表,得临界值9915.5)2(2
05.0=χ(在(5.34)式中只有两项含有解释
变量,故自由度为2),比较计算的2
χ统计量与临界值,因为
0694.182=nR >9915.5)2(2
05.0=χ,所以拒绝原假设,不拒绝备择假设,
表明模型存在异方差。

表5.5
四、异方差性的修正 (一)加权最小二乘法()
在运用法估计过程中,我们分别选用了权数
t i t i t t X w X w X w 1,1,13221===。

权数的生成过程如下,由图5.4,在对话
框中的 处,按如下格式分别键入:
X w /11=;2^/12X w =;)(/13X sqr w =,经估计检验发现用权数t w 2的效果最好。

下面仅给出用权数t w 2的结果。

加权最小二乘法:消除异方差
Y C X 最小二乘法估计,得到残差序列 E1() 生成残差绝对值序列
(11) Y C X 以E1为权数进行加权最小二成估计
表5.7
表5.7的估计结果如下
8838.12,0493.276..,7060.1..,9387.0)
5894.3()
3794.4(9530.26090.368ˆ2====+=F e s W D R X Y i
i (5.36) 括号中数据为t 统计量值。

可以看出运用加权小二乘法消除了异方差性后,参数的t 检验均显
著,可决系数大幅提高,F 检验也显著,并说明人口数量每增加1万人,平均说来将增加2.953个卫生医疗机构,而不是引子中得出的增加5.3735个医疗机构。

虽然这个模型可能还存在某些其他需要进一步解决的问题,但这一估计结果或许比引子中的结论更为接近真实情况。

相关主题