课程设计(综合实验)报告( -- 第二学期)名称: 计量经济学课程设计题目: 中国人口平均预期寿命模型院系: 工商管理学院班级: 学号: 学生姓名: 指导教师: 马昕设计周数: 两周成绩:日期: 6月26日一、 课程设计(综合实验)的目的与要求1.要求学生独立完成一个实证分析的完整过程, 得到计量分析的实践训练。
2.培养学生获取信息和综合处理信息的能力、 建立模型的能力、 文字和语言表示的能力。
二、 设计( 实验) 正文1. 选题: 随着经济和社会的不断发展, 人们的寿命总体上有很大的提高, 人们也越来越关心自己的寿命, 长寿已经不再是神话了。
就中国而言, 在 人口普查中得出的数据表明中国人口平均预期寿命为71.40, 比1990年的数据68.55有所提高。
然而, 在查看了 各地区人口平均寿命的截面数据后, 发现不同地区依然存在着较大差异, 是什么原因导致了这种差异? 因而这个话题吸引了我, 于是便开始了中国人口平均寿命预期模型。
2. 文献综述: 曾毅教授著的”健康长寿影响因素的分析”一书中, 运用系统的分析方法,指出了寿命的影响因素, 能够总结为: 受教育程度、 经济、 医疗保障等社会经济状况, 以及个人的饮食、 烟酒和生活方式。
文献2”人口平均寿命影响因素分析”所提供的类似因素为我的建模提供了依据, 再加上中国统计年鉴上的数据支持, 使我感到此模型的可进行性。
由于考察的是各地区总体的预期寿命, 因此那些个人的因素不好放入模型中, 因而, 我只考虑社会经济状况的一些相关因素。
3. 模型设定: 起初我设想建立一个线性模型, 模型如下:u polluratio hygieninst ense edu avegdp lifespan +++++=43210ex p βββββ.其中lifespan 表示人口的平均预期寿命( 单位: 岁) , avegdp 表示人均GDP( 单位: 元) , eduexpense 表示教育支出( 单位: 万元) , hygieninst 表示卫生机构数量( 单位: 个) , polluratio 表示单位面积污染比( 其大小为: 年环境污染量/该地区面积, 而且, 由于在水污染上的统计可能受地区地理位置的影响如上游和下游, 下游的水污染较上游会更严重, 因此这里主要考虑大气污染) ( 单位: 亿立方米/万平方千米) , u 表示随机误差项。
选择以上的解释变量, 重要是处于各地区总体的考虑, 如人均GDP 的选取, 人均GDP 越高的地区, 居民总体较为富有, 更有能力去看病; 教育支出越高,人们的知识越多, 也就越懂得看病, 而不像传统的想法小病不用治; 卫生机构的数量越多, 人们越有机会看病; 环境因素也有影响, 环境质量好应该有助于寿命提高。
可是, 当我观察了自变量与应变量的散点图( 见附录二) 之后, 我发现自变量与应变量之间的关系并非呈线性关系, 而是接近于对数模型, 于是我便重新设计了对数模型, 模型如下:upolluratio hygieninst ense edu avegdp lifaspan +++++=ln ln ex p ln ln ln 43210βββββ。
4. 数据收集: 根据 的中国统计年鉴的有关截面数据( 具体见附表) , 数据包括了 各地区31个省市的截面数据。
并利用Eviews 对数据进行初步分析。
在Eviews 中, 建立”group ”对象, 绘出散点图, 见附录二, 在第四个散点图中, 发现了一个差异较大的点, 于是将此点过滤掉。
5. 参数估计: 利用Eviews 对模型进行参数估计。
估计的结果为phygieninst ense edu avegdp lifespan ln 01460.0ln 00491.0exp ln 00269.0ln 03771.084589.3ln ++-+=ΛStd.Error 0.09471 0.01234 0.01316 0.01218 0.0040479510.02=R 25253.24=-statistic F6. 模型检验: 发现两个解释变量系数t 检验均不显著, 而F 检验显著, 2R 不是很高, 与我们常规不符, lneduexpense 前的系数是负数。
于是推测模型有多重共线性, 也可能有无关变量, 甚至有异方差, 由于是截面数据, 序列相关性存在较小, 经检验无序列相关性, 也无异方差。
于是, 模型可能存在多重共线性, 也可能有无关变量使方差变大, 系数不显著。
7. 模型修正: 做各解释变量之间的辅助回归, 见附录三, 计算各方差膨胀倍数VIF,发现VIF(lneduexpense)接近为7.7, 其它变量的VIF 不大, 由此能够判断模型中出现了多重共线性, 由于使用的是截面数据, 不能用差分法, 因而最好剔除变量lneduexpense, 变量相关性表来看, lneduexpense 与应变量lnlifespan 的相关系数只有0.557, 不是很高, 对应变量的影响不大。
剔除变量lneduexpense 后作新的回归, 见附录三, 结果如下:polluratio hygieninst avegdp lifespan ln 01431.0ln 00269.0ln 03607.084507.3ln +++=ΛStd.Error 0.09253 0.00919 0.00540 0.0037279476.02=R 55980.33=-statistic F发现变量lnhygieninst 前的系数仍不显著, 在察看附录三种的散点图和相关系数表, lnhygieninst 与lnlifespan 的相关性太小, 可认为是无关变量, 在模型中应删除。
于是作新回归, 见附录三, 结果如下:polluratio avegdp lifespan ln 01481.0ln 03498.087643.3ln ++=ΛStd.Error 0.06684 0.008803 0.0035379280.02=R 65419.51=-statistic F 模型中各系数均显著, F 统计量显著, 因而, 这便是最终的模型。
再进行异方差检验发现无异方差, 也无序列相关。
8. 模型解释: 从最终的模型来看, 影响中国人口寿命的因素主要是人均GDP 和和环境情况, 人均GDP 的增加意味着人们生活水平的提高, 而且人们也更有能力支付医疗费用; 对于在最终模型中环境污染类指标, 其前的系数为正, 无我们常规期望并不相符。
我想可能的原因有两点: 第一, 现在的许多发达城市, 经济比较好, 这种好的经济是有以前还未提倡可持续发展是以牺牲环境为代价换来的, 这就意味着环境污染较严重地区, 其以前积累的财富很多, 地区居民很富裕, 因而她们不但在饮食健康上有很大提高, 而且也越有看病的经济基础, 。
第二, 从生物学角度, 人的适用性会随着环境的变化而变化, 污染严重地区, 人们的抗病能力增强了, 因而, 会出现正的系数。
当然, 如果要真正地弄明白其中的原因, 最好是用1990年和 数据的差分模型, 但苦于无法找全1990年的数据, 因此, 才有以上推测。
对于在模型中被剔除的变量: 对于卫生机构数而言, 它对中国人口的平均寿命影响不大, 原因就出在, 传统的百姓观念是: 医疗费用太高, 小病不用就医自己会好的, 这就导致了卫生机构在百姓中不是那么流行。
对于教育支出而言, 由于出现了共线性, 其实, 一个地区越发达, 其教育上的支出就越多, 人均GDP 高的地区, 对教育重视程度高, 因为它们有支出的经济基础。
三、 课程设计( 综合实验) 总结或结论1.结论: 由上述模型能够得出, 当前影响中国人口平均寿命的因素主要是人均GDP 和环境指标。
从最终模型来看, 在污染水平不变的情况下, 人均GDP每增加一个百分点, 寿命平均增加0.035个百分点, 在人均GDP不变的情况下, 污染每增加一个百分点, 寿命平均增加0.0148个百分点。
2.建议: 尽管从模型中看, 污染似乎与人均寿命呈正相关, 可是这毕竟是有限度的, 当污染达到一定程度时, 会对人均寿命产生负的影响, 因而在追求GDP的增长的同时也要考虑到环境污染, 坚持可持续发展之路, 政府应加大教育支出的力度, 提高人们的总体文化水平, 提高人们的卫生保健意识, 在医疗上加大支出, 使医疗费用显著降下来是很有必要的, 使国家朝着社会主义和谐社会的目标而奋斗, 才能最终地实现国家的富裕和人口寿命的提高。
四、参考文献[1] 曾毅, 健康长寿影响因素分析, 北京大学出版社第一版 .5.1[2] 陈崇帼; 周天枢; 陈桂冬;人口平均寿命影响因素分析数理医药学杂志 1997年10卷一期, p17-18[3] 中国统计年鉴附录( 设计流程图、程序、表格、数据等)附录一: 1.地区预期寿命人均国内生产总值( 元)教育支出(万元)卫生机构合计(个)单位面积污染比(亿立方米/万平方千米)北京76.1 22460 2503068 6176 1971.289 天津74.91 17993 685500 2983 1506.979 河北72.54 7663 1559084 20663 518.8421 山西71.65 5137 794624 13736 424.2843 内蒙古69.87 5872 580862 7852 40.30431 辽宁73.34 11226 1463315 12564 646.4702 吉林73.1 6847 902942 5544 164.4610 黑龙江72.37 8562 1175133 8038 95.28634 上海78.14 34547 865 5136 9126.229 江苏73.91 11773 2905677 12813 899.2392 浙江74.7 13461 2 50 17034 637.8558安徽71.85 4867 1129954 6705 280.9889 福建72.55 11601 1225754 9807 233.1410 江西68.95 4851 752777 8048 132.6942 山东73.92 9555 2462776 17118 791.8726 河南71.54 5444 1709181 10764 445.2695 湖北71.08 7188 1706416 11065 305.2179 湖南70.66 5639 1523037 24678 168.0178 广东73.27 12885 3609721 13499 470.1723 广西71.29 4319 934718 13707 194.5433 海南72.92 6894 223093 2689 127.7259 重庆71.73 5157 698721 9375 231.1635 四川71.2 4784 1619988 33351 98.67647 贵州65.96 2662 528487 8992 220.2528 云南65.49 4637 976175 13356 69.77157 西藏64.37 4559 81550 1237 0.12211 陕西70.07 4549 1014584 10737 115.7101 甘肃67.47 3838 535287 7191 69.14349 青海66.03 5087 128178 1847 8.416528 宁夏70.17 4839 148649 1361 217.6205 新疆67.41 7470 702243 6705 11.70802 注:上表出自中国统计局有关数据。