第九章时间序列计量经济学模型案例1、1949—2001年中国人口时间序列数据见表8,由该数据(1)画时间序列图和差分图;(2)求中国人口序列的相关图和偏相关图,识别模型形式;(3)估计时间序列模型;(4)样本外预测。
表9.1 中国人口时间序列数据(单位:亿人)年份人口y t 年份人口y t年份人口y t年份人口y t年份人口y t 1949 5.4167 1960 6.6207 1971 8.5229 1982 10.159 1993 11.8517 1950 5.5196 1961 6.5859 1972 8.7177 1983 10.2764 1994 11.985 1951 5.63 1962 6.7295 1973 8.9211 1984 10.3876 1995 12.1121 1952 5.7482 1963 6.9172 1974 9.0859 1985 10.5851 1996 12.2389 1953 5.8796 1964 7.0499 1975 9.242 1986 10.7507 1997 12.3626 1954 6.0266 1965 7.2538 1976 9.3717 1987 10.93 1998 12.4761 1955 6.1465 1966 7.4542 1977 9.4974 1988 11.1026 1999 12.5786 1956 6.2828 1967 7.6368 1978 9.6259 1989 11.2704 2000 12.6743 1957 6.4653 1968 7.8534 1979 9.7542 1990 11.4333 2001 12.7627 1958 6.5994 1969 8.0671 1980 9.8705 1991 11.58231959 6.7207 1970 8.2992 1981 10.0072 1992 11.7171(1)画时间序列图y的数据窗口打开t得到中国人口序列图求中国人口差分图:中国人口差分图如下:从人口序列图和人口差分序列图可以看出我国人口总水平除在1960年和1961年两年出现回落外,其余年份基本上保持线性增长趋势。
52年间平均每年增加人口1412.6923y的变化特征看,这是一个非平稳序列。
万人,年平均增长率为1.66%。
从人口序列t(2)求中国人口序列的相关图和偏相关图,识别模型形式y数据窗口,过程如下:打开ty画相关图、偏相关图。
滞后期为10。
Level表示选择对t结果如下:y是非平稳序列。
由相关图衰减缓慢可以知道,中国人口序列tdy的相关图和偏相关图如下:做t由上图可以看出,自相关函数呈指数衰减,偏自相关函数1阶或2阶截尾。
所以是一个1阶或2阶自回归过程。
(3)时间序列模型估计模型估计命令如下,同时将样本改为1949—2000年,留下2001年的值用于计算预测精度。
输出结果如下:从上面的输出结果可以看出,AR(2)的系数没有显著性,因此需要从模型中将其剔除继续估计。
得到重新的估计结果如下:对应的模型表达式为:0.1429t t Dy u =+(8.7)10.6171t t t u u v -=+(5.4)直接写为: 10.14290.6171(0.1429)t t t Dy Dy v -=+-+输出结果中的0.1429是t Dy 的均值,表示年平均人口增量是0.1429亿人。
整理上述输出结果,得:110.1429(10.6171)0.61710.05470.6171t t t t t Dy Dy v Dy v --=-++=++0.0547表示线性趋势的增长速度。
从输出结果的最后一行可以知道,特征根是1/0.62=1.61,满足平稳性要求。
检验模型的误差项:选滞后期为10得到如下输出结果:分布,所以模型的随从对应的概率值可以看出,所有的Q值都小于检验水平为0.05的2机误差项是一个白噪声序列。
(4)样本外预测过程如下:预测方法选择静态预测。
结果如下:已知2001年中国人口实际数是12.7627亿人,预测值为12.788亿人,误差为0.2%。
2、1967—1998年天津市保费收入(t y ,万元)和人口(t x ,万人)数据见表9。
表9.2 天津市保费收入(t y )和人口(t x )数据年份 Y t (万元) X t (万人) 年份 Y t (万元) X t (万人) 1967 259 649.72 1983 5357 785.28 1968 304 655.04 1984 6743 795.52 1969 313 650.75 1985 8919 804.8 1970 315 652.7 1986 14223 814.97 1971 322 663.41 1987 19007 828.73 1972 438 674.65 1988 23540 839.21 1973 706 683.31 1989 29264 852.35 1974 624 692.47 1990 34327 866.25 1975 632 702.86 1991 39474 872.63 1976 591 706.5 1992 49624 878.97 1977 622 712.87 1993 67412 885.89 1978 806 724.27 1994 100561 890.55 1979 1172 739.42 1995 123655 894.67 1980 2865 748.91 1996 171768 898.45 1981 4223 760.32 1997 243377 899.8 19825112774.921998271654905.09对数的天津保费收入ln t y 和人口t x 的散点图如下图:所以可以建立半对数模型。
输出结果如下:相应表达式为:ln 11.180.0254t t y x =-+(-20.9) (37.2) 20.9788,0.36R DW ==因为DW=0.36,说明模型误差项存在严重自相关。
观察残差序列的自相关结构。
过程如下:得到如下结果:由上图可以看出自相关函数拖尾,偏自相关函数2阶截尾,残差序列是一个明显的AR(2)过程。
重新进行回归分析,得如下结果:相应表达式是:ˆln 11.580.0259 1.17(1)0.45(2)t t yx AR AR =-++- (-8.6) (15.3) (6.5) (-2.2) 20.993, 1.97R DW ==这种模型称作回归于时间序列组合模型。
通过对回归模型残差序列建立时间序列模型提高回归参数估计量的有效性,所以组合模型估计的回归参数0.0259要比OLS 估计结果0.0254的品质要好。
拟合度也有所提高,并且消除了残差的自相关性。
3.做661天的深证成指(SZ )序列:从SZ 的序列走势可以看出,SZ 序列既不是确定性趋势非平稳序列,也不是随机趋势序列。
不妨先按随机趋势序列设定检验式。
过程如下:打开SZ的数据文件对SZ原序列进行ADF检验,检验式不包括趋势项,包括截距项。
得到ADF的检验结果如下:带有截距项的DF 检验式的估计结果如下:12.85410.0050t t DSZ SZ -=-(1.9) (-1.8) 2.0,660DW T ==从1t SZ -的系数的t 检验可以看出,SZ 序列存在单位根。
但是常数项也没有通过t 检验,所以从检验式中去掉截距项,继续进行单位根检验。
结果如下:则DF 检验式的估计结果如下:10.0002t t DSZ SZ -=(0.4) 2.0,660DW T ==DF=0.4,大于临界值。
SZ 序列是一个随机游走过程,并不含有随机趋势。
对t SZ 的差分序列t DSZ 继续做单位根检验。
过程如下:得到的结果如下:所以: 211.3049 1.00890.0033t t D SZ DSZ t -=--(-25.8) 2.0,659DW T == ADF=-25.8,所以(0)tDSZ I 是平稳序列,(1)tSZ I 。
3、利用表9.1的数据(1)做出时间序列ln GDP 与ln CONS 的样本相关图,并通过图形判断该两时间序列的平稳性。
(2)对ln GDP 与ln CONS 序列进行单位根检验,以进一步明确它们的平稳性。
(3)如果不进行进一步的检验,直接估计以下简单的回归模型,是否认为此回归是虚假回归:01ln ln t t t CONS GDP u ββ=++。
(1)首先做ln GDP 与ln CONS 的样本相关图,过程如下:做ln GDP的样本相关图。
由于是做ln GDP的水平序列,所以选择level,并包括12期滞后。
得到ln GDP的样本相关图如下:从样本的自相关函数图可以看出,函数并没有迅速趋向于零,并在零附近波动,说明ln GDP 序列是非平稳的。
用同样的方法,做ln CONS序列的自相关函数图如下:从上面的样本自相关函数图可以看出,ln CONS的自相关函数并没有迅速趋于零,并在零附近波动,说明ln CONS序列也是非平稳的。
(2)首先对ln GDP进行单位根检验,过程如下:先从模型3进行检验,包括截距项,时间趋势及一阶滞后项的模型。
结果如下:从上面的伴随概率值可以知道,在5%的显著性水平下,不拒绝存在单位根的假设,表明ln GDP是非平稳的。
对模型2进行检验,即不包括时间趋势的模型,结果如下:从伴随概率值可以看出,在5%的显著性水平下,不拒绝存在单位根的假设,ln GDP是非平稳的。
对模型1进行检验,即不包括截距项和时间趋势。
结果如下:从伴随概率值可以看出,在5%的显著性水平下,不拒绝存在单位根的检验,ln GDP是非平稳的。
综上所述,ln GDP序列是非平稳序列。
用同样的方法对ln CONS序列进行检验,可以知道,在5%的显著性水平下,ln CONS序列也是非平稳的。
(3)由于时间序列ln GDP和ln CONS是非平稳的,如果没有进行协整性检验,直接对两者做OLS回归,此回归很可能是虚假回归。
5.以上题的数据为基础,利用ln GDP和ln CONS的数据。
(1)检验ln GDP和ln CONS单整性。
(2)尝试建立ln GDP和ln CONS的ARMA模型。
单整性的检验仍然通过单位根检验进行。
但此时,针对的时间序列不是原序列的水平序列,而是一阶差分、二阶差分或更高阶的差分序列为了寻找适当的模型,经过反复测算,发现ln GDP的一阶差分序列在只带截距项与三阶滞后项时,在5%的显著性水平下可以拒绝存在单位根的假设。
过程如下:得到如下输出结果:所以ln GDP 序列是一阶单整的。
即ln (1)GDP I 。