1.1949—2001年中国人口时间序列数据见表8,由该数据(1)画时间序列图;(2)求中国人口序列的相关图和偏相关图,识别模型形式;(3)估计时间序列模型;(4)样本外预测。
表8 中国人口时间序列数据(单位:亿人)年份人口y t年份人口y t年份人口y t年份人口y t年份人口y t1949 5.4167 1960 6.6207 1971 8.5229 1982 10.159 1993 11.85171950 5.5196 1961 6.5859 1972 8.7177 1983 10.2764 1994 11.9851951 5.63 1962 6.7295 1973 8.9211 1984 10.3876 1995 12.11211952 5.7482 1963 6.9172 1974 9.0859 1985 10.5851 1996 12.23891953 5.8796 1964 7.0499 1975 9.242 1986 10.7507 1997 12.36261954 6.0266 1965 7.2538 1976 9.3717 1987 10.93 1998 12.47611955 6.1465 1966 7.4542 1977 9.4974 1988 11.1026 1999 12.57861956 6.2828 1967 7.6368 1978 9.6259 1989 11.2704 2000 12.67431957 6.4653 1968 7.8534 1979 9.7542 1990 11.4333 2001 12.76271958 6.5994 1969 8.0671 1980 9.8705 1991 11.58231959 6.7207 1970 8.2992 1981 10.0072 1992 11.7171(1)画时间序列图打开y的数据窗口t求中国人口差分图:从人口序列图和人口差分序列图可以看出我国人口总水平除在1960年和1961年两年出现回落外,其余年份基本上保持线性增长趋势。
52年间平均每年增加人口1412.6923万人,年平均增长率为1.66%。
由于总人口数逐年增加,实际上的年人口增长率是逐渐下降的。
把52年分为两个时期,即改革开放以前时期(1949—1978年)和改革开放以后时期(1979—2001年),则前一个时期的人口年平均增长率为2%,后一个时期的年平均增长率为1.23%。
从人口序列y的t变化特征看,这是一个非平稳序列。
(2)求中国人口序列的相关图和偏相关图,识别模型形式打开y数据窗口,过程如下:tLevel表示选择对y画相关图、偏相关图。
滞后期为10。
t结果如下:y是非平稳序列。
由相关图衰减缓慢可以知道,中国人口序列t做dy的相关图和偏相关图如下:t由上图可以看出,自相关函数呈指数衰减,偏自相关函数1阶或2阶截尾。
所以是一个1阶或2阶自回归过程。
(3)时间序列模型估计模型估计命令如下,同时将样本改为1949—2000年,留下2001年的值用于计算预测精度。
输出结果如下:从上面的输出结果可以看出,AR(2)的系数没有显著性,因此需要从模型中将其剔除继续估计。
得到重新的估计结果如下:对应的模型表达式为:0.1429t t Dy u =+(8.7)10.6171t t t u u v -=+(5.4)直接写为: 10.14290.6171(0.1429)t t t Dy Dy v -=+-+输出结果中的0.1429是t Dy 的均值,表示年平均人口增量是0.1429亿人。
整理上述输出结果,得:110.1429(10.6171)0.61710.05470.6171t t t t t Dy Dy v Dy v --=-++=++ 0.0547表示线性趋势的增长速度。
从输出结果的最后一行可以知道,特征根是1/0.62=1.61,满足平稳性要求。
检验模型的误差项:选滞后期为10得到如下输出结果:从对应的概率值可以看出,所有的Q值都小于检验水平为0.05的2 分布,所以模型的随机误差项是一个白噪声序列。
(4)样本外预测过程如下:预测方法选择静态预测。
结果如下:已知2001年中国人口实际数是12.7627亿人,预测值为12.788亿人,误差为0.2%。
2.1967—1998年天津市保费收入(t y ,万元)和人口(t x ,万人)数据见表9。
表9 天津市保费收入(t y )和人口(t x )数据年份Y t (万元)X t (万人) 年份 Y t (万元)X t (万人) 1967 259 649.72 1983 5357 785.28 1968 304 655.04 1984 6743 795.52 1969 313 650.75 1985 8919 804.8 1970 315 652.7 1986 14223 814.97 1971 322 663.41 1987 19007 828.73 1972438674.65 198823540839.211973 706 683.31 1989 29264 852.35 1974 624 692.47 1990 34327 866.25 1975 632 702.86 1991 39474 872.63 1976 591 706.5 1992 49624 878.97 1977 622 712.87 1993 67412 885.89 1978 806 724.27 1994 100561 890.55 1979 1172 739.42 1995 123655 894.67 1980 2865 748.91 1996 171768 898.45 1981 4223 760.32 1997 243377 899.8 1982 5112 774.92 1998 271654 905.09对数的天津保费收入ln t y 和人口t x 的散点图如下图:所以可以建立半对数模型。
输出结果如下:相应表达式为:ln 11.180.0254t t y x =-+(-20.9) (37.2) 20.9788,0.36R DW ==因为DW=0.36,说明模型误差项存在严重自相关。
观察残差序列的自相关结构。
过程如下:得到如下结果:由上图可以看出自相关函数拖尾,偏自相关函数2阶截尾,残差序列是一个明显的AR(2)过程。
重新进行回归分析,得如下结果:相应表达式是:ˆln 11.580.0259 1.17(1)0.45(2)t t yx AR AR =-++- (-8.6) (15.3) (6.5) (-2.2) 20.993, 1.97R DW ==这种模型称作回归于时间序列组合模型。
通过对回归模型残差序列建立时间序列模型提高回归参数估计量的有效性,所以组合模型估计的回归参数0.0259要比OLS 估计结果0.0254的品质要好。
拟合度也有所提高,并且消除了残差的自相关性。
3.做663天的深证成指(SZ)序列:从SZ的序列走势可以看出,SZ序列既不是确定性趋势非平稳序列,也不是随机趋势序列。
所以先按随机趋势序列设定检验式。
过程如下:打开SZ的数据文件对SZ原序列进行ADF检验,检验式不包括趋势项,包括截距项。
得到ADF的检验结果如下:带有截距项的DF 检验式的估计结果如下:12.85410.0050t t DSZ SZ -=-(1.9) (-1.8) 2.0,660DW T ==从1t SZ -的系数的t 检验可以看出,SZ 序列存在单位根。
但是常数项也没有通过t 检验,所以从检验式中去掉截距项,继续进行单位根检验。
结果如下:则DF 检验式的估计结果如下:10.0002t t DSZ SZ -=(0.4) 2.0,660DW T ==DF=0.4,大于临界值。
SZ 序列是一个随机游走过程,并不含有随机趋势。
对t SZ 的差分序列t DSZ 继续做单位根检验。
过程如下:得到的结果如下:所以: 211.0017t t D SZ DSZ -=-(-25.7) 2.0,659DW T ==ADF=-25.7,所以(0)t DSZ I 是平稳序列,(1)tSZ I 。
4.利用表9.1的数据(1)做出时间序列ln GDP 与ln CONS 的样本相关图,并通过图形判断该两时间序列的平稳性。
(2)对ln GDP 与ln CONS 序列进行单位检验,以进一步明确它们的平稳性。
(3)如果不进行进一步的检验,直接估计以下简单的回归模型,是否认为此回归是虚假回归:01ln ln t t t CONS GDP u ββ=++。
表9.1 中国GDP 与消费支出 单位:亿元年份 CONS GDP 年份 CONS GDP 1978 1759.100 3605.600 1990 9113.200 18319.50 1979 2005.400 4074.000 1991 10315.90 21280.40 1980 2317.100 4551.300 1992 12459.80 25863.70 1981 2604.100 4901.400 1993 15682.40 34500.70 1982 2867.900 5489.200 1994 20809.80 46690.70 1983 3182.500 6076.300 1995 26944.50 58510.50 1984 3674.500 7164.400 1996 32152.30 68330.40 1985 4589.000 8792.100 1997 34854.60 74894.20 1986 5175.000 10132.80 1998 36921.10 79003.30 1987 5961.200 11784.70 1999 39334.40 82673.10 1988 7633.100 14704.00 200042911.9089112.5019898523.50016466.00(1)首先做ln GDP与ln CONS的样本相关图,过程如下:做ln GDP的样本相关图。
由于是做ln GDP的水平序列,所以选择level,并包括12期滞后。
得到ln GDP的样本相关图如下:从样本的自相关函数图可以看出,函数并没有迅速趋向于零,并在零附近波动,说明ln GDP序列是非平稳的。
用同样的方法,做ln CONS序列的自相关函数图如下:从上面的样本自相关函数图可以看出,ln CONS的自相关函数并没有迅速趋于零,并在零附近波动,说明ln CONS序列也是非平稳的。
(2)首先对ln GDP进行单位根检验,过程如下:先从模型3进行检验,包括截距项,时间趋势及一阶滞后项的模型。