关于我国保费收入影响因素实证分析
摘要:本文是根据我国保险业的现状,想从计量经济学的角度来分析一下保险费收入与GDP、城乡居民人民币储蓄存款、人口数之间的关系。
根据经济学原理,在模型中引入了三个解释变量GDP、城乡居民人民币储蓄存款、人口数。
关键词;保费收入人均 GDP 城乡居民人民币储蓄存款人口数一、模型设定
为了分析我国保费收入与其经济因素之间的关系,我选择了“保费收入”为被解释变量,选择“GDP”、“城乡居民人民币储蓄存款”、“人口数”为解释变量。
设定如下形式的计量经济模型:
Y=1β+2β2X+3β3X +4β4X+μt
其中,Y为保费收入,
X为GDP,3X为城乡居民人民币储蓄存款,
2
X为人口数
4
为估计模型参数,从《中国统计年鉴2010年》收集到我国居民从1993-2009年的GDP、城乡居民人民币储蓄存款、人口数等数据。
数据如下:
二、估计参数
利用Eviews 软件,生成Y 、2X 、3X 、4X 等数据,采用这些数据对模型进行OLS 回归,结果如下:
OLS 回归结果
Y=1.30E+08 + 0.009532t X2+ 0.040795 t X3 - 1171.575t X4 t
(59269620) (0.008300) (0.012065)
(486.1966)
t =(2.190054) (1.148342) (3.381320) (-2.409674)
2
R
=0.990833
2
R
=0.988717
F
=468.3678
DW=1.100120
经济意义检验:GDP 每增长1万元,保费收入增长0.009532万元;城乡居民人民币储蓄存款每增长1万元,保费收入就增长0.040795万元。
拟合优度检验:从回归的结果来看,2R =0.990833,修正的2R =0.988717,这说明模型对样本的拟合很好。
F
检验:针对0H :2β=3β=4β=0,给定的显著性水平α=0.05,
在F 分布表中查出自由度为k -1=3和n -k =12的临界值αF ,由回归结果中得到的F 明显大于αF ,应拒绝原假设H 0:2β=3β=4β=0,说明回归方程显著,即“GDP ”“城镇居民储蓄存款”“人口数”等变量联合起来确实对“保费收入”有显著影响。
t 检验:分别针对0
H :j
β=0(j =1,2,3,4),给定的显著性
水平α=0.05,在t 分布表中查出自由度为n -k =12的临界值2/αt (n -k )=2.179。
由回归结果中的数据可得, 与1
ˆβ、2
ˆβ、3ˆβ、4
ˆβ对应
的t 统计分别为2.190054、1.148342、3.38132、-2.409674,其绝对值除1.148342外都大于2/αt (n -k )=2.179,这说明在显著性水平
α
=0.05下,当在其他解释变量不变的情况下,解释变量“ 城乡居
民人民币储蓄存款”、“人口数”分
别对被解释变量“保费收入”有显著影响。
三、多重共线性检验
相关系数矩阵
由各关系系数矩阵可以看出,各解释变量互相之间的相关系数较高,证实确实存在严重多重共线性。
四、多重共线性修正
采用逐步回归的办法,去检验和解决多重共线性问题。
分别作Y 对
X、3X、4X的一元回归,回归结果如下,
2
对回归结果进行整理,如下表
一元回归估计结果
其中,3X 的方程2R 最大,以3X 为基础,顺次加入其他变量逐步回归。
结果如下表所示。
加入新变量的回归结果
加入x2、x4时,2R都有所提高,F统计量也都很大,说明模型对样本的拟合很好且回归方程显著;但加入x2后t检验不显著,应予以剔除,加入x4的系数符号与经济意义不符且标准误差较大,应予以剔除。
最后修正严重多重共线性影响后的回归结果为
Y=-10761004+0.0462313X
t
(1822986.) (0.001518)
t=(-5.902955)(30.44591)
2
R=0.984076 2R=0.983014F=926.9535 DW=0.857463
这说明,城乡居民人民币储蓄存款
X每增加1万元保费收入t Y增长
3
0.046231万元。
五、异方差检验
利用eviews绘制出
X对E2的线性图,图如下,
3
由图可以看出,残差平方2e随解释变量
X的变动呈增大趋势,因此,
3
模型很有可能存在异方差。
但是否确实存在异方差还应通过更进一步的检验。
再进行white检验,回归检验结果如下,
White检验结果
由上表可知,n 2
R
=0.882811,在α=0.05下,查表得,临界值
为3.84146 而n
2
R
<3.84146,表明模型不存在异方差。
六、自相关检验
估计结果如下
Y=-10761004+0.0462313X
t
(1822986.) (0.001518)
t=(-5.902955)(30.44591)
2
R=0.9840762R=0.983014F=926.9535
DW=0.857463
对样本量为17、一个解释变量的模型、0.05显著水平,查DW统计
表可知,
D=1.133,U D=1.381,模型中DW=0.857463<L D,说明L
模型存在自相关。
七、自相关修正:
生成残差序列e,使用e进行滞后一期的自回归,回归结果如下:
对原模型进行广义差分,再对广义差分方程进行自回归,回归结果如下:
Y=-9489495+0.047555x
t
(1506733.) (0.001567)
t=(-6.298060)(30.33847)2
R=0.985017 2R=0.983947 F=920.4230
DW=1.451899
使用广义差分数据,样本容量减少了1个,为16个,查0.05显著水平
的DW统计表可知
D=1.106,U D=1.371,U D<DW<4-U D,说明广义差
L
分模型中已无自相关。
八、该模型的结论
通过该模型的分析可知,保费收入随城乡居民人民币储蓄存款的增加而增加,二者正相关。
这是因为城乡居民人民币储蓄存款作为保费收入的总源头,对保费收入起着促进作用。
保费收入应随人口数的增加而增加,而在该模型中,人口数与保费收入呈负相关与经济意义不符,从侧面也反映出保险覆盖范围还不是很广,今后保险公司应该加大保险宣传,增加保费收入。
在保险行业快速发展的今天,研究保费收入与GDP、城乡居民人民币储蓄存款、人口数之间的关系有着十分重要的意义。
它对我国日后的保险行业走向有着很好的指导作用。
[参考文献]:《计量经济学》
《中国统计年鉴》
中经网。