云南财经大学统计与数学学院《综合实验》课程论文题目:用回归分析方法分析经济增长对犯罪率的影响组员:朱闪 200806001150沈家美 200806001162李惠玲 200806001164李冬萍 200806001112班级:数学08-1班时间:2011年12月23日用回归分析方法分析经济增长对犯罪率的影响【摘要】本文对我国1981年至2009年人均国内生产总值、年平均工资、城市化程度、人口自然增长率、失业率、离婚率以及犯罪率的统计数据运用最小二乘方法建立多元线性回归模型,并应用平稳性检验、Granger因果关系检验等方法,最终对我国宏观经济因素对犯罪率的影响进行了实证分析。
分析结果表明:人均国内生产总值、年平均工资、城市化程度、人口自然增长率、失业率以及离婚率均对犯罪率存在显著的影响作用。
【关键词】经济增长;犯罪率;多元线性回归分析一、引言犯罪是严重危害社会、违反刑法并应受刑罚处罚的行为。
因此,针对犯罪的相关研究对于一个国家的安定显得尤为重要。
同时,对于有效控制犯罪率增长这一问题也要做到追本溯源。
故此,犯罪原因成为了犯罪学研究中核心的问题,这也是自古以来学者们长期探讨并试图解决的一个重大课题。
综观前人的观点,引起犯罪的因素主要包括政治、经济、文化以及犯罪人自身条件等因素,但经济是引起犯罪的最根本原因。
经济增长与犯罪率变化的关系一直是一个备受争议的问题,不同学者根据不同时间、不同国家和地区的数据往往得出不同的研究结论。
从历史数据来看,一些国家如日本、新加坡等在一定时期经济增长的同时犯罪率呈下降趋势,二另外一些国家如美国、巴西等国在经济增长的同时犯罪率呈上升趋势。
由于经济增长这一单一指标不能很好地解释经济与犯罪之间的关系,研究者开始关注收入差距、人口流动率等具体经济因素对犯罪率变化的影响。
因此,运用实证的方法,充分利用现有信息资源,通过对数据的处理、分析,准确找出犯罪产生的经济原因对于在市场经济条件下预防犯罪、控制犯罪、打击犯罪,保障社会和谐具有重大的现实意义。
二、文献综述历史上,将犯罪同经济制度联系起来是与荷兰犯罪学家邦格在《犯罪与经济状况》(1916)一书中提出的“经济贫困论”。
他认为,经济贫困使一些想要结婚的人不能结婚,就产生强奸、杀婴等犯罪。
经济条件对犯罪所产生的作用极大,甚至是决定性的。
然而,马克思主义的诞生才整整解开了犯罪原因之谜。
马克思、恩格斯指出,“违法行为通常是由于不以立法者意志为转移的经济因素造成。
”至此,西方的犯罪学研究已有100多年的历史,而我国的研究却仅有短短二十几年的时间。
从本世纪60年代中期开始,一些经济学者利用数学模型来解释犯罪原因。
1968年美国学者贝克尔把贝克利亚和边沁的刑罚威慑理论用现代消费需求理论中的数学形式来表达。
在探索最佳刑事司法政策模型时,他提出“犯罪时函数”,分析了定罪概率和刑罚程度的效应,发现增加这两者中的任何一项都会减少犯罪量。
在我国,由于犯罪学研究起步较晚,有部分学者以实证资料为基础进行犯罪原因分析,方法侧重于描述统计,如麻泽芝、丁泽云在《法学研究》(1999年第6期)发表的《相对丧失论——中国流动人口犯罪的一种可能解释》一文中,通过对我国流动人口、城乡收入差距、犯罪率等宏观数据的描述以及流动人口犯罪现象的刻画,并结合失范理论、相对剥夺理论得出我国流动人口与社会整体犯罪率正相关的结论。
胡联合、胡鞍钢在《社会学》(2008年第1期)中发表的《贫富差距是如何影响社会稳定的》一文中引入一元线性回归方法,用我国改革开放后的时间序列数据研究贫富差距对犯罪的影响。
本文在吸收借鉴前人观点的基础上,运用我国1981——2009年间犯罪率、人均国内生产总值、城市化、年平均工资、人口自然增长率、失业率以及离婚率的时间序列数据,应用多元线性回归分析方法,对影响犯罪率的经济因素进行实证分析。
三、样本数据的采集及方法选择1、变量的选取以及数据的采集衡量犯罪率的指标有很多,本文考虑到数据的全面性以及采集的难易程度,采用每10万人中公安机关刑事案件立案数量作为衡量犯罪率的指标。
同时,影响犯罪率高低的宏观经济因素也有很多,本文考虑到经济发展水平、人民生活等多种因素,最终采用人均国内生产总值、城市化、年平均工资、人口自然增长率、失业率以及离婚率这六个指标代表影响犯罪率的宏观经济因素进行分析。
本文采取了上述指标在1981——2009年间的时间序列数据(数据见附表),数据来源于《中国统计年鉴2010》 、《中国民政统计年鉴2010》以及《中国法律年鉴2010》 。
2、方法选择本文假定模型的一般形式为多元线性模型,其数学表达式为:01122i i k ik iYi X X X ββββμ=+++++1,2,,i n =根据所选取变量的特征,本文采用最小二乘方法对模型进行估计。
对于最小二乘方法,所选取的时间序列数据应满足以下条件:(1) 解释变量非随机(2) ⎪⎩⎪⎨⎧=⎩⎨⎧≠====),2,1,(,0,),cov(,,2,1,0)(2n j i j i j i ni E j i i σεεε(3) 解释变量矩阵X 列满秩。
因此,在模型估计过程中,要对数据进行相关检验,若存在不符合使用最小二乘方法条件的现象,要进行修正。
四、实证分析1、变量的定义将犯罪率、人均国内生产总值、职工年平均工资、城市化、人口自然增长率、失业率、离婚率这7个变量依次分别定义为i Y 、i X 1、i X 2、i X 3、i X 4、i X 5、i X 62、相关分析为研究影响犯罪率的宏观经济因素有哪些,因此,本文利用SPSS16.0软件绘制矩阵散点图,以研究犯罪率i Y 与i X 1、i X 2、i X 3、i X 4、i X 5、i X 6之间是否具有较强的线性关系。
所绘制的矩阵散点图如图1图1图1表明,被解释变量i Y 与解释变量i X 1、i X 2、i X 3、i X 4、i X 5、iX 6之间都有较强的线性关系。
因此粗略地看,犯罪率会受到本文所选取的这些因素的影响。
3、回归估计为进一步研究本文所选取的经济因素对犯罪率是否存在影响以及影响的程度,本文对其进行多元线性回归分析。
运用最小二乘法在Eviews 6.0软件中作出i Y 对i X 1、i X 2、i X 3、i X 4、i X 5、i X 6的线性回归。
得到结果如表1所示:表1Coefficient Std. Error t-Statistic Prob.C -489.5317 173.6108 -2.819708 0.0100 X1 -2.480386 0.702052 -3.533053 0.0019 X2 0.059602 0.017290 3.447140 0.0023 X3 36.35429 7.126255 5.101458 0.0000 X4 -7.826100 6.598020 -1.186129 0.2482 X5 21.99235 16.08985 1.366846 0.1855 X6290.7806121.76952.3879600.0260R-squared 0.939720 Mean dependent var 199.3690 Adjusted R-squared 0.923280 S.D. dependent var 123.5516 S.E. of regression 34.22170 Akaike info criterion 10.11010 Sum squared resid 25764.74 Schwarz criterion 10.44014 Log likelihood -139.5965 Hannan-Quinn criter. 10.21347 F-statistic 57.16085 Durbin-Watson stat 1.066186Prob(F-statistic)0.000000由输出结果可得,回归方程为:6543217806.29099235.21826100.735429.36059602.0480386.25317.489X X X X X X Y ++-++--=方程显著性检验F 统计量的值为57.16085,伴随概率P 值为0.000000<0.05,方程显著,即被解释变量与所有解释变量的线性关系显著。
可决系数2R =0.939720,即被解释变量可由模型解释的部分高达0.939720,模型拟合优度较高。
在变量显著性检验中,i X 1、i X 2、i X 3、i X 6这四个变量在显著性水平 =0.05下,t 检验显著,即这4个解释变量与被解释变量间均存在显著的线性相关关系。
而i X 4、i X 5这两个变量t 检验不显著。
由于本文所选用数据为时间序列数据,存在变量不显著的问题可能是由于多重共线性、序列相关等问题造成的,因此作出相关检验。
4、多重共线性由于采用最小二乘法估计回归模型的一个前提条件为解释变量X 列满秩。
因此,一旦序列中存在多重共线性问题,易导致模型估计失效。
而由表1的普通最小二乘结果可见,模型的可决系数2R 和F 统计量的值均较大,而i X 4、i X 5这两个变量t 检验不显著,说明各解释变量对Y 的联合线性作用显著,但可能由于各解释变量间存在共线性而使得它们对Y 的独立作用不能分辨。
故本文对所选用数据应用相关系数法进行多重共线性检验,检验结果如表2:表2.Correlations由此得,模型中任意两个变量之间均存在高度相关关系,即模型存在多重共线性。
同时可以断定,i X 4、i X 5两变量t 检验不显著是由于存在多重共线性而使得它们对被解释变量Y 的独立作用不能分辨。
故此,本文采用逐步回归方法,选择最佳的回归方程。
得到结果如表3:表3Coefficient Std. Error t-Statistic Prob.* C -640.6356 118.9873 -5.384069 0.0000 X3 35.74499 7.170313 4.985136 0.0000 X5 30.70073 14.44323 2.125613 0.0445 X1 -2.064906 0.613782 -3.364236 0.0027 X2 0.048839 0.014848 3.289375 0.0032 X6232.6453112.45172.0688460.0500R-squared 0.935865 Mean dependent var199.3690因此,最终的函数关系应以),,,,(65321i i i i i i X X X X X f Y =为最优,变量i X 4被剔除。
此时,回归方程为:653216453.23270073.3074499.35048839.0064906.26356.640X X X X X Y ++++--=5、序列相关性及异方差问题由于本文所采用数据为时间序列数据,而时间序列数据在实际应用中常出现序列相关情形,当随机扰动项存在学列相关时会给普通最小二乘法的应用带来非常严重的后果,因此在此要对其进行检验。