当前位置:文档之家› 基于数据挖掘技术的市财政收入分析预测模型论文

基于数据挖掘技术的市财政收入分析预测模型论文

所选题目:基于数据挖掘技术的市财政收入分析预测模型基于数据挖掘技术的广州市财政收入分析摘要:地方财政收入的稳定增长对于地区经济的发展具有重要作用。

而财政收入是衡量一国政府财力的重要指标,近几年来,政府公共财政在经济和社会发展中扮演的角色越来越重要。

如何调整和优化现有的财政支出和规模结构,服务于地方经济建设的发展,一个重要的表现就是地方财政收入的不断增加。

地方财政收入的稳定增加,客观上也会不断推动地方经济的进一步发展。

财政支出作为作为一种重要的经济调控手段,其规模大小和使用方向的不同会造成不同的经济效益,而财政支出对于经济的影响近年来一直是当前数据挖掘的热点,因为政府财政支出的热点不仅反映了财政政策的重点,还能够有效引导私人需求,对经济增长和结构升级又都重要意义。

随着我国的经济不断发展,我国的财政支出也在不断的扩张,而广州市作为改革开放的前沿城市,具有较强的经济实力,对国家的经济增长提供了极大的贡献,因此,对广州市这样一个模板城市的财政收入和支出分析对于一个城市的发展具有重要的意义,然而不同时期的财政支出对不同时期的经济发展需求不一样,因此,本文根据广州市进年年来的财政数据做了系统的统计与分析,并对其未来所有支出部门做了预测,有助于我国的财政支出更有效的服务于经济发展关键词:数据挖掘财政支出促进经济The thesis titleAbstract: A brief description of the abstract Thestability of the local fiscal revenue growth plays an important role in the development of regional economy. Fiscal revenue is an important index to measure a country's government financial resources, in recent years, the government public finance in the economic and social development is playing an increasingly important role. How to adjust and optimize the structure of fiscal expenditure and scale of the existing, services in the development of local economic construction, is an important part of the performance of local fiscal revenue increased. The stability of the local fiscal revenue increase, objectively also will continue to promote the further development of local economy.Fiscal spending as a kind of important economic control measures, the size and direction of use of different can lead to different economic benefits, and the effect of fiscal expenditure to economic has always been the hot spot of the current data mining in recent years, because the government fiscal spending hotspot not only reflects the focus of fiscal policy, also can effectively guide the private demand for economic growth and structure upgrade and are of great significanceexpenditure of our country are also constantly, and guangzhou as the forefront of reform and opening up city, with strong economic strength and growth provides a tremendous contribution to the economy of the country, therefore, for the guangzhou city as a template for fiscal revenue and expenditure analysis is of important significance for the development of a city, but in different periods of fiscal expenditure is not the same as the demand for different periods of economic development, therefore, this paper, based on the financialdata of guangzhou into a year to do the statistics and analysis of the system, and the department has made the forecast and the future of all spending, help to China's fiscal spending is more effective in theservice of economic developmentKey words: Data mining Public finance expenditure目录1.研究目标 (6)2.分析方法与过程 (6)2.1.总体流程 (7)2.2.具体步骤 (7)2.3.结果分析................................................................................... 错误!未定义书签。

3.结论 (32)4.参考文献 (32)1.挖掘目标本次建模目标是利用广州市统计局积累下来的海量真实数据,采用数据挖掘技术,分析各类支出数据的相互关系、发现事件之间的内部关联,构建反映支出与收入之间的模型,挖掘出当前对支出的影响的当前热点,需要实现以下的具体目标(一)对数据选取、收集数据选取的目的是确定目标数据,从广州市统计局获取最近的财政支出和收入的数据。

(二)数据整理数据整理是对选出的数据进行再处理,检查数据的完整性及一致性,消除噪声及与数据挖掘无关的冗余数据,根据时间序列和已知的变化情况,利用统计等方法填充丢失的数据。

数据整理包括以下内容:1.数据选择。

搜索所有与财政支出对象有关的内部和外部数据信息,根据财政支出的目的从中选择出适用于数据挖掘的数据。

2.在原数据的基础上,寻找依赖于发现目标的表达数据的有用特征,以缩减数据规模,从而在尽可能保持数据原貌的前提下最大限度地精简数据量。

3.数据转换。

选取合适的知识发现算法,合适的模型和参数,建立分析模型,并将数据转换成为该分析模型。

(三)数据挖掘并得出预测结论根据一系列的数据挖掘算法即数学模型,得出客观的科学依据,为财政局的规划提供重要参考材料。

2.分析方法与过程2.1. 总体流程本题分析主要步骤如下一,对数据进行选取,搜集。

本题分析主要步骤二,对选出和搜集的数据进行抽取,根据项目需求对数据进行清洗,消除与项目无关的冗余数据。

三,数据分析,对经过整理的数据建立数学模型,采用相应的数据挖掘方法进行关键数据的抽取,并得到正确的结论。

2.2. 具体分析过程及操作步骤问题一:通过工具Rstudio导入选取出的数据,并对其进行操作,从大量的,不完全的,有噪声的,模糊的,实际应用数据中,通过回归分析方法,寻找变量之间的关系,运用这种关系对数据进行控制,提取出隐藏在其中的有效数据的,利用这些数据做回归模型的显著性检验,回归系数的显著性检验等,根据对数据进行多元线性回归,逐步回归,正态检测等可分析、识别出影响财政收入的关键影响因素,具体操作步骤如下所示:1.导入数据> fujian=read.csv("C:/Users/RWY/Desktop/数据挖掘赛题/地方财政收入汇总.csv")> fujian年份地方财政收入合计公共财政收入增值税营业税企业所得税个人所得税城市维护建设税1 1999 1881388 1761499 288972 433360 277375 133621 1169732 2000 2199077 2005460 350495 479698 309764 185625 1290753 2001 2719058 2461941 443213 540075 483421 254892 1527394 2002 2690984 2458737 526377 613161 236416 159684 1648925 2003 3005475 2747707 581898 650119 268360 153080 1734526 2004 3384477 3028692 528365 793520 326556 167379 1999907 2005 4088545 3712633 816119 892678 373397 198017 2284198 2006 4767231 4270831 967265 1027971 455820 231794 2684209 2007 8389925 5237862 1115007 1235374 596693 295316 32520810 2009 11076649 7026527 1375085 1516049 732282 389824 36111811 2010 13991612 8726470 1594182 1777343 935248 472154 42662212 2011 15351387 9794768 1573830 1625593 1061594 462098 85388213 2012 15796804 11023961 1758311 1747616 1075045 439592 92415014 2013 20881374 11418044 2216017 1623520 1155923 489777 1013703房产税印花税契税行政事业性收费收入1 77562 21159 145254 300722 90776 28124 99776 388653 109140 30106 97903 857624 134061 35561 114520 1359195 146223 42490 171699 1713976 168904 67625 204895 1937437 200221 64862 221754 2019978 239285 80913 251382 2349499 262053 110676 306940 25300010 349616 154364 464568 27129311 416964 194584 610978 65165112 512657 211024 575560 68584013 612254 219623 581872 72219014 648012 260946 798657 806981> attach(fujian)2.线性关系图> par(mfrow=c(3,3))> plot(地方财政收入合计~公共财政收入);abline(lm(地方财政收入合计~公共财政收入))> plot(地方财政收入合计~增值税);abline(lm(地方财政收入合计~增值税))> plot(地方财政收入合计~营业税);abline(lm(地方财政收入合计~营业税))> plot(地方财政收入合计~企业所得税);abline(lm(地方财政收入合计~企业所得税))> plot(地方财政收入合计~个人所得税);abline(lm(地方财政收入合计~个人所得税))> plot(地方财政收入合计~城市维护建设税);abline(lm(地方财政收入合计~城市维护建设税))> plot(地方财政收入合计~房产税);abline(lm(地方财政收入合计~房产税))> plot(地方财政收入合计~印花税);abline(lm(地方财政收入合计~印花税))> plot(地方财政收入合计~契税);abline(lm(地方财政收入合计~契税))> plot(地方财政收入合计~行政事业性收费收入);abline(lm(地方财政收入合计~行政事业性收费收入))2.多元线性回归的汇总输出> lm.test_new=lm(地方财政收入合计~公共财政收入+增值税+营业税+企业所得税+个人所得税+城市维护建设税+房产税+印花税+契税+行政事业性收费收入)> summary(lm.test_new)#查看回归系数和模型的检验结果Call:lm(formula = 地方财政收入合计 ~ 公共财政收入 + 增值税 + 营业税 + 企业所得税 + 个人所得税 + 城市维护建设税 + 房产税 + 印花税 +契税 + 行政事业性收费收入)Residuals:1 2 3 4 5 6 7 8 9 10 11130734 -331440 100282 287608 -73537 28738 -153519 -77698 64031 42644 -1022912 13 14-24768 4711 12443Coefficients:Estimate Std. Error t value Pr(>|t|)(Intercept) 3.713e+06 1.486e+06 2.498 0.0879 .公共财政收入 4.454e+00 1.129e+00 3.946 0.0290 *增值税 7.929e+00 1.717e+00 4.618 0.0191 *营业税 -1.152e+01 2.724e+00 -4.229 0.0242 *企业所得税 3.482e+00 4.042e+00 0.861 0.4523个人所得税 -2.204e+01 1.148e+01 -1.919 0.1508城市维护建设税 -5.495e+00 4.516e+00 -1.217 0.3107房产税 -6.289e+01 1.524e+01 -4.126 0.0258 *印花税 1.341e+02 3.303e+01 4.059 0.0270 *契税 -1.650e+01 7.616e+00 -2.166 0.1189行政事业性收费收入 -1.589e+00 1.480e+00 -1.073 0.3618---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘’1Residual standard error: 295700 on 3 degrees of freedomMultiple R-squared: 0.9995, Adjusted R-squared: 0.9978F-statistic: 600.2 on 10 and 3 DF, p-value: 0.00010063.绘制四个相关系数图> plot(lm.test_new,1)#残差,普通残差与拟合值的残差图> plot(lm.test_new,2)#QQ图,若残差是来自正态总体分布的样本,则QQ图中的点应该在一条直线上> plot(lm.test_new,3)#标准化残差开方与拟合值的残差图(对于近似服从正态分布的标准化残差,应该有95%的样本点落在[-2,2]的区间内。

相关主题