当前位置:文档之家› 我国GDP统计数据质量评估方法研究

我国GDP统计数据质量评估方法研究

我国GDP统计数据质量评估方法研究——基于构建诊断模型的研究西南财经大学刘盾、魏子力、吕达劲摘要:统计是认识社会的武器,政府统计关系到国民经济的方方面面。

政府统计数据的质量,对于宏观调控,科学研究,企业营销策略等,都起着不可或缺的重要作用。

但是,近年来,中国官方统计数据受到不少的质疑,有必要对我国统计数据质量的定量检验进行系统深入的研究。

本文首先从统计数据的研究背景和研究意义出发,介绍了统计数据质量的概念和重要性;其次采用了三种方法来进行数据质量的检验,第一种方法:探索性数据质量分析方法。

该方法适用于在没有以往数据资料积累或质量记录的情况下,根据GDP的数据特征,判断数据是否存在质量问题。

并通过作箱线图的形式明确指出了可能是异常值的对应数据。

第二种方法:Probit模型数据质量分析方法。

通过建立Probit模型对数据进行分析,并进行了预测。

第三种方法:基于层次分析法的模糊综合评价方法。

从研究统计数据的分布规律入手,对统计数据准确性检验问题进行了探讨,接着利用模糊综合评价方法对政府统计数据质量进行整体优度检验。

关键词:统计数据质量,探索性数据分析, Probit模型,异常点识别,模糊综合评价目录一、引言 (3)二、文献综述 (4)(一)统计数据质量的相关研究方法 (4)(二)各种研究方法的优缺点 (5)(三)各种研究方法的文献综述 (7)1.逻辑性评估方法 (7)2.从异常值的角度对数据质量进行评估 (7)3.从误差的角度对数据质量进行评估 (8)4.事后预测及反常结果判断的方法 (8)5.模糊综合评价方法 (8)6.判别分析方法 (8)三、本文的研究方法 (9)(一)模型选择 (9)(二)数据的选择与来源 (10)四、模型构建及分析 (10)(一)探索性数据质量分析方法 (10)1.数据处理 (10)2.分析步骤及分析结果 (10)(二)Probit模型数据质量分析方法 (16)1.Probit模型的原理 (16)2.分析步骤及分析结果 (16)(三)层次分析法与模糊综合评价方法 (18)1.对政府统计数据的对数正态分布检验 (18)2.政府统计数据的准确性检验 (21)3.AHP-模糊综合评价方法相结合——对政府统计数据质量进行整体优度检验 (23)五、相关结论与建议 (32)(一)结论: (32)(二)建议: (33)1.对数据使用者的相关建议 (33)2.对提供数据的相关政府部门的建议 (33)参考文献: (35)附录: (36)1.Probit模型建立前的辅助计量模型自变量的选择: (36)2、Probit模型回带期望概率 (39)3、所用数据 (45)一、引言随着统计信息对我国社会主义市场经济管理作用的不断增强,社会各界对统计数据的需求越来越大,对其质量给予了更多的关注,同时提出了更高的要求。

社会、政治、经济、科学技术等诸多领域都离不开政府统计数据。

统计数据更是衡量一个国家、一个地区经济发展水平的晴雨表和温度计。

近年来,我国经济持续、快速增长,引起了世界的关注,而作为衡量经济发展规模和水平的政府统计数据及其质量也成为国内外相关机构及研究者关注的焦点。

在众多的统计数据指标中,最为引人关注的就是国内生产总值(GDP),它被公认为是衡量一个国家经济发展水平的最佳指标。

2010年,我国GDP总量超越日本,成为世界第二大经济体,世界也对中国的GDP指标给予更多的关注。

我国政府统计工作经过改革开放后30年的不断深入研讨,取得了很大的进展,统计数据的准确性、及时性都得到了很大的提高,为我国经济增长现状和前景的判断提供了切实可靠的分析基础。

但与发达国家相比,我国政府的GDP 统计数据在质量上还存在一些问题。

数据的真实性受到国内外一些学者和研究机构的质疑。

例如2009年上半年31个省份公布的GDP数据总和为153769.4亿元,国家统计局核算全国GDP数据是139862 亿元,地方GDP之和高出全国核算数据约1.4万亿元,达9.9%。

2010年第一季度,在按期公布GDP的29个省(区、市)中,除了新疆(增速为11%)外,其它28个省(区、市)一季度GDP增速均高于全国11.9%的水平,其中更有18个省(区、市)的增速竟然超过15%。

此外,国际能源署(IEA) 也指出,中国政府公布2009年第一季度GDP 较上年同期增长6.1%,但这一数据与中国当季石油需求下降3.5%的情况不符,与异常疲软的电力需求也不相吻合。

同时,针对2008年第四季度以来中国出现的工业增加值正增长、工业用电量负增长两者背离现象,国际能源署认为这一现象与电力消费和经济增长同向变化的一般规律显然不符,更与中国2000年以来电力消耗增长快于经济增长的经验相背离。

这些矛盾现象都在说明我国GDP 数据存在着质量问题。

进一步净化统计工作环境,提高GDP数据质量,全面履行政府统计职能,树立政府统计权威,确保统计数据能准确、及时和客观地反映社会经济事业发展的实际情况已成当务之急,也是众多统计工作者探讨的重要理论和现实课题之一。

然而,提高和保证统计数据质量,不是靠几次执法大检查等临时性措施所能办到的,需要根据政府统计改革和建设发展的要求,基于正确的数据质量观念,从理论和实践上研究数据质量管理体系的建立和实施。

目前国内外学者对统计数据质量问题研究的方法上还有一定差距,尤其体现在利用各种数学方法对统计数据质量进行定量研究方面。

本文从实际工作出发,根据实际应用的需要,应用了三种分析方法,吸收前人的研究成果,重点研究如何利用定量方法来对GDP数据质量进行检验的问题,并在基于层次分析法的模糊综合评价方法分析中采取了规范分析和实证分析相结合的研究方法,对其质量进行整体拟合优度检验。

二、文献综述(一)统计数据质量的相关研究方法1.逻辑性评估方法逻辑性评估方法包含基于规则的逻辑性评估方法和相关性的逻辑性评估方法。

基于规则的逻辑性评估方法具体包含差额平衡法、相关平衡法、同项相等法和运用生产及使用的平衡关系进行评估的方法;相关性的逻辑性评估方法主要是根据部分指标与总体指标间结构关系、指标间的比例关系以及相关指标的弹性系数等方面进行判断, 也可以运用主成分分析、回归分析等计量方法。

2.从异常值的角度对数据质量进行评估从异常值的角度评估数据质量主要包含基于统计分布的异常值检验、时间序列的异常值分析和探索性数据分析的异常值检验。

运用基于统计分布的异常值检验时,假定给定的统计数据服从一个随机分布(如Γ分布、正态分布等),并使用不一致性测试来识别异常点;在时间序列的异常值分析中,异常点是以多种形式出现的,而且只有在一个描述性模型中才能对其进行定义和识别;探索性数据分析的异常值检验可以在不破坏原始数据中其他数据前提下凸显异常数据或没有用处的数据,进而为判断数据质量提供依据。

3.从误差的角度对数据质量进行评估统计调查有两大误差来源——抽样误差和非抽样误差。

抽样误差是用样本推断总体过程中无法避免的误差,非抽样误差是抽样误差以外的误差。

测定方法有两种思路:一种是尝试对估计值建立总误差模型,并且测算出非抽样误差的具体数值和它在总误差中所占比例的大小;另一种是先直接判断原始资料中是否有失真资料,然后设法找出这部分失真资料,再对其进行修正或剔除,进而消除这些误差的影响,得到一个较好的估计,保证统计数据的质量。

4.事后预测及反常结果判断的方法事后预测是利用已通过各种检验(例如经济意义检验、统计检验和DW检验等),被证明是合理的计量经济模型,对各观测点进行事后预测,测算出各个预测值与实际值的相对误差。

而某一变量的观测数据中有时出现个别相对特别小或特别大的数据,这些数据称为反常结果。

反常结果判断法包含极值偏差法、方差比法和极差比法(即Dixon准则)三种基本方法。

5.层次分析法与模糊综合评价方法相结合模糊综合评价方法是建立在层次分析法的基础上,综合考虑系统(或事物)的多种价值因素,用模糊集理论来评定其优劣的方法。

对数据进行了统计质量的对数正态分布和准确性检验后,再通过建立影响统计数据质量的十个因素各自的分项评价指标,建立科学、合理的统计数据质量评价指标体系,对政府统计数据质量进行整体优度检验。

6.判别分析方法判别分析是根据已有的历史上每个类别的若干样本的数据信息,总结出客观事物分类的规律性,在此基础上建立判别函数和判别准则。

在遇到新的样本点时,只需要根据总结出来的判别函数和判别准则,就能判别该样本点所属类别。

(二)各种研究方法的优缺点1.逻辑性评估方法规则的逻辑性评估方法不仅可用于原始调查资料,还适用于汇总数据。

但这种方法只适用于有逻辑平衡关系的数据,难以对大量夹杂在原始数据中的非逻辑性平衡异常数据做出较准确的判断。

相关性的逻辑性评估方法在运用时需要注意这几个问题:相关指标间的关系并非一直稳定;与被评估指标相关联的统计数据必须可靠;同被评估指标相关联的指标往往不止一个;根据不同的关联指标进行判断的结果应该一致等。

2.从异常值的角度对数据质量进行评估从异常值角度对数据质量进行评估,不仅要识别出异常值,还要结合异常值产生的背景判断其是否由统计数据质量问题导致。

基于统计分布的异常值检验法存在两个问题, 一是数据使用者并不清楚数据的分布;二是即便已知在低维( 一维或二维) 时的数据分布,但在高维情况下估计数据点的分布也极其困难。

探索性数据分析方法具有以下突出特点:不受极端值影响,展示的数据所包含信息量大并能简单、直观的显示出极端值;而且无需过多数学计算,易于理解,易于为基层人员接受。

在其应用基于时间序列的异常值检验时,前提条件是历史数据不存在系统性偏误,其主要缺点是序列异常的概念并未得到普遍认可。

而且使用这种方法会遗漏不少的异常数据,诊断方法也比较复杂,所以它主要适用于科研上对统计数据质量以及结构变化的诊断。

3.从误差的角度对数据质量进行评估从误差的角度评估统计数据质量的方法,主要适用于对原始调查数据质量的控制和检验,而且随着抽样调查技术应用在我国的发展,使用这种方法进行原始数据质量的评估,显得更加重要。

但目前在如何检测和度量各种非抽样误差,尤其是各种因素导致的计量误差方面的研究还很不够,这也是当前需进一步研究的课题。

4.事后预测及反常结果判断的方法运用该方法的关键在于需要找出描述被考核指标的有关解释变量,并建立函数关系式,以及要求有相应的统计来估计。

其基本前提条件是所有数据应来自于同一总体在相同或相似的经济环境下的统计资料。

5.基于层次分析法的模糊综合评价方法模糊综合评价方法存在多因素模糊性和主观判断等问题,但基于层次分析法的模糊综合评价方法能较好地处理这些问题。

但由于最初表示指标间相对重要程度的判断矩阵是由专家主观给定,仍包含一定的主观随意性,是否充分反映了客观实际,还需很好地把握。

相关主题