计算机与现代化2013年第2期JISUANJI YU XIANDAIHUA总第210期文章编号:1006-2475(2013)02-0177-04收稿日期:2012-10-24作者简介:范瑜(1978-),男,辽宁大连人,广东培正学院讲师,数字媒体教研室主任,硕士,研究方向:商业数据挖掘,图像处理,互动多媒体;宋宇翔(1971-),男,广东湛江人,讲师,主任,硕士,研究方向:计算机应用,计算机网络与安全。
基于数据挖掘的上市公司绩效评价研究范瑜,宋宇翔(广东培正学院,广东广州510830)摘要:以2006-2011年我国A 股10331个观察样本为研究对象,分别从盈利能力、偿债能力、成长能力和运营能力4个方面反映企业绩效,采用数据挖掘技术构建上市公司绩效评价模型。
在对我国上市公司绩效的发展现状分析时发现,我国上市公司绩效呈现了N 型的趋势。
本研究丰富了上市公司绩效评价方法,拓展了上市公司绩效研究的外延,分析了我国上市公司绩效的现状,希望能对后续研究有所启示。
关键词:数据挖掘;绩效;评价模型中图分类号:TP391文献标识码:Adoi :10.3969/j.issn.1006-2475.2013.02.044Study on Performance Evaluation of Listed Companies in China Based on Data MiningFAN Yu ,SONG Yu-xiang(Guangdong Peizheng College ,Guangzhou 510830,China )Abstract :The article studies with 10331observed samples in A-shares during 2006-2011,from the profit ability ,the debt paying ability ,the growth ability and the operation ability which reflect the enterprise performance.This paper uses data mining tech-niques to establish the evaluation model of listing corporation performance.After analysis of the current development situation of listing corporation performance in China ,it is found that China listing corporation performance appears N trend.The article enri-ches the evaluation method of listing corporation performance ,expands the performance study of listing corporation ,and analyzes the current situation of performance of listing corporation in China.The author hopes that can help on the follow studying.Key words :data mining ;performance ;evaluation models0引言上市公司的绩效评价始终是理论界和实务界较为关注的一个热点话题,但是传统的研究大多采用单一的财务指标来评价绩效,未能系统全面地反映企业绩效的真实情况。
随着数据挖掘(Data Mining )技术的不断发展,国外已有大量文献将数据挖掘技术引入市场分析、公司财务、金融等领域,并取得了丰硕的研究成果。
本文以我国2006-2011年的上市公司样本为研究对象,基于数据挖掘技术,构建上市公司绩效评价模型。
本研究丰富了上市公司绩效评价的方法,拓展了上市公司绩效的外延,分析了我国上市公司绩效现状,希望对理论界和实务界有所启示。
1数据挖掘简介数据挖掘可定义为:通过某种特定的算法,运用神经网络、规则归纳等技术,从大量的、不完全的、有噪声的、模糊不清的和随机的实际应用数据中提取其中隐含着的重要信息,是一个发掘潜在有价值信息和知识的过程。
现阶段,数据挖掘技术被广泛地运用到经济活动中的各个领域,可具体分为客户集中型、作业集中型和研究集中型3大方面,内容见表1。
数据挖掘技术主要汇集了以下5大领域技术:(1)数据库(Database Systems )、数据仓库(Data Ware-houses )、联机分析处理(OLAP );(2)机器学习(Ma-chine Learning );(3)统计和数据分析方法(Statistical and Data Analysis Methods );(4)可视化技术(Visual-178计算机与现代化2013年第2期ization );(5)数学规划(Mathematical Programming )。
如图1所示。
表1数据挖掘实际应用Applicationsof Data Mining (数据挖掘应用)客户集中型作业集中型研究集中型Life-time Value (生命期价值)Profitability Analysis(收益分析)Combinatorial Chemistry(组合化学)Market-Basket Analy-sis (营销分析)Pricing (定价)Genetic Research (遗传研究)Retention (客户保持)Fraud Detection (欺诈辨析)Epidemiology (流行疾病)Target Market (目标营销)Risk Assessment (风险评估)Cross-Selling (组合销售)Portfolio Management(证券管理)E-Commerce (电子商务)Production Efficiency(生产效率)图1数据挖掘技术的演进过程2基于数据挖掘的上市公司绩效评价体系构建本设计步骤可分为陈述问题、搜集数据、数据预处理、上市公司绩效评价模型、评价结果分析等5个步骤。
具体的技术路线设计如图2所示。
图2基于数据挖掘的上市公司绩效评价技术路线图2.1陈述问题绩效(Performance )主要是对企业能否实现其目标的客观衡量。
杨国彬和李春芳(2001)指出,绩效是企业在一定期间内资产运营、财务效益以及资本保值增值等的经营成果。
目前,关于上市公司绩效的计量主要采用单指标,例如ROE 、EVA 、托宾Q 、主营业务利润率。
由于单指标所包含的经济信息有限,使得单指标无法诠释企业的绩效情况。
本文将数据挖掘引入到上市公司绩效评价研究之中,采用多重财务指标来评价企业绩效,主要从企业的盈利能力、偿债能力、成长能力、运营能力等方面进行绩效的度量。
采用这种方法可以最大限度地提高经营绩效的解释力度,经营绩效评价体系的评价结果可以科学合理计量企业的绩效。
2.2搜集数据本文选取我国沪深两市上市的A 股上市公司的财务数据,以2006-2011年为研究的时间窗口。
为了保证研究结论的科学合理性,本文进行了如下程序的筛选:首先,剔除ST 、*ST 、PT 等上市公司;其次,剔除上市公司数据不齐全的公司样本;最后,剔除当期发生重大财务事项的公司样本。
经过这3个筛选程序,最终共获取2006-2011年上市公司有效观察样本10331个。
笔者分别搜集了所选择的样本公司的盈利能力、偿债能力、成长能力、运营能力等方面的指标,财务数据主要来源于RESSET 金融数据库。
具体指标名称如表2所示。
表2上市公司绩效指标汇总一级指标二级指标盈利能力净资产收益率(X 1)资产报酬率(X 2)营业利润率(X 3)偿债能力流动比率(X 4)速动比率(X 5)成长能力每股收益增长率(X 6)利润总额增长率(X 7)运营能力流动资产周转率(X 8)固定资产周转率(X 9)总资产周转率(X 10)2.3数据预处理本文的绩效指标数据选自于RESST 金融数据库中的上市公司财务报表资料,由于所选取的指标存在量纲上的差异,为了避免不同量纲的差异给本文结论产生的噪音,本文对所选取的指标进行了无量纲化处理。
公式(1)中采用的是直线无量纲化法,其中y 代表的是各评价指标的实际值,x 代表的是各指标的评价值(max 和min 分表代表极大值和极小值)。
y =x -x minx max -x min(1)2.4构建上市公司绩效评价模型本文拟采用数据挖掘技术中的主成分分析法,构建上市公司绩效评价模型,并对我国上市公司的绩效情况进行分析。
(1)KMO 检验和Bartlett 检验。
KMO (Kaiser-Meyer-Olkin )检验统计量是用于比较变量间简单相关系数和偏相关系数的指标。
主要应用于多元统计的因子分析。
而Bartlett 检验又称为方差齐性检验,是方差分析的重要前提,是方差可加2013年第2期范瑜等:基于数据挖掘的上市公司绩效评价研究179性原则应用的一个条件,是对两样本方差是否相同进行的检验。
在利用主成分分析对衡量企业绩效的10个指标提取主成分之前,本文先进行了KMO检验和Bartlett检验,以此判别本文选取的数据可否适应主成分分析法。
表3为本文选取评价指标的KMO检验和Bart-lett检验结果。
从表3中可以发现,Bartlett检验统计量高达49306.165,而相应的Sig值则为0.000,这意味着本文用以评价企业经营绩效的10个二级指标均符合正态分布。
KMO检验可以分析选用的评价指标之间的简单相关系数和偏相关系数,本文的KMO值大于0.6,这说明本文选取的评价指标可以进行主成分分析。
表3KMO检验和Bartlett检验结果取样足够度的Kaiser-Meyer-Olkin度量0.707Bartlett的球形度检验近似卡方49306.165 df45Sig0.000(2)提取主成分。
表4为总方差解释表,分别列示了企业经营绩效主成分的统计信息,具体为各成分的特征值、贡献率及累积贡献率。
从表中可以发现,前5个主成分累积解释了总变异的程度高达85.069%。
根据累积贡献率大于85%的原则,前5个主成分能够代表本文选取的10个指标所包含的大部分信息。
值得说明的是,前5个主成分的特征值均大于1,而第六个主成分的特征值为0.569,本文为了信息有效性,未将第六主成分考虑在内。
表4总方差解释表成份初始特征值因子提取结果特征值解释方差占总方差的百分比累计百分比特征值解释方差占总方差的百分比累计百分比13.03530.34830.3483.03530.34830.348 21.99119.91350.2611.99119.91350.261 31.54614.45864.7201.54614.45864.720 41.27110.71575.4341.27110.71575.434 51.0039.63585.0691.0039.63585.069 60.5695.69290.76170.3823.81694.57780.2792.78897.36590.1751.75499.120 100.0880.880100.000为了保证各主成分之间的信息能够充分表达,剔除不同主成分中信息中的重叠数据,本文对因子载荷矩阵进行了正交旋转,旋转后的载荷矩阵如表5所示。