综合评价方法统一化研究李栋1,王洪礼2,李胜朋2(1. 天津大学管理学院,天津,30072; 2. 天津大学机械工程学院,天津,30072)摘要:为了有效总结综合评价方法,本文从函数的观点出发,将综合评价方法归结成标准化函数、基函数以及权数三者的确定方法,并且将综合评价方法与统计回归以及机器学习算法统一起来,从而在较深层次上看待层出不穷的综合评价方法,有利于综合评价方法的理论统一化。
关键词:综合评价;机器学习;回归 中图分类号:F270 文献标志码:A综合评价技术是一种管理方法,是一种重要的定量管理工具,是决策科学的重要内容,而综合评价方法研究是多指标综合评价研究的一个重要问题。
综合评价方法虽然丰畜,但缺乏系统的最新总结。
目前从事多指标(按照决策科学的提法,也称多目标)综合评价理论研究的有统计学界、管理决策学界、系统工程理论学界等不同领域的人士,而从事应用研究的则更是来自各行各业。
由于研究出发点与基础不同,研究术语、观点、偏好也不尽相同,使得综合评价这一重要技术的理论研究仍然处于一种分散、散乱之中,己有的成绩没有很好总结推广,重复研究现象也时有出现,没有形成统一的学科思想与学科结构,从而未能使综合评价技术真正成为一门独立的学科[1]。
本文从函数的观点出发,将指标体系当作自变量,综合评价数值看成因变量,综合评价方法就是具体寻求一个从指标体系到综合评价数值的函数。
借助于logistic 回归的思想,将分类评价和排序评价统一起来,这样就形成综合评价方法的基本体系结构。
更重要的是,综合评价方法同统计回归以及机器学习所要解决的问题是一样的,只是为了应用的方便,各自的侧重点有所不同。
一、综合评价的基本原理要想对一个对象进行评价,首先得为该对象建立一套指标体系,其中每个指标可以是数值的,或者是通过一定的规则转换形成数值的。
综合评价的直接结果通常表现为一个量化的综合评价数值,人们可以据之对若干个拥有同样指标体系的对象进行排序,也可以据之对某一个对象进行分类。
.前者称为广义排序评价,包括“单纯性排序评价”与“价谊排序评价”两种,其中的单纯性排序评价也称“狭义排序评价”,后者称为分类评价,12n =(x ,x ,x )x i x [2] 。
单纯排序评价得到的综合评价数值只是一个对象相对于其它对象的重要性或者整体规模的相对度量,而价值排序评价得到的综合评价数值确实反映了该对象的内在价值。
但是不管怎样,它们要求得到的评价结果都是一个数值y ,这样把指标体系当作自变量,综合评价数值y 当作因变量,构成一个函数关系,由于函数的形式成千上万,综合评价方法就是具体寻求这样一个函数。
同样的问题也是统计回归和机器学习研究的重点,所以才会出现投影寻踪综合评价,12n =(x ,x ,x )x [3]和人工神经网络(ANN )综合评价[4-5]。
理论上说,回归或者机器学习中的所有算法都可用于综合评价,但回归或者机器学习算法确定函数更多借助于大量样本,而大量样本在综合评价中一般难以获得。
而且综合评价要求评价方法简单易用,所以大部分综合评价方法都是假定函数的类型,需要确定的只是一些参数(如权数),这些参数可以由人工确定(如delphi 方法)或者通过一定的方法得到(如主成分方法)。
对于分类评价,因变量是一y基金项目:博士学科点专项科研基金资助项目(20040056041) 天津市建委资助项目 个分类变量,logistic 回归很好的解决了这个问题,将分类问题统一于回归问题(即因变量为数值的)。
同样仿照logistic 回归就可以将分类评价统一在排序评价,所以在下面的讨论中,只涉及排序评价,而不必考虑分类评价,因为分类评价可以转换成排序评价。
由于各个指标的量纲不同,为了消除这种影响,必须对每个指标进行标准化,记标准化后数值,其中(),1,2,i i i s S x i == n ()i S ⋅为第i 个指标的标准化函数,也有人称为效用函数或者无量纲化函数,处理的效果是一样的,只是不同的评价方法的称呼不一样,本文统一称为标准化函数。
的取值不必局限于0和1之间,甚至的含义同的含义也不相同。
当今机器学习流行算法中最终函数的形式都是一组基函数的线性组合,综合评价方法也是基函数的线性组合,即i s i s i x 11()(,)Ni i n i y f T s s α===∑x (1)其中i α是每个基函数的权数,权数可以人工赋值,也可以按照一定的方法计算得出()i T i [6-8]。
基函数的形式可以是多种多样的,最常用的也是最简单的1(,),1,i n i T s s s i n == (2)有人称基函数为合成函数,或者干脆没有提起。
但无论如何,各种评价方法确实存在基函数。
标准化函数、基函数以及权数()i S i ()i T i i α按照(1)组合而成的函数就是要求的综合评价方法,三者之间任意一者的变动都会是一种新的评价方法,所以综合评价方法层出不穷。
下面分析一些综合评价方法标准化函数、基函数以及权数的构造形式:1)模糊综合评价方法[9]虽然是建立在模糊集合的基本理论之上,但综合评价时的隶属函数其实就是标准化函数,或者反过来,值域改为0-1时的标准化函数可以看作隶属函数。
模糊合成算法也就是基函数(2),权数就是权向量。
而模糊评语相当于分类评价,模糊合成值可以看成评价对象属于每个评语等级的概率向量。
2)多元统计综合评价函数标准化函数并不唯一,基函数也是(2),只是权数是通过一些多元统计方法得到。
3)灰色系统分析法白化函数其实就是一种标准化函数,其它同模糊综合评价类似。
4)ANN 法或遗传算法综合评价函数标准化函数可以选取一般的标准化函数,如Z-Score 等等,但是其基函数是相当复杂的,最后的权数也是按照一定准则优化得到。
二、标准化函数选取目前人们已提出的标准化方法名称很多,如综合指数法、均值化、 Z-Score 法、比重法、初值化、功效系数法、指数型功效系数、对数型功效系数、极差变换法、高中差变换法、低中差变换法等等。
但大致可以归为四类[10]:广义指数法、广义线性功效系数法、非线性函数法、分段函数法。
其中前两种是实践中应用最广泛的无量纲化方法。
广义指数法是单项指标实际值与标准值进行对比的结果,写成一般公式为:()/i i i iB S x x x =其中是选取的比较基数。
广义线性功效系数法的标准化函数基本形式是iB x 010i i ii i x x Sx x −=−其中和是第i 个指标的两个关键点。
与广义指数法不同的是,广义线性功效系数法需要两个标准点,但两者都是直线型的标准化函数。
而现实生活中许多评价对象的价值水平与指标值本身之间的关系却是非线性的。
因此,人们提出了一些非线性函数标准化方法。
邱东教授对这类标准化方法进行了总结,并介绍了五种曲线型公式,即升半1i x 0i x Γ型分布、升半正态分布、升半柯西分布、升半凹(凸)分布、升半岭型分布。
但这五个公式都是“递增型”,从而只适用于“正指标”,对于逆指标则需要通过“转向化”后再使用这五个公式。
上述三个方面的标准化函数都是“全程的”,即针对单项评价指标的整个定义域而言的。
实践中也有采用分段函数的方法来设计标准化公式。
人们通常提到的一种就是“折线型”无量纲化方法,但“折线型”只代表了斜率与截距不同的数条直线的组合。
事实上,完全可以利用曲线函数进行分段组合,应该说,这样的无量纲公式是相当复杂的,属于高级阶段。
三、基函数的形式基函数的选取主要有两个途径,一类是决策科学中关于方案合成方面的一些模型,如幂平均基函数1/1()()k i i iM k s ωω=∑k∑,其中i ω是第i 指标的合成权数,k 为幂平均阶数。
另一类就是数学家和其它工程人士苦苦追求的逼近连续函数的一组基函数。
第一类没有什么理论基础,主要是为了应用上的方便,简单明了,有时候具有一定的实际意义。
幂平均函数包括算术平均、几何平均,还包括人们经常应用却一直没有引起重视的平方平均,甚至于任何阶次的幂平均,幂平均是最基本的合成模型。
特殊基函数包括加乘混合成函数与代换合成函数,还包括一些“二次合成”以及不同幂次的其它平均函数的混合。
另一类就是函数逼近的基函数,近几十年来,对于函数的逼近一直是数学研究人员和工程研究人员所关注的基本问题之一。
作为函数逼近的数学工具,已经发生了巨大变化,从19世纪初的Fourier 理论和多项式逼近到20世纪60年代的神经网络,一直到近10多年来的小波理论、多小波理论和小波神经网络[11]等,它们采用的基函数都是不尽相同的。
而统计回归和机器学习的各种算法的基函数也各有特点,投影寻踪回归的基函数是非参数函数,MARS(multivariate adaptive regression splines )[12]的基函数()(,)1()[()]mK q m km v k m k B x s x t q km +==−∏是q 次幂截尾样条函数张积,其中取值只能是,表示自变量的第个分量,是一个分点。
而支持向量km s 1±(,)v k m x x (,)v k m km t [13]的基函数是核函数。
将机器学习算法应用于综合评价,理论上不存在问题,应用中最大的障碍就是样本的获得。
一般这些算法都要求大量的样本,而实际评价中,每个样本(已知的评价对象)的综合评价值必须是确定的,一般综合评价值有两个途径可以获得,一是专家直接给出,这就使得样本带有主观性。
虽然综合评价函数可以由样本自动确定,但由于样本的主观性,评价结果还是具有一定的主观性,要想做到完全的客观评价是不可能的,也是没有必要的,因为评价本身就是一个人的思维过程。
二是使用其它专门的综台评价方法所得结果作为目标评价值,则ANN 评价就没有任何意义。
因为我们既然已经有了一个“数学模型”可以得出综合评价值,又倒必费力去找一个“根本看不到实际模型”的评价方法进行逼近呢?所以这类评价方法理论上听起来是完美的,但实际操作还有待进一步的改进。
四、构权方法构权方法按其主客观性的不同分为主观构权法与客观构权法。
目前许多文献都提到了这一分类。
这里的“主观”是狭义的,故如主成份分析法等由系统伴随而生的权数,根据指标本身的柑关系数及变异信息计算的权数都被冠之为“客观构权法”,而将AHP 法、Delphi 法等有“主观评分含义”的方法都被归为主观构权法(如果真的要分“主观构权”与“客观构权”两类,则Delphi 法也很难说一定是主观的,因为每个专家可以根据自己的理解选择构权方法),并且在综合评价理论界有一种较晋通的观点,认为客观构权方法优于主观构权方法,所以在提出一些新的构权方法时,总是声称自己的方法是客观的,不受人的主观随意性影响,所以是理想的构权方法。