案例六 因子分析在党风廉政建设民意测评中的应用
(王学民 编写)
一、 引言
对领导干部的廉洁自律及施政状况进行民意测评是搞好党风廉政建设工作的一个非常重要的环节。
在实际工作中这样的民意测评还是比较多见的,这对促进党风好转和廉洁施政具有很好的积极意义。
但许多组织民意测评的机构或部门对调查得到的数据结果往往只是进行简单的数据汇总和处理,并未采用更为科学的统计方法对这些资料作进一步加工和分析,这样就使得民意测评结果中所包含的许多有价值的信息未能得到很好、充分的提炼和显现,这是很可惜的。
如何对这些调查结果进行有效的统计分析是一个值得研究和探讨的问题,具有理论和实践的意义。
这类民意测评的结果具有这样一个共同的特点:许多调查指标之间的相关程度往往较高,即它们所含的信息大量地重复着,因此分析处理这类问题的一个非常值得考虑的方法是采用因子分析方法,将众多的调查指标归因于少数几个因子,从而较好地达到降维的目的。
如果该方法成功,则可以对民意测评中反映出的问题得到比较清晰的认识,有利于对领导干部的廉政情况给出一个高度概括的、清楚的评价。
本文以上海财经大学纪委对各院系领导班子所作的民意测评为例,对其调查数据进行因子分析,并根据因子分析的结果对各院系的党风廉正建设状况给出一个有效、直观和清晰的比较分析。
二、数据的预处理
上海财经大学纪委每年都要对各院系的整个领导班子进行民意测评,学校共有七个学院和四个(校级)系。
2003年度的民意测评汇总结果经整理后列于表1中,11个院系在表中分别用字母a,b,c,d,e,f,g,h,i,j,k 表示。
所有11个测评指标有“好”与“不好”两方面的比例,为了有效地进行因子分析,我们让每个指标“好”的方面比例减去“不好”的方面比例,将其作为该指标的综合值,表明“好”的程度,并分别记为1121,,,x x x ,结果列于表2。
表1 汇总数据(单位:%,除被调查人数外)
表2 “好”的方面与“不好”的方面相减之后的数据(单位:%)
三、因子分析
为使因子分析能够均等地对待每一个指标,需对各指标作标准化变换,即令
i
i
i i s x x x -=
* 其中,i x 和i s 分别是指标i x 的样本均值和样本标准差。
*
11
*2*1,,,x x x 的协方差矩阵也就是1121,,,x x x 的相关矩阵,因此我们从样本相关矩阵出发进行因子分析。
本文以下的计算和
作图都是用SAS 软件来实现的。
1121,,,x x x 的样本相关矩阵计算结果列于表3。
表3 相关矩阵
在因子模型的参数估计中选择主成分法*,相关矩阵的前三个特征值为
826.0,128.1,312.8321===λλλ
在因子分析的过程中,我们认为取两个因子较好,前两个特征值的累计贡献率已达85.82%,使用最大方差旋转法后得到的估计因子载荷矩阵及共性方差列于表4。
*
对该数据,采用其他参数估计方法得到的结果几乎相同。
表4 旋转后的因子载荷矩阵和共性方差
从表4中的因子载荷估计可以看出,第一个公共因子1f 可解释为群众对院系领导班子廉正施政的综合评价因子,第二个公共因子2f 可解释为院系领导班子的廉政制度建设因子。
表4中的共性方差都较大,表明两个公共因子能够较好地概括每一个原始指标。
在上述因子模型中,可用回归法求得因子得分公式:
*
11
*
10
*
9
*
8
*
7
*6
*5*4*3*2*11179.0119.0146.0220.0171.0229.0006.0288.0265.0068.0177.0ˆx x x x x x x x x x x f +
-
-
+
+
+++-+=
*
11
*
10
*
9
*
8
*
7
*6
*5*4*3*2*12051.0336.0369.0116.0056.0152.0184.0212.0487.0097.0055.0ˆx x x x x x x x x x x f -
+
+
-
-
-+-++-=
将11个院系的指标数值1121,,,x x x 经标准化后代入上述因子得分公式可得每个院系的两
个因子得分数值。
从表4中可以看出,第一因子得分1ˆf 值越大,表明该院系领导班子得到
的廉正施政综合评价就越高;反之,就越低。
第二因子得分2ˆf 值越大,表明该院系领导班子的廉政制度建设做得越好;反之,则越差。
现分别按1ˆf 和2
ˆf 的数值大小将各院系进行降序排列,列于表5。
表5 分别按第一因子得分1ˆf 和第二因子得分2
ˆf 的排序
图1是关于第一和第二因子得分的散点图,它对各院系的党风廉政建设民意评议结果有比较直观的描述。
图中显示,院系h 领导班子的廉正施政综合评价最高,而院系d 领导班子则最低;院系a 领导班子的廉政制度建设做得绝对最差,而它的廉正施政综合评价却属于中等水平,我们可以凭借这张散点图来直观地了解各院系领导班子的党风廉政建设情况。
四、讨论
因子分析将11个原始指标归结于两个因子,信息量竟保留了高达85.82%,指标压缩得如此成功正是由于原始指标之间存在着较强的相关性。
使用两个因子的一个很大优点是可以在平面上作图,这张散点图里包含了11个原始指标的绝大多数有用信息,11个院系的党风廉政建设情况在图中一目了然。
实践中我们可以对各原始指标作一个合理的加权平均,以对各院系领导班子的党风廉政建设状况进行综合排名。
但只是作这样的排名还不够,因为排名所依据的那个综合指标所含的数据变异性的信息远不及两个因子(表5及图1)所含的丰富,这正是因子分析的价值所在。