基于主成分分析法的学生成绩综合评价
摘要:以贵州航天职业技术学院2011级社区管理与服务班在2011—2012学年的13门主要课程考试成绩为研究对象,借助统计软件进行主成分分析,计算出主成分得分,并按主成分得分对学生进行了排名。
为使成绩评价更具科学性、客观性和合理性,还将平均分和综合分比对,进行综合评价与分析,为教学研究、学生管理及就业指导提供科学依据。
关键词:主成分分析法;学习成绩;评价
中图分类号:g455 文献标识码:a 文章编号:1001-828x(2013)07-0-03
一、引言
在经济全球化和社会分工越来越细化的当今社会,人力资源已成为人类的第一宝贵资源。
作为高素质人才主要培养基地的高等院校,如何科学地评价大学生的综合成绩成为当前各高校在全面推进素质教育过程中所面临的问题之一。
传统的以多门课程总平均分排名的评价方法,比较笼统,为了尽可能全面、科学地反映被评价对象的情况,往往需要选取众多的指标构成评价体系,但是,过多的指标不仅会增加评价的工作量,还会因评价指标间的相关性造成评价信息相互重叠、相互干扰,从而难以客观地反映被评价对象的真实水平。
本文认为可以使用主成分分析法解决此类问题。
二、主成分分析方法简介
主成分分析,是利用降维的方法,将多个指标转化为少数几个综
合指标,去解释原始资料中的大部分变异的一种方法。
在实际问题中,为了全面、系统地分析问题,通常必须考虑众多的影响因素,这些影响因素一般被称为指标或者变量。
因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而反映的信息在一定程度上有重叠。
在用统计方法研究多变量问题时,变量太多会增加计算量和分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。
因此,把这些变量转化成彼此不相关的变量,然后从中选出比原始变量个数少、却能解释原始资料中大部分变异的几个新变量,即所谓的主成分,从而达到降维和简化问题分析的目的。
具体而言,主成分分析法是通过数学变换把给定的一组相关变量通过线性变换转成另一组不相关的变量,并按方差依次递减的顺序排列,找到第一、第二、…第 k个主成分,然后计算因子载荷矩阵,建立主成分模型,最后按因子得分及贡献率的大小,计算综合得分并进行排序。
三、高校学生成绩综合评价应用
(一)研究的对象及指标的选择
本文以贵州航天职业技术学院11级社区管理与服务班在2011—2012学年的13门主要课程考试成绩为研究对象,借助统计软件进行主成分分析,计算出主成分得分,并按主成分得分对学生进行了排名。
班上共有28名同学,将这28名同学作为总体,13门主要课程具体为:大学英语ⅰ(x1)、思想道德修养与法律基础(x2)、管
理学原理(x3)、社区管理学(x4)、社会工作法律实务(x5)、应用统计学(x6)、体育(x7)、社会心理学(x8)、服务礼仪(x9)、高等数学(x10)、团队建设(x11)、大学英语ⅱ(x12)、大学语文(x13),学生姓名用序号1、2、… 28表示,用xij 表示第i个同学在第j 门课上的得分,则x=(xij)28×l3,这样就得到了一个28×13的原始数据矩阵。
见表1。
(二)主成分分析过程
将原始数据标准化,用计算机求出标准化矩阵的相关系数矩阵;求相关矩阵的特征值,确定主成分个数。
(见表2)
表2 方差分解主成分提取分析表
如表2所示,将13个主成分按照特征根从大到小的次序排列,可以看出第一主成分的特征根为5.984,它解释了总变异的
46.352%;第二主成分的特征根为1.617,它解释了总变异的
12.683%;第三主成分的特征根为1.382,它解释了总变异的
11.476%;第四主成分的特征根为1.134,它解释了总变异的9.556%,因此,前4个主成分的累计贡献率已经达到80.067%,即前4 个主成分可以反映13个指标80.067%的信息量,说明只取前4个主成分即可。
上述13 项指标可以综合成4个公共因子(f1、f2、f3 和f4),并可得到因子载荷矩阵(表3)。
表3 因子载荷矩阵
从表3可以看出:第一主成分在x3、x4、x5、x6、x8、x10、x11
上有较大载荷,f1反映的是学生在管理学、社区管理学、社会工作法律实务、应用统计学、社会心理学、高等数学、团队建设方面的信息,故可以认为第一主成分是说明学生专业知识的学习情况;第二主成分在x2、x13上有较大载荷,f2反映的是学生在思想道德修养与法律基础、大学语文方面的信息,故可以认为第二主成分是说明学生基础知识的学习情况;第三主成分在x7上有较大载荷,f3反映的是学生在体育方面的信息,故可以认为第三主成分是说明学生体育运动方面的情况;第四主成分在x9上有较大载荷,f4反映的是服务礼仪方面的信息,因此可以认为第四主成分是说明学生在交际礼仪方面的情况。
计算各个主成分的得分:
f1=0.2865x1+0.1276x2+0.3260x3+0.3675x4+0.3762x5+0.2711x 6-0.1798x7+0.3502x8+0.2113x9+0.3205x10+0.3063x11+0.2117x1 2-0.0136x13
f2=-0.2335x1+0.5682x2-0.1802x3-0.1065x4-0.1418x5-0.2198 x6-0.3501x7-0.0123x8+0.2177x9-0.1055x10+0.1182x11+0.4782x 12+0.2408x13
f3=0.1927x1-0.0909x2-0.1206x3+0.0922x4-0.0672x5-0.1326x 6+0.4301x7+0.0912x8-0.2786x9+0.2721x10+0.0059x11+0.2231x1 2+0.7065x13
f4=-0.2876x1+0.7285x2-0.2251x3-0.1353x4-0.1765x5-0.2755 x6-0.4256x7-0.0156x8+0.2716x9-0.1346x10+0.1519x11+0.5976x
12+0.3129x13
根据以上四个表达式求出各主成分得分后,以特征值的贡献率作为加权系数求出综合得分:
f=0.46352f1+0.12683f2+0.11476f3+0.09556f4
由此得到学生成绩的综合排名详见表4。
表4 综合排名
(三)评价
经主成分分析,在基本保留原始数据信息量的前提下,将l3个具有一定相关性的原始指标降维成4个相对独立的主成分,这4个主成分可以代表13个指标80.067%的信息量。
从表4可以看出,通过主成分分析法得到的综合分排名与平均分排名基本相符,但也存在一定的差距。
如20号同学综合分排名是第6名,而平均分排名是第16名,主要原因是他在第一主成分上得分较高,说明该同学专业知识学得比较扎实,其专业能力相对较强;而22号同学则刚好相反,其综合分排名是第19名,平均分排名是第12名,主要原因是他在第一主成分上得分较低,恰恰第一主成分是考察社区管理专业学生的关键,它反映了学生专业素质方面的水平,因此要建议该同学提高认识,加强专业知识的学习,努力提高专业素质。
又如平均分很接近的3号、11号、26号三位同学,平均分排名均为第9、第7、第8名,综合分排名分别为第8、第5、第3名,从表4看出26号同学在第一和第二主成分上得分比3号和11同学号要高,表明26号同学在专业知识和基础知识方面有优势, 26号
同学在三个主成分上得分均为正,因此综合得分高出3号和11号;虽然3号在第三主成分上得分均高于11号和26号同学,但是第三主成分的贡献率仅为11.476%,无法取代11号、26号同学在第一主成分上的优势,因此他的综合分排名仍在11号、26号同学之后。
四、结论
本文运用主成分分析法,评价了大学生的综合成绩,克服了传统方法中只能笼统反映学生考试成绩的缺点,分析的结果可以客观地反映学生各方面知识的掌握情况,了解学生的优、劣势,帮助教学人员因材施教,做到有针对性地指导学生发挥优势,弥补劣势,为教学研究、学生管理及就业指导提供科学依据。
参考文献:
[1]向定峰.高职学生成绩的因子分析[j].重庆教育学院报,2007(03):24-27.
[2]李曦.多元统计在学生成绩分析的运用[j].南昌航空工业学
院学报·自然科学版,2006(033):58-62.
[3]管宇.实用多元统计分析[m]杭州:浙江大学出版社,2011.
[4]扬宇音,赵雅明,曲立敏.因子分析法在大学生综合排名中的应用[j].贵州工业大学学报,2005,34(01):9-12.。