学生学习状况评价与预测摘要随着社会办学规模的不断扩大,教学质量的保证和提高问题日益凸显,各种教学研究和教学实践层出不穷,但是学生学习状况的评价作为提高教学质量和激励学生努力学习的重要手段,却没有得到应有的重视,传统的评价方法忽略了学生基础条件的差异,并不能对学生的学习状况进行全面、客观、合理的评价,因而,建立一种科学的评价方法势在必行。
本文首先通过分析附件中的612名学生四个学期综合成绩,发现成绩会根据试题的不同导致分布状态的变化,利用SK法,Q-Q图检验为负偏态分布。
所以首先利用转化函数将所给的成绩进行标准化使得标准化后的成绩能够满足统一的正态分布曲线,去除了试卷难度对于学生的影响。
然后在对学生学习状况的评估中,建立了模糊综合评价模型、基于层次化分析的模糊评价的改进模型、数据包络分析法(DEA),这三个评价模型进行评价。
基于层次化的模糊评价模型是模糊分类模型的改进,通过层次分析的方法能够得到可行科学的评估权值,利用标准化的成绩能够得到每个学生的评估总分,并不是模糊分类模型中量子化的得分。
而DEA法主要注重的是成绩的稳定上升,是对于前两种模型的补充。
在预测过程中我们运用了线性回归预测模型、模糊分析预测模型、GM(1,1)成绩预测模型、ARIMA(0,1,1)成绩预测模型,通过预测结果我们发现,在假设学生学习状况不变的情况下模糊分析预测模型的预测结果良好,可以很好的反映学生的动态的进步情况,而GM(1,1)的预测结果很差,不推荐使用。
如果考虑实际学生成绩波动和季节性变化的影响,则需要使用ARIMA(0,1,1),实际中这个模型的预测结果最好。
预测成绩表第5学期最后,我们对我们所建立的模型进行了客观的比较,并对其应用前景进行了展望。
关键字:标准化模糊综合评价模型层次分析 DEA 线性回归预测模型模糊分析预测模型 GM(1,1) ARIMA(0,1,1)2 问题的重述正确地、科学的评价学生的学习状况对于学校的教学工作至关重要,它是学生认识自己的前提条件,是激励学生努力学习不断进步的动力,同时也是教师培养学生的参照基础。
然而,现行的评价方式单纯的根据“绝对分数”评价学生的学习状况,忽略了基础条件的差异;只对基础条件较好的学生起到促进作用,对基础条件相对薄弱的学生很难起到鼓励作用。
在本题中,附件给出了612名学生连续四个学期的综合成绩。
要求我们做到以下三点:1.根据附件数据,对这些学生的整体情况进行分析说明;2.根据附件数据,采用两种及以上方法,全面、客观、合理的评价这些学生的学习状况;3.根据不同的评价方法,预测这些学生后两个学期的学习情况。
2 问题的分析1、首先我们通过原始数据可以做出其基本的统计量和直方图。
考虑到在学生成绩评价中会收到试卷难度等因素的影响。
所以必须得构造转化函数将所给的成绩进行标准化使得标准化后的成绩能够满足统一的正态分布曲线,去除了试卷难度对于学生的影响。
2、在学生整体成绩评估中,我们可以分析学生成绩平均值和稳定度的关系、分析学生成绩段人数、分析学生整体进步度、分析基础成绩对于总成绩的影响。
3、对于构造模型对学生学习状况进行合理有效的评估,我们可以利用模糊综合评价模型、层次化分析法、数据包络分析法(DEA)这三个评价模型进行评价。
4、对于成绩的预测,我们可以想到基本的几个预测模型:线性回归预测模型、模糊分析预测模型、GM(1,1)成绩预测模型、ARIMA(0,1,1)成绩预测模型,每个模型的着重点都不一样,这样对于从不同方面解决问题有着很大的帮助。
1、假设每个学期的综合成绩的满分为100分2、假设每个同学的学习能力基本不变3、假设附件数据中的两个零是由特殊情况所致4、假设每个学生处于相同的考试环境中5、假设附件中所给数据为学生真实考试成绩,不存在作弊问题的影响6、以后两个学期与前面四个学期采用同样的记分方式7、在模糊预测模型中我们假设两个学期学生的学习状况是不变的4符号的说明j: 学期i: 学生序号D: 总评价得分x: 第i个学生的第j学期的原始成绩。
ijDMU:第j个决策单元jU:因素集V:评语集i其他主要符号将在模型建立的时候详细说明。
数据标准化为了避免现行评价方式中仅根据“绝对分数”评价学生学习状况,设计出一种新型的发展性目标分析法,必须考虑到户律基础条件的差异,学生原有的学习基础,也注意到学生学习的进步因素。
首先注意到题干中所给出的数据为学生四个学期的分数,由于在实际中,如果单单注意绝对分数的话,由于试卷的难度的不同,会导致单纯通过题干给出的数据信息进行分析肯定是不准确的。
根据教育学与统计学的理论,一次难度适中信度可靠的考试,学生的成绩应接近正态分布。
也就是说,当学生的成绩接近于正态分布时,说明此次考试基本达到了教学要求。
判断成绩是否接近正态分布最直观,最有效的方法就是将成绩分布曲线与均值和方差相同的正态分布曲线加以比较。
如果是负偏态分布,则说明试题总体难度偏高。
如果是正偏态分布,则说明试题总体难度偏低。
如果是陡峭型分布,则说明试卷中难度中等的度量占比重太大。
这样首先做出所给数据中四个学期成绩的直方图和原始成绩的统计分析,其中实线表示正态分布的曲线,直观的说明所给成绩为偏正态分布。
这样我们的目标就变为构造一种变换使学生每个学期的成绩符合相同的正态分布曲线,这样也就能将试卷难度等影响消去,才能对所给的每个学期的成绩相互之间进行比较。
其次对原始数据进行SK检验得:第一学期第二学期第三学期第四学期SkKu 8,142这样通过以上的分析,我们可以发现,直方图在标准正态分布曲线的右边,且Sk<0,则都属于负偏态分布,说明试题的总体难度是偏低的。
而且根据Ku 值渐渐变大可以发现试题中中等难度的题目越来越多了。
根据其平均值和方差可知:学生在第四学期的平均成绩最高,其次是第二学期,第一学期和第三学期的平均成绩略低一些;但是从方差来看,第一、三学期低于第二、四学期,这从上图中也可以明显看出,第一、三学期学生的成绩分布要比第二四学期学生的成绩分布要集中。
那么下面我们构造一种方法使得每个学期学生转化后的成绩符合相同的正态分布曲线。
定义:0i x (i=1,2…n )为n 个学生的某一学期的原始成绩。
0ln(100)i i y x =-,这样就可以将一个偏正态分布转变成了i y 满足的正态分布,由于该函数单调递减函数,原始成绩高的反而变得成绩低了,为和传统保证一致,进行以下变换12i i x y y =-。
这样就能得到一个满足标准正态分布的数据了。
下面通过坐标的偏移拉伸使得其满足相同分布的正态分布。
1i x 的方差为:211211()1ni i x x n σ==--∑,得到112i i x x x σ-=,这样均值就偏移到了x=0处,且标准差为1。
作出2X 的直方图如下:利用Q-Q图检验其正态性得:说明其具有良好的正态性,那么数据的标准化和检验均告完成,这样就去除了试卷难度等客观因素导致成绩分布不合理产生的误差。
下面就可以根据已得到的标准化数据对于学生成绩进行评估。
学生整体状况的分析(1)分析学生成绩平均值和稳定度的关系根据已经标准化的成立,利用平均成绩与方差所联合做成的散点图,我们可以看出,大体的情况是,多数同学的成绩还是比较稳定的,就是个别同学,成绩起伏很大,并且大致趋势为,成绩越好的同学波动越小,相反,成绩不好的同学波动就很大。
(2)学生成绩段人数分析由于这里要进行学生成绩段的分析,就不能使用已经标准化的成绩了,显然如果使用标准化后的数据,则数据基本满足标准正态分布,这样进行成绩的分段研究也就失去了意义。
对原始数据进行成绩的分段分析得:成绩人数学期 1 2 3 490分以上0 2 1 080~90分138 204 129 19470~80分275 246 303 28760~70分140 110 144 10560分以下59 50 35 26通过以上分析我们了解到:第二学期和第四学期80以上的学生要明显高于第一学期和第三学期,而70分以下的学生数量要低于第一学期和第三学期,这就使得第二、四学期学生的平均成绩要高于第一、三学期。
而且不及格人数约来越少,成绩分布约来越集中,这正好和中SK分析得到的结果一致,也就是陡峭度越来越大。
从饼状图中还可以看出,成绩的分布渐渐朝着高分发展,这与SK分析中Sk值渐渐减小也是相一致的。
显然在这一步的分析中,造成这个结果的产生,可能因为试卷的原因,也可能是学生们通过学习进步的结果。
(3)学生整体进步度分析首先对标准后数据进行差分处理,计算出差分后的平均值,即平均进步率。
作出其平均分数和平均进步率的散点图,如下:由图可见,在平均值为0处,即成绩中等的同学中,会出现进步和退步较快的同学,而在成绩较好的同学部分,成绩进步不大,在成绩较差的部分,退步的同学相比进步的同学较多。
(4)基础成绩对于总成绩的影响分析将第一学期的成绩看作是学生的基础成绩,作出基础成绩和总成绩的散点图:我们可以看出数据点大致看来成线性,所以,入学基础对大学读书影响还是比较大的。
评价学生的学习状况(1)模糊分类综合评价模型根据中我们发现评定学生学习状况的依据有,学生的平均分,学习波动度,进步度。
下面从三个方面对学生进行综合评定。
设:第i 个同学的因素集i U ={平均分1i u ,学习波动度(标准差)2i u ,平均进步率3i u },评语集i V ={优1i v ,良2i v ,中3i v ,差4i v }对于每名学生基于其四个学期成绩及成绩变化做单因素评价:首先我们确定优良中差的比例固定为1:4:4:1,这样就能使学生评价处于平均,增强学生的学习动力。
1、对于平均分1i u因为不同基础的同学对某一得分同学的评价不同,所以当一名学生得 60 分时,得分大于80 分的同学会认为其基础差。
所以对学生的分数进行优良中差的比例分类:得到1i u 的单因素评价向量为:11,111(,,)i i y i l i z i c r r r r r ,1,111,,i y i l i z i c r r r r 分别为优良中差的权重评者 被评者 ~0~~0~~ 良 优 优 优 0~ 中 良 优 优 ~0 差 中 良 优 ~差差中良2、对于标准差2i u 得:得到2i u 的单因素评价向量为:22,222(,,)i i y i l i z i c r r r r r =,2,222,,i y i l i z i c r r r r 分别为优良中差的权重3、 对于平均进步率3i u 得: 得到3i u 的单因素评价向量为:33,333(,,)i i y i l i z i c r r r r r =,3,333,,i y i l i z i c r r r r 分别为优良中差的权重这样得到单因素评价矩阵:1,111122,22233,333,,,,,,i y i l i z i c i i i i y i l i z i c i i y i l i z i c r r r r r R r r r r r r r r r r ⎛⎫⎛⎫⎪ ⎪== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭考虑到对于差生的鼓励作用,我们认为平均进步率和平均成绩甚至比平均成绩更加重要,这样我们将三个因素分配权重为: C=(, , )评者 被评者 0~ ~ ~ ~0~ 良 优 优 优 ~ 中 良 优 优 ~ 差 中 良 优 ~差差中良评者 被评者 ~ ~ ~ ~~ 良 优 优 优 ~ 中 良 优 优 ~ 差 中 良 优 ~差差中良做模糊变换: 1,1112,2223,333,,(0.4,0.1,0.5),,,,(,,,)i ii y i l i z i c i y i l i z i c i y i l i z i c iy il iz ic B CR r r r r r r r r r r r r b b b b =⎛⎫ ⎪= ⎪⎪⎝⎭=这样就能得到特定同学的评价向量了。