当前位置:文档之家› “课程考试质量分析软件”常用指标的通俗解释.

“课程考试质量分析软件”常用指标的通俗解释.

“课程考试质量分析软件”常用指标的通俗解释(海南师范大学)陈继元“课程考试质量分析软件”是按照教育测量学的原理,为科学分析各门课程的考试质量而专门编制的软件。

该软件以其使用方便,分析全面、准确,在近年我校及其他院校的使用中,受到了用户的普遍好评。

在该软件的推广使用过程中,学校教务管理和教学督导部门经检查发现:有些教师由于对该软件所给出的“期末成绩分析指标”含义的理解存在一定的困难,而且又没有经过专门的培训,导致个人的分析结论不够科学,在一定程度上影响了课程考试质量分析的效果。

为了更好地发挥该软件的作用,便于教师们理解指标的含义,以下本人将偿试采用通俗易懂的方式,对考试质量分析中常用的指标作一个通俗解释。

1、平均分这是一个最常用的指标,它给出了班级成绩分布的“中心位置”,可以看成是成绩分布的“中心点”。

其计算公式为:n xxnii∑==1(ix是第i个学生的分数,n是学生人数)在实践中,人们认为一组数据的“平均数”可以反映这组数椐综合情况, 或者说它是一个有代表性的数。

如果一个班学生考试的“平均分”较高(即“中心点”靠右),就表明该班的考试成绩较好,反之亦然。

如果一个班考试的平均分是60分(或60分以下),则表明该班约有半数(或半数以上)的学生不及格。

2、 标准差它是一个用于描述考试成绩“分散程度”的指标。

标准差大,则表示该班考试成绩的分布较为“分散”,学生考试成绩的差异性较大,与“中心点”的平均偏离较大;标准差小,则表示该班考试成绩的分布较为“集中”,学生考试成绩的差异性较小,与“中心点”的平均偏离较小。

其计算公式为:标准差 nx x n i i ∑=-=12)(σ 标准差小=成绩分布范围较集中标准差大=成绩分布范围较大显然,标准差不是越小越好,也不是越大越好。

标准差太小,表明成绩的的分布过于集中,相互之间的差距拉不开,不能很好地反映学生学习的实际情况,因而,也表明命题质量不高;标准差太大,表明成绩的分布过于分散,相互之间差距太大,同样不能很好地反映学生学习的实际情况,也表明命题质量不高。

在百分制下,该指标的正常取值一般在8——15之间。

3、 偏度偏度是一个用于识别与反映成绩分布曲线形状的指标,确切地说,偏度是一个识别成绩分布曲线“非对称性程度”的指标。

在一定条件下还兼有识别成绩分布曲线是否接近正态分布曲线的作用。

同时,也在一定程度上起到识别命题难度的作用。

其计算公式为:偏度 33σμλ= ( 其中n x x i n i 313)(-=∑=μ ,σ是标准差 ) 成绩分布曲线直观上可以看成是一座山峰的轮廓曲线(假设只有单峰)。

如果山峰的位置大约落在0.4——0.6这一比例尺之间(如图),通常人们就认为该座山基本上是“居中”的。

如果山峰不是在这一比例范围内,则按肉眼识别你会得出山势偏左或偏右的结论。

在只有单峰的条件下:如果偏度等于0,则成绩分布曲线恰好对称,山峰位置居中,不偏不倚,这时成绩分布曲线接近于正态分布曲线;如果偏度不等于0,则曲线不对称,这时我们称曲线出现“偏态”。

“偏态”是相对于“正态”而言的。

如果偏度小于0(即偏度取负值),称为“负偏态”,这时山峰偏右,;如果偏度大于0(即偏度取正值),称为“正偏态”,这时山峰偏左。

偏度越小,山峰0 1 0 1偏度小于零 偏度大于零 0.6 0.4 0.4 0.6越偏右;偏度越大,山峰越偏左。

一般情况下,偏度可在-0.5与0.5之间取值。

当其小于5.0-时,山峰是明显偏右了;当其大于5.0时,山峰是明显偏左了。

当偏度取负值时,山峰偏右,表明多数学生的成绩较高;反之,当偏度取正值时,山峰偏左,表明多数学生的成绩较低。

当山峰明显偏右或明显偏左时,表明多数学生的成绩明显偏高或明显偏低,这时也表明命题的难度偏低或偏高。

也就是说,在某种程度上可以利用偏度的大小来识别命题的难易程度。

4、 峰度它是一个用于反映成绩分布曲线在形状上是陡峭还是平缓的指标,是识别“山峰高矮”的指标。

同时还在一定程度上兼有识别曲线是否为正态分布的作用。

其计算公式为:峰度 44σμη= ( 其中n x x i n i 414)(-=∑=μ ,σ是标准差 )按上述公式计算,当峰度值等于3时,对应的成绩分布曲线正好是正态分布曲线。

与正态分布曲线相比较,当峰度值大于3时,成绩分布曲线较为尖峭,“山峰高瘦”;当峰度值小于3时,成绩分布曲线较为平缓,“山峰矮胖”(如图)。

峰度大于3峰度小于3由图可知,峰度的大小在一定程度上也反映了成绩分布的分散程度。

峰度值大,表明成绩分布在此处比较集中;反之,峰度值小,表明成绩分布比较分散。

5、 区分度该指标用于识别在一个总体中“左、中、右”三个群体的区分和差别的程度(其意义有些类似于经济学中反映收入差距的基尼系数)。

按照本分析软件所采用的计算方法,在考察一个小题(或大题、或整份试卷)的区分度时,首先将该试题的所有得分由低到高排列。

这时,所谓“左”,是指得分较低的占总人数27%的弱势群体(即低分组),假设该群体的平均得分为A ;所谓“右”,是指得分较高占总人数27%的强势群体(即高分组),假设该群体的平均得分为B ;夹在两者之间的群体是“中”,其平均得分显然介于A 、B 两数之间。

我们就用A 与B 之间的距离来描述该总体的区分与差别程度。

为了便于在不同试题之间进行比较,通常把数A 和B 经过标准化处理后,标记在[0,1]区间相应的位置上(如图)。

显然,A 与B 之间的距离是一个介于0与1之间的正数,称它为该总体的“区分度”。

一般地,如果区分度大于0.4,则认为区分的程度很好,表明该试题(小题、大题或整份试卷)的命题质量很高;如果区分度介于0.3至0.4之间,则认为区分的程度较好,命题的质量较高,但还可以改进;如果区分度小于0.2,通常表明试卷的命题质量存在某些问题,其区分与鉴别的功能较差。

由于考核的目的性不同,对区分度应有不同的要求。

选拨性考试宜提高区分度;水平合格性考试,对试题的区分度要求宜小些。

另外,命题的区分度与难度之间存在一定的联系。

一般来说,区分度较高的试题其难度也较大。

因此,利用区分度在一定程度上可以识别命题的难度。

区分度0A B 16、考试信度信度是一个衡量考试结果的可靠性或可靠程度的指标,所谓可靠性或可靠程度可以理解为:是指学生的考试结果能否真实地、可靠地反映他们的学习情况,是否“真实可信”,或是“虚假不可信”的。

或者说,该指标用于判断学生期末成绩与平时成绩的相关性,用于判断学生期末成绩与平时成绩排名的“一致性”和“稳定性”,也即高者恒高、低者恒低,变化不大。

信度是衡量考试质量优劣的一个重要的技术指标。

它的取值在0 与1之间。

当班级人数在30人以上时,一般地,信度在0.7以上,就可以认为信度很高;信度在0.5至0.7之间,可以认为信度较高;信度在0.4以下,则信度比较低;信度在0.3以下,则该考试就不太可信了。

7、考试效度效度是一个衡量考试结果的有效性或准确性的指标,所谓有效性或准确性是相对于该考试的目的来说的。

或者说,效度是一个用来衡量考试的结果是否达到该考试的目的、在多大程度上达到该考试目的的指标。

举一个比较极端的例子,比如,为了选拔运动员去参加比赛,用高等数学试题去考他们,显然,这样考试的结果是无效的、不准确的。

对学校的课程考试来说,效度与区分度是有密切联系的。

可以认为,效度是建立在小题与大题区分度基础上的一个综合性指标。

具体来说,由小题的区分度加权平均后可以得出大题的效度(也可作为大题的“区分度”),再由大题的区分度进行加权平均就可以得出整个考试的效度。

效度对保证考试的质量来说,是一个十分重要的指标。

它的取值在0与1之间。

效度值越大,有效程度就越大。

考虑到目前试卷的录分一般只要求录入总分,因此质量分析表中的考试效度可用区分度来近似代替。

如果能录入各小题的得分(可使用附加软件来实现),则考试效度将自动生成,采用这一指标来衡量整个试卷质量会更精确、科学些。

效度与信度之间有什么关系呢?效度是考试结果准确性的量度,信度是考试结果一致性或稳定性的量度。

因此,效度与信度的关系,也就是准确性与一致性的关系。

下面举一个例子来加以说明。

例如打靶:如果弹着点很分散,那么,一致性与准确性都不好;如果弹着点比较集中,但却远离靶心,那么,一致性好但准确性差;如果弹着点都集中在靶心附近,那么,一致性与准确性都好。

通过这个例子说明,如果一致性不好,就谈不上准确性,一致性是准确性的必要条件和前提;但一致性并非准确性的充分性条件,一致性好准确性不一定好。

这就是说,虽然效度这个指标很重要,但要达到较高的效度,首先必须有较高的信度。

再根据上述效度与区分度的关系,我们可以说,在以上所介绍的各个指标当中,衡量考试质量优劣最重要的指标,首先应该是区分度和信度。

8、 难度系数 在小题分析表中,我们还给出了难度系数这个指标,该指标主要用于分析某个题目的难易程度。

其计算方法是先确定该小题的平均得分,不妨设为A 。

把A 点经标准化处理后标记在[0,1]区间相应的位置上。

这时的0代表得零分,1则代表得满分。

我们把A 点与1的距离称为该试题的“难度系数”。

很明显,如果难度系数较大,即A 点离1点较远(离0点较近),则表示该试题较难;反之,难度系数较小,即A 点离1点较近(离0点较远),则表示该试题较容易。

一般地说,难度系数大于0.5,则表明题目较难;小于0.3则表明题目较容易。

A19、关于正态分布曲线及其检验“正态分布”亦称“常态分布”,是描述随机现象的一种最为常见的分布。

正态分布曲线是函数222()()xxαϕσ--=的图象。

其中有两个参数α及σ,在这里,α就是平均分,σ就是标准差。

正态分布曲线的形状有如下显著的特点:中间高两边低,呈钟形;曲线两边对称;曲线在两边分别有两个拐点。

具体地说,曲线最高点的横坐标是xα=(也即成绩分布的“中心点”),曲线相对于直线xα=对称;曲线分别在xασ=±处有两个拐点;当x→±∞时,曲线以x轴为其渐进线。

当σ小时,曲线陡峭;当σ大时,曲线平缓(如图)。

正态分布曲线图0XαY多数情况下,在一个班级里,成绩好的和差的总是占少数(成绩特别好和特别差的就更少),而且好的和差的人数差不多,中等成绩的总是占大多数,这是很正常的,这也正是正态分布曲线的主要特点。

这就不难理解为什么“正态分布”又称为“常态分布”的道理。

因此,在正常情况下(也即考试的区分度、信度等指标的取值都在正常范围内),成绩分布曲线应该接近正态分布曲线,或者说基本符合正态分布;反过来说,如果成绩分布曲线偏离正态分布曲线较多,那么,该考试的区分度、信度等指标就会超出正常的取值范围。

换句话说,在正常情况下,区分度、信度等指标的高低与成绩分布曲线接近正态分布曲线的程度应该是基本一致、互相印证的。

相关主题