当前位置:文档之家› 试卷分析常用统计指标

试卷分析常用统计指标

试卷分析常用统计指标 Revised by Jack on December 14,2020
试卷分析常用统计数据
一、平均分
平均分是反映学生成绩集中趋势最主要的测量指标,一般在Excel中可快捷求得。

二、标准差
标准差是反映每个学生成绩与平均分的平均差异程度,是学生成绩离散程度最广泛的测量指标,其值越大,说明成绩越分散。

在Excel中,点击函数工具选择“STDEVP”并确定计算范围(如:B2:B500)即可。

三、分数段人数
按分数段统计学生人数,一般可按5分或10分为一段进行统计,根据各分数段的人数可绘制出学生成绩分布的曲线或直方图,以“中间高、两头低”来衡量成绩是否符合正态分布的程度。

统计规律表明,考生的智力水平,包括学习能力,实际动手能力等呈正态分布,因此正常的考试成绩分布应基本服从正态分布。

综合考察标准差与平均分以及成绩分布的曲线,可以了解学生成绩的分化程度、分布密度等情况。

统计分析中,通常还计算各分数段人数占总人数的比率,以及满分率,零分率。

在列表叙述相关数据中还应列出最高分、最低分。

四、难度系数
难度指试卷(题目)的难易程度。

一般用试卷(题目)的得分率或答对率表示,所以难度事实上是容易度或通过率。

其值在0~1之间,数值越大,说明试卷(题目)越容易。

一般计算方法:
1、客观性试题难度P(这时也称通过率)计算公式:P=k/N。

其中,k为答对该题的人数,N为参加测验的总人数。

例:第1小题选择题满分是4分,全班50名学生中有20名学生答对,则第1小题的难度计算:平均分=4×20÷50=,P=平均分÷满分值=÷4=。

2、主观性试题难度P计算公式:P=X/M。

其中,X为试题平均得分;M为试题满分。

3、适用于主、客观试题的计算公式:P=(PH+PL)/2
其中,PH、PL分别为试题针对高分组和低分组考生的难度值。

在大群体标准化中,此法较为方便。

具体步骤为:①将考生的总分由高至低排列;
②从最高分开始向下取全部试卷的27%作为高分组;③从最低分开始向上取全部试卷的
27%作为低分组;④按上面的公式计算。

例:一次生物测试中,在100名学生中,高低分组各有27人,其中高分组答对第一题有20人,低分组答对第一题的有5分,这道题的难度为:
PH=20/27=,PL=5/27=,P=(+)/2=。

4、整个试卷的难度等于所有试题难度之平均值(包括主、客观试题),或用公式P=X/M计算。

难度值在0至1之间。

P>试题太易;P<时,试题太难。

一份试卷应该由不同难度按一定比例组成。

一般地说,P> 、P<的试题各占10%;P=~,和P=~0.8的试题各占20%;P>、P <的中等难度试题应占60%。

整套试卷平均难度在~之间。

五、区分度
区分度是指试题对被试者情况的分辨能力的大小,它反映试题区分不同水平受试者的程度,即考出学生的不同水平,把优秀、一般、差三个层次的学生真正分别开。

区分度高的考试,优秀、一般、差三个层次的学生都有一定比例,如果某一分数区间学生相对集中,高分太多或不及格太多的考试,区分度则低。

区分度也是衡量题目质量的主要指标之一,是筛选题目的依据。

一般的教学测验分析中,通常采用极端分组法,具体方法:先将被测学生按其总分由高到低的顺序依次排列,然后取其上端一部分为高分组,取其下端一部分为低分组。

各组的人数应占多大比例,要视被测学生总体的具体情况而定。

一是学生人数不太多,可把前50%的考生为高分组,后50%为低分组。

二是学生人数多,如果测验总分的分布符合正态分布,最适当的比例是高分组和低分组各占27%;如果分数分布较正态分布平坦,高、低分组人数比率要略高于27%;一般情况下,其比率介于25%—33%之间即可。

计算公式:
1、客观性试题区分度D:D=PH-PL
其中,PH、PL分别为试题高分组和低分组考生的难度值,PH、PL的计算方法同上。

例:一次生物测试中,在100名学生中,高低分组各有27人,其中高分组答对第一题有20人,低分组答对第一题的有5分,这道题的区分度为:
D=PH-PL=、主观试题(非选择题)区分度D:D=(XH-XL)/N(H-L)
其中,XH表示接受测验的高分段学生的总得分数,XL表示接受测验的低分段学生的总得分数,N表示接受测验的学生总数,H表示该题的最高得分,L表示该题的最低得分。

3、整个试卷的区分度,是所有试题区分度的平均值。

六、信度
信度是反映测量工具可靠性的指标。

试题的信度主要是指测量结果的可靠性或一致性。

常见的试题信度多用相关系数来表示,即用同一组被测学生样本对两组项目的反应之间的相关,作为反映两组项目测量的一致性程度的指标,称作信度系数,简称信度。

几种常用信度的意义及计算方法:
1、再测信度
用同一份试题对同一组学生前后实施两次测试,计算两次测验分数之间的相关系数,即得再测信度。

这种信度能表示两次测验结果有无变化,反映测验分数的稳定程度,所以又称为稳定性系数。

再测信度一般用皮尔逊积差相关公式计算。

2、复本信度
如果用两份等值平行的试题测量同一组学生,再求两次测验分数的相关,其结果就是复本信度。

用皮尔逊积差相关公式计算。

3、分半信度
在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,根据学生在这两半测验中所得的分数计算相关系数,即得分半信度。

计算分半信度先要对测验分半。

不同的分半法可能会得到不同的信度值。

为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。

要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值偏高。

4、同质性信度
同质性是指试题中所有项目之间的一致性。

若测验中各个项目得分相关较高时,不论项目的内容或形式有何差别,测验都为同质;相反,即使所有项目看起来都好像是测量同一特性,但项目得分之间的相关很低,测验仍然是异质的。

测验越同质,同质性信度的值也越大,则说明试题的内部一致性程度越高。

因而,同质性信度又称作内部一致性系数。

常用计算同质性信度的方法如下:当项目采用二分法(项目只有通过或未通过两种分数)计分时,可用库德-理查逊公式;当项目属于论文式类型,采用连续分数计分时,可用克龙巴赫所创的a系数公式。

七、效度
效度(Validity)即有效性,它是指测量工具或手段能够准确测出所需测量的事物的程度。

效度是指所测量到的结果反映所想要考察内容的程度,测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。

效度分为三种类型:
1、内容效度。

指根据测验目的确定的测验内容所引起的预期反应达到测验目的的程度。

2、构想效度。

指测验对预先设立的某一理论上的概念、构想或研究特性的实际测量程度。

3、效标效度。

指测验分数与效标的相关程度。

所谓效标,就是检验测验有效性的一种参照标准。

效标常用一种公认比较可靠或权威的测验结果表示。

这实际上就是用一种已知的且认为其“有效”的测验结果去检验另一个新测验的有效性。

之所以不直接用效标测验去代替新测验,往往是因为新测验可能比效标测验更为简单、易行。

相关主题