《教育统计与测量》练习题一答案一、简答与计算答案1.设计教育测验时要考虑:确定测验的目的;确定测验的属性;明确测验的性质和用途;明确测验对象;分析测验目标。
2. 学生的情感发展目标主要包括哪些层次?如何测量?根据按布卢姆等的《教育目标分类学》,把情感领域的教学目标分为接受、反应、估价、组织和性格化五个层次。
第一,学生的情感目标很难用学生的外显行为来描述;第二,情感目标都以各种不同的方式使用“态度”、“兴趣”、“习惯”、“价值观”等概念来表达;第三,测量情感目标的试题答案无严格意义上的正误之分,常以量表或问卷的方式进行; 3.双尾检验,122/92.9724.691/0--=--=n S X t μ=-1.29, )21(2/05.0t =2.08,t =1.29<2.08,P>0.05,所以保留原假设,该校六年级英语平均成绩是与全市英语平均成绩在总体上是一致的。
4. 对于此题区分度的分析,采用点二列相关法。
pb r =0.45,假设检验结果为与ρ=0差异显著,相关系数有意义,即这道题的区分度为0.45,是一道质量不错的试题。
5.1000300P =0.3,0.5-0.3=0.2,Z=0.52,=70+0.528=74.2(分)6.测验题目难度水平的确定,取决于测验的目的、性质和题目的形成。
如果测验是为了了解被试在某方面知识技能的掌握情况,只要认为是重要的内容就可以选用。
如果测验目的是为了选拔,测验的平均难度就应该和选拔率大致相同。
一般情况下,测验的平均难度应保持在0.5左右并且各项目间应有一个合理的难度梯度。
7. 第一,所空出的应是关键字词,且与上下文有密切的联系。
第二,空白处不要太多,以免句子变得支离破碎。
第三,尽量将空白放在句子的后面或中间。
第四,所有空白的线段长度要一致。
第五,若答案是数字,应指明单位和数字的精确程度。
第六,题意要明确、限定要严密,使空白处答案唯一。
8.解:60分以下的人数比例为0.3707,60—70分的人数比例为0.2586,70—80分的人数比例为0.21204,80分以上的人数比例为0.15866。
各分数段的人数为:60分以下为223人;60—70分为155人;70—80分为127人;80分以上为95人。
9.H0:,H1:>=2.82由于计算的t=2.82>1.833,P<0.05,所以拒绝原假设,结论为:这位教师的训练方法有显著性成效.10.Z=-0.545,P>0.05,差异不显著,与全区的研究结果一致。
11.客观性测验的优势是:第一,适合展开大规模测验;第二,题量大,信息范围广;第三,试题分布均匀;第四,阅卷容易;第五,评分结果客观、公正、可靠;第六,用于测量知识的掌握、理解、应用、分析等12.常模参照测验是以学生团体的平均成绩作为参照标准,就某学生得分的高低来说明其在学生团体中的相对位置(或名次),将学生分类排队。
其特点是学生成绩的高低是相对的。
它着重学生个人之间的横向比较,适于区分学生的成绩水准,可供选拔、编班、编组之用。
这种测验目的主要是在于考查被试的个体差异,衡量被试的相对水平。
常模参照测验要求测得的分数变异性要大,得分的范围要广,要求试题有很强的鉴别力。
凡是参照规定的教学目标,核对学生的测验得分,评定其是否达到标准以及达标程度的测验,都属于标准参照测验。
特点是学生成绩的高低是绝对的,不在所在的群体中横向比较。
标准参照测验主要用于基本知识、基本技能的测量,用于诊断及个别指导。
13.H0:,:>,=3.93由于计算的=3.93>Z 0.01=2.33,所以在0.01水平上拒绝原假设,接受备择假设。
结论为训练前后两次测验的平均成绩差异非常显著,训练后学生进步很大,阅读训练对提高学生的阅读能力有较大的促进作用。
14. 采用2χ检验。
带入2χ计算公式得2χ=10.39,P <0.05,结论为学生是否愿意报考师范大学与家庭经济状况有关。
(步骤略)15. 分别带入公式求得:算术平均数为77,中位数是76.8,S =7.509分,Q =5.425分。
(步骤略)二、论述与计算答案要点:1.答案要点:从试卷类型、试题的难度与区分度、试卷的信度与效度、试卷的测量目标与内容的吻合性等方面分析。
2.解:提出假设。
H 0:321μμμ==,H 1:至少有一对平均数不等。
通过检验发现,F 值小于临界值,这三组平均数之间没有显著性差异,也就是说这三种教材教学效果在总体上是一致的,没有显著性差异。
3.答案要点:主观性试题是教师提出问题,要求学生以自己的语言,使用取自各自背景知识的信息,用各种方式来表达自己的思想和观点,对教师规定的问题提供答案。
根据对学生所提供答案的形式、范围及长度的限制程度不同,主观性试题一般分为论述题、作文题、操作题、计算题等,用于测量较高层次的教学目标,尤其是适合于测量综合、评价等目标层次。
学生回答时,在处理问题的方法、采用哪些资料、组织资料的方式等方面均拥有相当的自由,不仅可以测量被试答题的最后结果,还可以反映被试的思维过程。
另外,也可以通过情境的创设,考察被试的创造力和想象力。
因此,在当前注重学生能力培养的教育改革背景下,主观性试题在试卷中的比例不断增加。
由于主观性试题评分主观性太强,评分时一般采取要点评分法或步骤评分法、整体评分法或分项评分法、多人评分求平均法(如高考评分)。
结合主观题的内容、作用、优势来谈。
能够对这一趋势做出评价并给出理由。
4.方差分析表来源SS df MS F组间218.11 2 109.06 6.02*组内271.67 15 18.11总计489.78 17通过检验发现,F值大于临界值,这三组平均数之间至少有一对平均数显著性差异,也就是说这三种教学方法的教学效果在总体上至少有两种教学方法的效果是不同的。
5.答案要点:第一,控制系统误差。
第二,关注测验的内容与形式。
第三,适当增加测验的长度。
第四,控制测验实施过程中的因素。
回答时结合某学科的考试试卷,每一要点要做出具体的解释和分析。
6.先进行方差齐性检验。
=2.786,=6.39,<,P>0.05,方差齐性。
方差分析总表通过检验发现,F值小于临界值,这四组平均数之间没有显著性差异,也就是说不同的学习条件学生的学习成绩间没有显著性差异。
《教育统计与测量》练习题二答案一、简答与计算答案:【计算过程略】1.答案要点:第一,测验长度。
第二,测验的难度。
第三,测验内容的同质性。
第四,被试者差异。
第五,评分的客观性。
回答时每一要点要做出具体的解释和分析。
2.人的一般能力中,思考能力是教育教学当中经常涉及的,是能力的核心。
学生能力发展的目标层次主要是应用能力、分析能力、综合能力和评价能力。
其中评价能力是能力教学目标的最高层次r=0.8913.解:计算等级相关系数。
R相关系数检验。
:,:直接查积差相关系数临界值表,df=8,r(8)0.01=0.765。
P<0.01,在0.01水平上拒绝原假设,接受备择假设,认为学生学习潜在能力与自学能力之间高度相关。
4.双尾检验,Z=1.3,P>0.05,男、女生的发音成绩没有性别差异。
5. 0.3347 ~ 0.51536.编制试题时,确定测验目标需要注意哪些问题?第一,深入分析课程目标。
第二,正确选择目标领域和类别。
第三,正确理解各类目标之间的关系。
7.测验的信度是指测验结果的可靠性或一致性程度。
一个好的测验,对同一组被试先后施测两次,测验的结果应保持一致,否则测验就不可靠。
测验的效度是测验实际测量出其所要测量的特质的程度。
测验的效度始终是对一定的测验目的而言的。
判断某种测验效度的高低,主要看它达到测验目的的程度。
信度是效度的必要条件,但不是充分条件。
一个测量工具要有效度必须有信度,没有信度就没有效度;但是有了信度不一定有效度。
信度低,效度不可能高。
因为如果测量的数据不准确,也并不能有效地说明所研究的对象。
信度高,效度未必高。
例如,如果我们准确地测量出某人的经济收入,也未必能够说明他的消费水平。
效度低,信度很可能高。
效度高,信度也必然高。
8.=13.5,=9.58,取 =0.05,t=2.58>=2.201,P<0.05,拒绝原假设,这位教师的训练方法产生了显著性成效。
9.取=0.01,Z=7.75>2.58,P<0.01,A市儿童的身高与体重之间的相关程度与B市儿童身高与体重的相关程度差异非常显著,他们的相关程度不一致。
10.解:假设该班学生的身体状况符合正态分布。
按假设的正态分布概率计算各等级的理论次数。
各等级的理论次数为:甲类为8人,乙类为34人,丙类为8人。
2df=3-1=2。
查分布表,则(0.05)2=10.6。
因此,拒绝原假设,结论为:该班学生的身体情况不符合正态分布,或者说该班学生的身体状况甲乙丙三类的人数分布与正态分布以显著差异。
二、论述与计算1.答案要点主观性试题是教师提出问题,要求学生以自己的语言,使用取自各自背景知识的信息,用各种方式来表达自己的思想和观点,对教师规定的问题提供答案。
论述题是主观性试题中常用的一种题型。
它能够较好地测量被试高层次、复杂的学习结果,但有很多局限性。
第一,试题覆盖面较窄。
第二,评分的主观性强。
第三,难以控制。
第四,被试作答和评分阅卷都相当费时。
这些局限性正是主观性试题的不足。
在实践中要充分发挥主观性试题,特别是论述题的优势,减少测验误差,提高信度和效度,要遵循以下原则:第一,用来测量诸如综合、评价等较高层次的教学目标,限于那些客观性试题不能测量的学习成就。
第二,明确地陈述问题,使题意集中清晰。
第三,应采用答案具有统一定论的试题。
第四,一般不允许被试随意选择试题回答。
第五,慎重使用描述目的的行为动词。
2.解:提出假设。
H 0:1μ=2μ=3μ,H 1:至少有一对平均数不等α=0.05,df=(2,20)时,F 0.05=3.49。
由于计算的F=3.98>F 0.05=3.49,P<0.05,所以在0.05水平拒绝原假设,接受备择假设。
结论为三种教材中至少有两种教材教学效果差异显著,不同实验教材对学生学习成绩的影响是有差异的。
3.答案要点:如教师要随时把教材中重要的地方做好标记;在批阅作业或日常考试的试卷时,要记载学生常见的错误;搜集其他教师编拟的现成试题,分科分类储存等。
在搜集测验材料时要注意:第一,测验材料要适合测验目的。
第二,资料要丰富,能够代表该科教材的全部内容。
第三,资料要有普遍性,体现公平原则。
第四,材料要适合学生的程度并能区别学生的学习水平。
第五,材料要富有进取性并切合社会生活需要。
4. 方差分析总表在0.01水平拒绝原假设,接受备择假设。