当前位置:文档之家› 教育常用的几个统计方法

教育常用的几个统计方法

教育常用的几个统计方法标准差S实例:比较下列二个小组语文考试的成绩:1组:82 83 84 87 88 88 89 89 90 902组:53 73 85 88 89 92 95 96 99 100二个组的平均分都是87,各组分数的分散程度各不相同:2组的分散程度大于1组,如下图所示。

这说明比较两组以上的分数时,只求平均分还不能看到它们的差异。

因此,还需要能描述差异的量数。

定义:差异量数是一组数据离中趋势的统计量的总称,表示数据之间的差异程度。

标准差是统计学中常用的差异量数之一,在教育统计学中占有重要地位。

标准差的计算公式为:公式中:S ---- 标准差。

x ---- 群体中的个体(班级或学生个人)的考试成绩。

M ---- 科平均分。

N ---- 群体中的个体(班级或学生个人)数。

由上述公式可以算出:1组的标准差= 2.79 , 2组的标准差= 13.58。

计算结果说明:在平均分相同的情况下班,标准差大,表明分数分散,好差悬殊;标准差小,表明分数比较集中,差距较小。

差异系数C V当数据的单位不同时,不能直接用标准差进行比较,比如学生的身高和体重,前者是长度单位,后者是重量单位。

另外,在单位相同时,如果平均数相差太大,直接用标准差比较也是不合理的。

针对这些情况,统计学中采用了一个相对的量数-----差异系数,用它来衡量不同组数据的离散程度。

定义:差异系数----CV,是标准差与平均数商的百分比:CV = S / M x 100%公式中:S ---- 标准差。

M ---- 科平均分。

实例:初一1班学生体重的平均数M = 46 公斤,标准差S = 6 公斤;身高的平均数M = 1.45米,标准差S=0.5米。

请比较体重与身高的差异程度。

体重CV = 6 / 46 x 100% = 13.04 %身高CV = 0.5 / 1.45 x 100% = 34.48 %身高CV > 体重CV。

学生的身高较体重的差异大。

标准分Z目前,学校一般采用百分制来衡量学生的考试成绩。

试题的难易程度是决定考生分数的主要因素,而试题则受到命题者诸多因素的影响。

因此,学生的考试分数或原始分没有绝对的零点,也没有统一的单位,用它来评价学生的成绩,有以下诸多弊端:●不能将一个学生前后多次考试的成绩进行比较。

●不能对不同科目的成绩进行比较。

●难以判断学生成绩的变化趋势。

●难以量化分析教师的教学质量。

●.. .这些弊端出现的原因是:原始分不能表示学生的成绩在群体中的位置。

为了克服上述弊端,NewEAS在原始分的基础上,增加了计算标准分的功能,以评价分析学生的成绩和教师的教学质量。

并且,根据不同的研究对象,将标准分细分为“学生标准分”和“班级标准分”。

学生标准分:以学生群体为研究对象,根据学生的百分制分数或原始分数,由计算机自动计算得出,它说明一个学生的成绩在其群体量数中的位置。

其公式为:Z = (x - M ) / S公式中:Z ---- 学生个人的标准分。

x ---- 学生<成绩>,即某一科目、某一次考试,学生的实际考试分数或“原始分”。

S ---- 学生<成绩>的标准差,请参阅标准差。

M ---- 科平均分:学生<成绩>的纵向平均值,即同一科目、同一次考试,“学生群体”中各学生<成绩>之和除以实考人数。

特点:●学生标准分以学生<成绩>的科平均分作为零点。

标准分等于0的学生的<成绩>正好等于科平均分。

●学生标准分为正值,表明其<成绩>大于科平均分;否则小于科平均分。

●学生标准分每增加1,相对应的<成绩>就比科平均分多一个标准差;反之,则少一个标准差。

班级标准分:以班级群体为研究对象,根据班级的<成绩>--班级平均分,由计算机自动计算得出,它说明一个班级的成绩在其群体量数中的位置。

其公式为:Z = (x - M ) / S公式中:Z ---- 班级标准分。

x ---- 班级<成绩>:班级平均分。

即一个班级参加同一科目、同一次考试的全体学生的成绩之和除以实考人数。

S ---- 班级<成绩>的标准差。

M ---- 科平均分:班级<成绩>的纵向平均值。

即同一科目、同一次考试,“班级群体”中各班级<成绩>之和除以班级数。

特点:●班级标准分以科平均分作为零点。

标准分等于0的班级的<成绩>正好等于科平均分。

●班级标准分为正值,表明班级<成绩>大于科平均分;否则小于科平均分。

●班级标准分每增加1,相对应的班级<成绩>就比科平均分多一个标准差;反之,则少一个标准差。

标准分Z分数虽然能表示一个分数在团体中所处的相对位置(通过查正态分布表就可以知道高于该分数的有多少人,低于该分数的有多少人),将不可比的原始分数变成可比的测试分数,但标准分Z分数有如下两个缺点:(1)标准分Z分数有正有负,且单位过大(占了整个一个标准差),使用不够方便;(2)难以使不懂统计的人理解,也不习惯。

为克服上述缺点,可通过线性转换,将Z分数转换成T分数:将Z分数扩大10倍再加上50,即T=10Z+50(计算标准分是繁琐的,但利用计算机就简单了)。

注:(1)原始分X →标准分Z→T分数,每一个原始分X对应一个T分数,这些T分数的平均数是50,标准差是10。

(2)T=10Z+50是一个线性表达式,即T是关于Z的一次函数,对于Z∈[-3,+3],T随Z的增大而增大,因此T分数具有Z分数的优点( 仍然能如实地反映某一考生在考生群体中的相对位置,一般录取时直接用Z分数,公布时用T分数),且没有负数,也为社会所接受。

(3)当卷面满分为100分时,T值一般在20~80之间;据说当高考试卷卷面分为150分时,将用T=10Z+100计算T分数,这时T值一般在70~130之间。

教育统计学初识描述统计一、 数据的特征量及其计算描述集中趋势的统计量,叫做“集中量数”,简称“集中量”。

常用的集中量数有三种:算术平均数,中(位)数和众数。

这里就某实验组和对照组某次考试的原始数据为例作些说明。

(1)算术平均数,简称平均数、均数或均值。

其符号为“X ” ,它起着衡量一定数据的集中趋势和大致水平的作用,是最常用的集中量,其计算公式是()n x x x x n X ++++= 3211从算术平均数可以看出,实验组与对照组的平均水平是否一样。

(2)中数(符号为“d M ”),是依一定顺序(如由大到小)排列的一组数据居中间位置的一个点的数值,所以又叫中位数。

如果数据个数N 为奇数时,中位数的位置在(N+1)/2处,若N 为偶数,就以居中的两个数据的平均数作中位数。

(3)众数(符号为“0M ”),指一组数据中出现次数最多的那个数值。

以上三个集中量中,平均数是无偏的客观量数,又最便于代数运算法则处理,从样本数值推断总体集中量时,平均数比中数、众数可靠,其缺点是易受两极端数值的影响。

二、差异量数差异量数是描述次数分布中“离中趋势”这一特征的统计量,简称“差异量”。

一组数据,若离中趋势小,则集中量的代表性就大;反之,若离中趋势大,则集中量的代表性就小。

但是,仅考虑集中量数是不够的。

要了解两组学生成绩分布的全貌,还必须研究两个组的差异量数。

最常用的差异量有全距、平均差和标准差。

(1)全距(符号为“R ”),指一组数据中由最大量数到最小量数的距离。

R 小说明离散程度小,比较整齐。

(2)平均差,指一组数据内的每个数与均数差的绝对值的算术平均数,通常用A.D.表示。

平均差的计算公式为:n xx x x x x x x D A n -++-+-+-= (321)(3)标准差,指一组数据中每一个数值与它们的平均数之差的平方的算术平均数的平方根,其符号为“S ”(样本标准差)、“σ”(总体标准差)。

其计算公式为: ()()()()n x x x x x x x x S n 2232221-++-+-+-=S 越大表明离散程度越大,数据不均匀,集中量的代表性小。

三、标准分数平均值与标准差用来考察与分析同质的统计资料是有价值的,但对于不同质的考试,如不同学科、或同一学科不同考试意义就不大。

这样就要计算相对位置量数。

相对位置量数有百分等级与标准分数两种。

这里就常用标准分数作些介绍。

(1)标准分数,又称Z 分数,它是一种以平均数为参照点,以标准差为单位的,表示一个分数在团体分数中所处位置的量数,其计算方法为:由原始分数与平均分数的离差除以标准差所得的量数,其符号为“Z ”,计算公式是:s x x Z -=(2)T 分数,标准分Z分数虽然能表示一个分数在团体中所处的相对位置,将不可比的原始分数变成可比的测试分数,但标准分Z分数有如下两个缺点:(1)标准分Z分数有正有负,使用不够方便;(2)难以使不懂统计的人理解,也不习惯。

为克服上述缺点,可通过线性转换,将Z分数转换成T分数:将Z分数扩大10倍再加上50,即T=10Z+50四、相关系数在教育研究中,常涉及到两个事物(变量)的相互关系问题,例如,学习成绩与非智力因素的关系,数学成绩与物理成绩的关系,男女生学习成绩的关系,等等。

其关系表现为以下三种变化;第一,正相关:一个变量增加或减少时,另一个变量也相应增加或减少;第二,负相关:一个变量增加或减少时,另一个变量却减少或增加;第三,无相关:说明两个变量是独立的,即由一个变量值,无法预测另一个变量值。

统计学中,就用“相关系数”来从数量上描述两个变量之间的相关程度,用符号“r ”来表示。

相关系数取值范围限于:-1≤r ≤+1相关系数的计算公式是由英国统计学家皮尔逊提出的“积差相关”公式:y x S NS xy r ∑=公式中,r=X 与Y 两数列之间的相关系数;x=X - ,即X 数列中各量数与其平均数之差;y=Y - ,即Y 数列中各量数与其平均数之差;Sx=X 数列的标准差;Sy=Y 数列的标准差;∑xy=各对离差积的总和;N=成对量数的次数,即总对数。

推断统计推断统计,是从样本统计量来推断它来自总体的特性,并标明可能发生的误差的统计方法。

在现实的教育研究中,限于人力物力,总是从总体中抽取出有代表性的样本,然后从样本统计量对总体的特征进行推断,即进行相应的“显著性检验”等统计分析工作。

在推断统计的基础上,研究者将对所研究的问题做出自己的解释、预测或估价。

一、Z 检验Z 检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。

它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。

27.2208.123.283.873.943.4410.422222212121-=-=+-=+-=写得:Z N S N S X X Z二、t 检验t 检验是用于小样本(样本容量小于30)时的平均值差异程度检验方法。

相关主题