教育统计学教育统计与测量教育科学一门分支学科。
它是将统计与测量学原理和方法应用于教育实践和研究领域而形成的一门应用性教育学科。
属于工具性学科,具有基础性地位。
第一节什么是教育学一、什么是教育统计学教育统计学是运用数理统计的原理和方法,研究教育问题的一门应用科学。
它的主要任务是研究如何搜集、整理、分析由教育调查和教育试验所获得的数字资料,并以此为依据,进行科学推断,揭示教育现象所蕴含的客观规律。
例:我们可以通过调查把握近五年来某地区小学教师学历达标的比例、逐年变化的情况。
通过调查我们也可以了解学校各种设施逐年改善的情况,了解学生的升学率、辍学率等等。
教育统计学与教育调查、教育试验的关系:教育调查与教育试验会提出具体的研究任务,解决具体的问题。
而教育统计学主要是对数据进行分析和处理。
如果统计学不与一定的调查和试验联系起来,研究者就不知自己在干什么,说明什么问题。
反过来,调查和试验不与统计联系起来,则它们会是杂乱无章的,这样教育的规律就显示不出来。
二、教育统计学的内容从具体应用的角度来分,可以分成:1.描述统计。
就是对已获得的数据进行整理、概括,显现其分布特征的统计方法。
2.推断统计。
根据样本提供的信息,运用概率理论进行分析论证,在一定可靠程度上,对总体分布特征进行估计、推测,这种统计方法称为推断统计。
其内容包括总体参数估计和假设检验两部分。
第二节学习教育统计学的意义首先,统计学是教育科学研究的工具。
如教育者对随机因素的处理。
其次,是提高专业素养、专业水平的需要。
如可以帮助你阅读大量统计说明的资料,否则就不能理解别人的研究。
再次,提高教育实际工作的效率和科学性。
可以帮助了解现有的教育管理,从而在此基础上制定新的计划,提高教育实际工作的效率和科学性。
同时,还可不断发现问题,提出调整的方法和方案,因而能够提高工作效率。
最后,是科学训练的需要。
可以学会科学研究所需的推理和逻辑的能力训练。
第三节统计学中的几个基本概念一、随机变量试验结果数值不是恒定不变的量,我们把它称为变量。
和它相反的量叫做常量,即数值保持恒定的量。
表示随机现象各种结果的变量称为随机变量。
统计处理的变量都是随机变量。
一般用X、Y、Z表示。
具有以下三个特性的现象,称为随机现象。
第一,一次试验有多种可能结果,其所有可能结果是已知的。
第二,试验之前不能预料哪一种结果会出现。
第三,在相同的条件下可以重复试验。
随机现象的每一个结果叫做一个随机事件。
二、总体和样本总体是我们所研究的具有某种共同特征的个体的总和。
比如我们要了解全国初中生的英语水平,只有具有“全国的”“初中生”“英语”这些共同特征个体才构成一个总体。
总体中的每个单位称为个体。
总体和样本的分类:总体可以分为两种,一种为有限总体,另一种叫做无限总体。
当总体所包含的个体数目有限时,这一总体称为有限总体。
而总体所包含的个体数目无限时,则称为无限总体。
样本种包含的个体数目称为样本的容量,一般用n表示。
样本中个体数目大于30称为大样本,等于或小于30称为小样本。
总体和样本的关系:具有相对性,即在一定的条件下可以相互转换。
比如我们想研究目前南阳师院在校大学生的外语水平,那么目前在校大学生就可以构成一个整体。
如果现在想研究全国大学生的外语水平,那么南阳师院在校大学生就是全国范围内的一个样本。
在这种情况下,总体就变成样本。
总体,样本,与研究的目的相联系。
三、统计量和参数样本上的数字特征是统计量。
也就是说,根据教育调查或试验获得的数据所计算出来的能够描述这组数据各种特征的数量是统计量。
总体上的各种数字特征是参数。
也即反映总体上各种特征的数量是参数。
第二章数据的初步整理第一节数据的来源、种类及其分类一、教育统计资料的来源1.经常性资料(档案性资料):如学生、家长和老师的资料等。
2.专题性资料:主要通过研究者对自己所感兴趣的或者是一些亟待解决的问题,通过调查或实验的方法来搜集的。
二、数据的种类数据就是随机变量的观察值。
1.按来源分:点计数据和度量数据。
点计数据指计算个数的数据。
它具有独立的分类单数,如人口数、学校数、男女数等,一般都取整数形式。
度量数据是指用一定的工具或一定的标准测量所获得的数据。
如身高、体重、成绩分数。
按测量数据是否等距和有绝对零,又可分三种水平:①有相等单位又有绝对零的数据称为比率变量数据,如身高、体重、反应时。
②有相等单位但无绝对零的数据,称为等距变量数据,如温度、各种能力分数、智商等。
③既无相等单位也无绝对零的数据称为顺序变量数据,如等级评定、品质评定、能力等级等。
计数数据常用百分比率的检验方法,χ2检验等,比率或等距变量常用T检验及方差分析,顺序变量常用等级相关、等级差异数分析等。
2.按随机变量取值是否具有连续性,分为间断型随机变量的数据和连续型随机变量。
取值个数有限的数据,称为间断型随机变量的数据。
这种数据的单位是独立的,两个单位之间不能再划分成细小的单位,一般用整数表示。
许多调查得来的数据属此类。
取值个数无限的数据,称为连续型随机变量的数据。
它们可能的取值范围能连续充满某一个区间。
数据的单位之间可以在划分成无限多个细小的单位。
数据可以用小数表示。
第二节统计表1.标题:表的名称。
上方,简明扼要。
2.表号:表的序号。
左方,时间顺序。
3.标目:表中对统计数据分类的项目。
4.线条:四条基本线条;不宜多。
5.数字:小数数位要一致,对齐;尽量不留空格;无数字可画横杠,可用省略号或问号表示。
6.表注:补充说明表的来源;字号不要大于表中的其它文字。
简单明了、重点突出。
二、统计表的种类1.简单表:只列出观察对象的名称、地点、时序或统计指标名称的统计表。
2.复合表:按两个或两个以上标志分组的统计表。
三、频数分布表列法频数:某一个随机事件在n次试验中出现的次数称为这个随机事件的频数。
一般用f表示。
频数分布:各种随机事件在n次试验种出现的次数分布称为频数分布,即把随机事件出现的次数都呈现出来。
频数分布表:把频数分布用表格的形式表示出来就是频数分布表。
频数分布表分类:1.简单频数分布表(1)间断变量的频数分布表(2)连续变量的频数分布表第一步:求全距R=最大值—最小值=128—81=47第二步:决定组数和组距k:一般分为10~15组。
i:一般定为1、2、3、5、10。
本例k=10,i=R/k=47/105第三步:决定组限,即决定各组的上下限。
组中值=(上限+下限)/2第四步:登记频数2.累积频数和累积百分比分布表:累积频数就是把频数一组一组累加起来,得到的频数叫累积频数。
累积百分比就是把频数用百分比变成相对频数。
用表格把这两种频数表示出来就是累积频数分布表和累积百分比分布表。
(1)累积频数分布表制作A.先制作频数分布表B.从最低一组的频数开始登记,思考题:将下列30名学生的英语分数编制成组距为5的简单频数,累积频数(上限以下)分布表,并绘制简单频数直方图。
76 71 66 63 88 83 77 72 68 64 70 76 81 79 73 71 66 61 55 65 74 86 78 82 74 84 6772 76 74第三节统计图统计图是用来表达统计指标与被说明的事物之间数量关系的图形。
它是整理数据的一种方法。
在运用统计图时,一般附有统计表。
一、统计图的结构及其绘制规则1.标题。
简明扼要,切合内容,必要时注明时间地点。
字体在图中为最大;一般在图下方。
2.图号。
3.标目。
对于有纵横轴的统计图,应在纵横轴上分别标明统计项目及其尺度。
4.图形。
图形线在图中为最粗,要清晰,图形的高与宽之比3:5为宜,以美观为准。
5.图注。
文字简明扼要,字体要小,写在图题的下方。
二、表示间断变量的统计图1.直条图:用直条的长短表示统计事项数量的图形为直条图。
常用来表示点计数据。
制作直条图的方法(1)条宽应一致。
只是高度不同,从而控制高度来表示大小。
(2)各直条之间要有一定的间隔。
因为它表示的是间断变量;但间隔不要太宽、或太窄,一般是一个到半个直条宽度之间。
(3)各直条的安排要有一定的顺序。
如时间前后、数字大小、等级次序等。
(4)为了直观,直条的附近不要写数字。
如需特别说明,可以安排一些图例。
直条图的分类:单式直条图和复式直条图直条图还可分为横条图和纵条图。
常见的为纵条图。
2.圆形图。
是用来表示间断性资料构成比的图形。
三、表示连续变量的统计图1.频数分布图(1)直方图用面积表示频数分布,用各组上下限上的矩形面积表示各组频数。
直方图的制作:以组距为底边,以分组区间的上下限为底边二端点,以次数为高画矩形,各直条距形间不留空隙。
直方图与直条图的异同同:都是用矩形来表示数据;异:直条图表示间断变量,而直方图来表示连续变量;直条图各直条之间有间距,直方图各直条之间没有间隔;直条图是以直条的长短高低来表示数量关系,而直方图是以面积来表示频数分布。
多边图:多边图是以纵轴上的高度表示频数的多少的图形。
制图方法大体与直方图相同,其不同之处在于:以各组中点为横坐标,以各组的频数为纵坐标描点,然后把每相邻的两点用直线连接起来,即成多边图。
若两组数据总频数不相同时,其纵轴应当以频数百分比表示。
(3)累积频数与累积百分比图制作方法与多边图制作方法很相像,其区别在于:描点时应以各组的上限为横坐标,以各组的累积频数或累积百分比为纵坐标,然后描处标点,然后形成一个曲线。
第三章集中量二、算术平均数的计算方法第二节加权平均数、几何平均数、调和平均数一、加权平均数:是不同比重数据(或平均数)的平均数。
例:某门课程期中考试成绩与期末考试成绩的权数分别为3和7。
已知某个考生期中考了92分,期末考了85分。
若不考虑其他因素,问该生在这门课上的成绩是多少二、几何平均数。
当一个数列的后一个数据以前一个数据为基础成比率(即等比级数)增长时,要用几何平均数求其平均增长率(即等比级数中的比率)。
常用作速率的集中量。
例如:某大学连续四年的毕业人数为:980、1100、1200、1300,问毕业生平均增长率是多少三、调和平均数:是一组数据倒数的算术平均数的倒数,亦称倒数平均数。
用公式表示为:第三节中位数一、中位数的概念二、中位数的计算方法三、百分位数的概念及其计算方法1.概念:百份位数是位于以一定顺序(一般是由小到大)排列的一组数据中某一百分位置的数2.计算方法第三节众数对众数有理论众数及粗略众数两种定义方法。
理论众数是指与频数分布曲线最高点相对应的横坐标上的一点(积分)。
粗略众数是指一组数据中频数出现最多的那个数。
二、众数的求法1.观察法。
先把数据列出来,然后找出现频数最大的数,即为众数。
例如:有人想了解大学二年级一个半学生的年龄大概是多少。
就可以把学生的年龄抄下来。
发现18岁有3个人,19岁8人,20岁4人,21岁2人,还有22岁1人。