第九章研究结果的定量描述对研究获得的有效内容进行统计处理,使其成为用数据形式和数据表现形式的研究材料,以数量化的方式说明研究结果,称为研究结果的定量描述。
研究结果的定量描述可以更有效和准确的反应问题。
例如,某学校三年级的期中数学测验后,知道其中一位学生的成绩为90分。
仅仅有这个分数,很难说明该同学的成绩在这个年级中是否属于优秀。
如果用统计处理,可以计算出全年级数学平均成绩为76分,标准差为7分。
这样就可知该学生高于平均分数2个标准差,或该学生的成绩高于全年级95%的学生。
可见,经过统计处理可以有效而准确的说明情况。
在教育科学研究中,研究结果定量描述的数学工具是教育统计。
教育统计主要用于研究内容的分类整理、编制数据的各种图表、定量分析和由样本推论总体等。
对研究数据使用统计方法,进行变量之间关系或规律性的分析、推论,形成量化描述,增加了解释教育科学问题的科学性和有效性。
统计分析还可以训练科学思维方法,使研究者逐步形成科学推理和抽象思维的方式和习惯。
近年来,定性研究方法(例如,深度访谈法、参与观察法等)也要求对收集来的数据资料进行相应的统计分析。
所以不懂统计方法,难以了解他人的研究进展,也难以确定自己的研究方向并进行深入的研究。
虽然统计方法是教育科学研究的重要工具、方法,但是不可以用工具、方法代替研究本身,那种以为“统计万能”的思想是片面的、不正确的。
作为教育科学研究的重要工具,高水平的有创意的研究如果没有适当的统计分析方法的辅助,就不能显示其高水平、创造性。
但是统计分析本身并不决定研究的科学价值。
“现代”的统计分析方法也不可能提高低劣水平的研究。
统计分析要与定性分析相结合,没有这样的结合不能很好的实现和有效的推动教育科学研究工作。
例如,统计分析是为了揭示数据的特征和规律性,这种定量分析的方向、范围必须要由定性分析来规定,而不是由研究者随意确定的。
统计分析的进行需要依据一定的方法和公式,这些方法和公式的选择需要研究者具备一定的教育科学的专业知识。
否则,统计分析只是在数据上绕圈子,进行数学游戏,而不具有任何教育科学研究的意义。
此外,统计分析得出的规律(或特征)也需要借助于教育科学理论才能正确地解释。
第一节研究结果的初步整理一、数据的分类研究数据是被研究事物的各种特征(或称变量)的数量事实(或称数量化形式)。
数据的分类指根据研究的目标、任务,运用统计方法,将收集的研究材料按照研究对象的不同特点,进行归类分组、整理筛选,并记为数据形式的过程。
1. 结果数据的类型、总体教育科学研究中,一些研究材料收集方法(如实验、观察、问卷调查等)获得的信息内容或测量结果是大量的,而且具有不同的层次、性质和一定的随机性。
这些大量的随机性的内容又称为变量,一般,将它们分为称名变量、顺序变量、等距变量和等比变量四种类型。
四种变量在性质上具有递进的关系,即适合前一种变量的统计方法也能用于后一种变量,反之则不然。
总体是具有某种特征的一类事物的全体,构成总体的每一个基本元素称为个体,在总体中按一定规则抽取一部分个体,称为总体中的一个样本。
总体有大有小,随所研究的对象而变,构成总体的个体不限于人或物,也可指心理活动、推理能力、学习方法、反应时间等等。
总体的性质与总体中的所有个体的性质、组合方式有关,了解总体的性质应该对总体的每一个个体都进行观测,但实际上,这是做不到的,只能从总体中抽取一部分个体做为样本,对样本进行分析,然后推知总体。
2. 数据整理数据审核指两个方面的内容:研究的总体和个体。
从研究总体看,应该检查达到研究目的所要求的各个方面的资料、数据是否收集齐备。
审核被试个体的资料、数据,检查每一个被试的资料、数据有无缺失或遗漏,有无前后矛盾之处,结果登记中是否存在错行、错号等问题。
质量审核的方法有两种:计量审核和逻辑审核。
计量审核即核查研究数据资料中各项计量资料。
数据是否有错误或矛盾的地方,其中包括计量关系是否正确、计量单位是否一致等。
例如,参加教育科学实验的被试人数应等于各年龄组被试的人数之和,也应等于男、女被试人数之和。
逻辑审核方法是指检查研究数据斗资料的内容是否合于逻辑,有无不合理的地方。
例如,有一调查问卷的题目只限女性被试回答,但一些男性被试也作答,这显然是不合理的。
按照上述两种方法对研究数据、资料进行质量审核,对于一些有明显错误的资料和数据,应深入调查,追究其原因,尽量加以纠正。
如果无法纠正,在不影响抽样效果,保证研究数据资料具备一定条件(一般规定为80份以上,某些研究要求样本的95%以上)的基础上,应对这些错误结果予以剔除。
通过对研究数据的分类整理过程,可以得到的一组或多组有序的数据,这些数据具有一定的分布特性。
教育科学研究中常见的数据分布有正态分布()、二项分布、t分布、F分布和χ2分布等等。
数据分布具有一些重要的特征,可以借助图示说明这些特征。
图8.1中显示了数据分布情况的数据的分布特征图形。
a b通过图a可以看到,分布A比分布B具有更好的集中趋势程度;分布A中的得分次数比较密集地聚集在一起,而分布B的得分次数则比较分散,说明数据分布具有不同的离散程度。
从图b中可以看到,分布B的得分次数分布基本是对称的,而分布A的得分次数分布确是偏斜的。
集中趋势、离散程度、对称性的分析研究是数据的重要特征,也是研究数据整理、分析的内容。
二、统计表统计表是用来表示统计指标与被说明的事物之间数量关系的表格。
编制统计表的原则是:结构简单,层次清楚,重点突出,一目了然,表的项目按照逻辑顺序合理排列,避免包罗万象。
统计表一般由表号、标题、标目、线条、数字、表注等项内容构成。
统计表一般分为简单表、分组表和复合表三种。
简单表:只列出研究对象(或变量)名称、地点、时序、或统计指标名称的统计表。
分组表:只按一个标志分组的统计表为分组表。
复合表:按两个或两个以上标志分组的统计表为复合表。
统计图是整理数据的一种方法,它把数量关系以直观形象的形式表达出来,显示事物的全貌及其分布特征,一目了然,便于理解,印象深刻,容易记忆。
统计图由标题、图号、图形、坐标、图注等项组成。
常用的统计图形有条形图、线形图和圆形图等。
次数分布的表和图是规范的统计表与统计图。
次数分布也称为频数分布,指的是一批数据中各个不同数值所出现的次数情况,或者各种随机事件在n次实验中出现的次数分布(或频数分布)情况。
编制次数分布表的主要步骤:求全距、决定组数、确定组距、确定组限和计算组中值、归类和登记。
次数分布表分为简单次数分布表和累积次数分布表。
累积次数分布表的编制步骤与简单次数分布表大致相同。
不同之处在于,登记次数时从数值最小的一组开始,每上升一组,必须把以下各组的次数(频数)累积起来,然后进行登记。
通常使用的次数分布图有两种:次数直方图和次数多边图。
累积次数分布图分直方图和曲线图两种,常用的是累积次数曲线图。
累积次数曲线图的形状不会由于组距的不同,而使图形发生较大的变化,因而抽样数据制成的累积次数曲线图比较稳定。
第二节集中趋势的描述集中量数也称平均的数,是代表一组数据典型水平或集中趋势的统计量。
常用的集中量数包括算术平均数、加权平均数、几何平均数、中位数、众数等,它们的作用都是度量次数分布的集中趋势。
集中量数的计算是教育科学研究中处理数据的重要方法。
算术平均数是所有数据的总和除以总次数(频数)的商,简称为算术平均数,或均数、均值。
加权算术平均数是具有不同比重的数据(或平均数)的算术平均数。
比重也称为权重,数据的权重反映了该变量在总体中的相对重要性,每种变量的权重的确定与一定的理论经验或变量在总体中的比重有关。
依据各个数据的重要性系数(即权重)进行相乘后再相加求和,就是加权和。
加权和与所有权重之和的比等于加权算术平均数。
中数也称为中位数,指位于数据顺序排列正中间位置的那个数。
众数有两种定义方法:理论众数、粗略众数。
理论众数是指与次数分布曲线最高点相对应的横坐标上的一点;粗略众数是指一组数据中次数出现最多的那个数。
几何平均数又叫对数平均数,可以将几何平均数看作算术平均值的一种特例或变形。
第三节数据分散程度的描述在次数分布中,数据间彼此差异的程度称作数据的离中趋势。
离中趋势反映次数分布的离散程度,代表次数分布的变异性。
度量、描述离中趋势的统计量称为差异量数,差异量越大,表示数据分布的范围越广,越分散,差异量越小,表示数据分布得越集中,变动范围越小。
常用的差异量数有平均差、方差、标准差等。
平均绝对差是次数分布中所有数据与平均数之差(或距离)的绝对值的平均数。
方差与标准差是经常用于描述次数分布离散程度的差异量数,它们是量度上的一段间距(或间距的平方),代表分布离散的程度。
第四节数据关系的描述—相关系数相关的概念指两种变量之间的关系或联系程度,它表达的是一种不精确、不稳定的变化关系。
相关关系分为三种情况:正相关、负相关、零相关。
本章介绍积差相关法、等级相关法、质量相关法,各种相关法都有各自的使用条件。
积差相关(又称积矩相关)是测量直线相关的基本方法。
等级相关包括斯皮尔曼等级相关及肯德尔和谐系数两种方法。
等级相关是根据两种顺序变量数据中,各对等级数据的差数来计算相关系数的方法。
肯德尔和谐系数法包括无相同等级的相关系数计算和有相同等级的相关系数计算两种情况。
当遇到顺序变量(等级变量)、相应的数据总体并不是正态分布、而且抽样的样本容量小于30时,采用等级相关法计算变量之间的相关性。
质量相关用于计算一种变量按内容的某一属性划分种类,而另一种变量则为等比(或等距)测量数据的情况下的相关性,本章仅介绍质量相关中的点双列相关。
点双列相关适用于两种变量中,一种为来自正态总体的等距或等比的测量数据;另一种为二分称名变量,即按内容的某一性质分为二类相互独立的变量。
第七章自测题一、填空1. ( ) 是指研究者为了解答所研究的问题,说明对实验中各种变量如何控制的一种简要的计划、结构、方法和策略等。
2. 对同一个刺激,被试个体所进行的或能形成的反应种类是无限的。
如何把无限的被试个体的反应控制在主试所意想的方向上,这就是所说的()问题。
3. 种类自变量的有:课题方面的自变量、()、被试变量和暂时的被试变量。
4. 实验研究中的变量包括自变量、因变量、干涉变量、控制变量、()。
5. ( ) 又称调节变量,是自变量的特殊类型,是研究自变量与因变量之间关系而选择的次要自变量。
6. 不同的环境也可以作为自变量。
学校、地区、班级等环境因素都可作为变量,即()变量。
7. 自变量的不同水平称为()或()。
8. ()是将两组被试除自变量外其他条件尽量保持相等。
9. 在实验设计阶段可以采用的一些控制无关变量的方法,这种对无关变量的控制称为()。
10. 将被试分为两组,一组施以实验处理称作实验组,另一组不给实验处理,称作控制组,最后测定对某种刺激的反应,然后比较两组反应上的差异,这称为( ),11. 相关设计又称()。