2015教育硕士开题培训讲座外语研究中的数据统计与分析——方法及应用刘国兵河南师范大学外国语学院提纲⏹数据的种类⏹何为研究假设⏹常用统计检验⏹应用举例⏹SPSS操作数据种类⏹外语教学研究中涉及到的数据类型很多,不同数据类型需要不同的统计处理方法。
因此,在进行数据处理之前,弄清数据所属类型是开展科学研究的前提与基础。
⏹常见数据分为四类:1. 定类数据2. 定序数据3. 定距数据4. 定比数据定类数据(Nominal Data)⏹定类数据是由定类尺度计量形成的,表现为类别,不能区分顺序。
⏹定类尺度,也可称为列名尺度,在四种计量尺度(定类尺度、定序尺度、定距尺度、定比尺度)中属于计量层次最低、最粗略的一种。
它只能对事物进行平行的分类和分组,其数据表现为“类别”,但各类之间无法进行比较。
⏹例如,民族有汉族、回族、哈尼族等,可以按所属民族对人口进行分组,但每组之间的关系是平等的或并列的,没有等级之分。
但从另一层面上说,就因为定类尺度各组间的关系是平等或并列的关系,所以各组或各类之间是可以改变顺序的。
定序数据(Ordinal Data)⏹定序数据是由定序尺度计量形成的,表现为类别,可以进行排序。
属于品质数据。
⏹定序尺度,也可以称为顺序尺度。
与定类尺度相比,它较为精确,而且是高于定类测量的测量层次。
定序数据不但可以分类,还可以排序,比较大小与高低。
⏹例如,利用定序尺度,教师可以将学生的外语水平分为初级、中级与高级三类,他们依次从前到后一级比一级水平高。
另外,人们的受教育程度,可以分为文盲、小学、初中、高中、大学、研究生等类型。
除此之外,英语语言水平等级测试,如四级、六级、八级等都属于定序测量尺度。
⏹定序数据虽有高低或大小之分,可以排序,但不能进行数学运算。
因为定序测量不能说明任意相邻两个变量之间的具体差异。
换句话说,在定序测量中,任意相邻两个变量之间的差距不是相等的。
⏹例如,我们可以说,高中毕业生比初中毕业生所获得的知识量大,但我们不知道前者比后者具体的知识量大多少。
而且,初中毕业生与小学毕业生之间的差距未必等于高中毕业生与初中毕业生之间的差距。
⏹有人把学生的语言水平分为1、2、3、4、5级等,这样的测量也属于定序测量。
定距数据(Interval Data)⏹定距数据是由定距尺度计量形成的,表现为数值,可以进行加、减运算以精确计算数据。
⏹定距尺度,也可以称为间隔尺度,相较定类尺度和定序尺度而言,它对事物能够进行准确测量。
定距尺度不仅能比较各类事物的优劣,还能计算出事物之间差异的大小,所以其数据表现为“数值”。
⏹定距尺度可以较方便地转换为定序尺度。
⏹但需要注意的是,通常定序数据不能转换为定距数据,如五级制分制不能转换为百分制。
定比数据(Ratio Data)⏹定比数据是由定比尺度计量形成的,表现为数值,可以进行加、减、乘、除运算。
没有负数。
⏹定比尺度,也可以称为比例尺度,它与定距尺度属于同一层次。
但它与定距尺度的区别在于是否有绝对零点。
在定距尺度中,“0”表示某一个数值,而定比尺度中,“0”表示“没有”或“无”。
⏹定比测量是最高级别的测量,因为它具有前面三类测量所具有的特征,如分类性、排序性、等距性等。
除此之外,定比测量具有绝对零值。
例如,一个人的外语水平可能是零,一个人的月收入可能是零,一个人的年龄与身高理论上也可以为零,但绝不可以是负数。
⏹对于同一事物或想象来说,测量层次很多时候是相对的,可以因测量方法不同而不同。
如,对于学生外语水平的测量,如果用“高、中、低”为标准来收集数据,我们会得到定序数据;如果用具体分数来表示其水平,我们得到的是定距数据。
区分不同数据类型:Why?⏹现实有不同的形态,因此反应现实的数据就有不同的类型。
此外,测量的种类不但与收集、整理、分析资料的方法有关,而且与特定的统计方法有关。
⏹只有弄清楚数据的测量层次,明白数据所属类型,才能根据不同类型选择不同的统计方法。
⏹例如,对定类数据进行分析时,通常使用卡方检验,而不能使用以正态分布为基础的Z检验或T检验;对定距数据进行差异分析时,通常使用T检验或F检验。
请指出下列各项的测量类型:1.每天学习英语的时间2.英语学习的认知方式3.学生证编号4.每周学习的英语单词量5.英语学习动机6.一次英语竞赛的名次假设检验的基本原理⏹研究中经常涉及到的问题1.教学中采用了一种新的教学方法,新的教学方法与旧的教学方法相比哪个更好?2.为了研究新教材的实用性,在实验班使用新教材,对照班使用旧教材。
期末对比学生成绩,哪个班好,哪个班差?3. 学生的语文成绩与英语成绩是否有一定的相关关系?……⏹解决办法:假设检验要解决以上问题,就要对以上假设进行统计检验。
检验的目的就是比较二者之间是否存在显著性差异。
统计学上把这种差异检验称之为显著性检验(significance testing),把这个检验、推论的过程称作假设检验(hypothesis testing)。
显著性检验(significance test)⏹显著性检验就是利用分布的特性,结合研究假设和样本数据的统计值,对研究假设的可接受性进行验证。
⏹这里的“显著”一词对应英语的“significant”或“significance”一词,它在统计学中的意义是probably caused by something other than mere chance,即某件事情或事件的发生很可能不是由偶然因素造成的。
⏹例如用英语说there is a statistically significant correlationbetween vitamin deficiency and some diseases,从统计意义上讲,维生素缺乏和部分疾病之间的这种相关关系存在,且不受由偶然因素造成的。
研究假设的分类⏹零假设(null hypothesis)There is no difference between the values of a parameter in thepopulations from which the samples were drawn, hence we use the term null.⏹备择假设(alternative hypothesis)There is a difference between the values of a parameter in thepopulations from which the samples were drawn.⏹The strategy of hypothesis testing is to try to accumulate enoughevidence to reject the null hypothesis, rather than to try to support any of the possible alternative hypotheses directly. This is alsocalled “the method of disproof”.外语研究中常见的假设举例⏹零假设1.第一语言水平与第二语言水平之间没有相关关系;2.第二语言作文的长度与作文质量没有相关关系;3.第二语言学习者的动机与第二语言水平之间没有相关关系;4.女性与男性之间在第二语言学习效率上没有差异;5.本族语者和外语学习者在英语语篇特征的运用上没有差异;6.第二语言水平高和水平低的学习者之间,在认知策略使用上不存在差异。
⏹备择假设1. 第一语言水平与第二语言水平之间存在相关关系;2.第二语言作文的长度与作文质量之间存在相关关系;……显著性水平(significant level)⏹显著性检验的目的是为了确定接受零假设还是拒绝零假设。
为了实现这个目的,首先要确定一个标准,即在什么情况下接受零假设,什么情况下拒绝零假设。
⏹统计学设定的标准是以概率为基础的。
如果有95%以上,甚至99%以上的概率或把握,可以证明零假设成立,那么我们接受零假设。
95%和99%称之为置信水平。
⏹如果只有5%以下,甚至1%以下的概率证明零假设成立,我们就拒绝接受零假设。
因此,拒绝或接受零假设需要一个临界概率,我们称这个临界概率为显著性水平。
人们通常把显著性水平定为0.05或0.01,即P 值(sig.值)。
应用举例(1)⏹选题如某研究生以“情感教学法在初中英语课堂教学中的应用”为题,欲对该教学方法在初中英语课堂教学中的应用效果进行研究。
⏹研究方法:所教两个自然班为研究对象,其中一个班为实验班,利用情感教学法进行教学;另一个班为对照班,利用传统教学法进行教学。
研究开始,对两个班进行前测,发现英语成绩无显著性差异;实验进行一年后进行后测,发现实验班英语成绩明显优于对照班,两个自然班的英语成绩存在显著性差异。
⏹结论:拒绝“两个自然班的英语成绩不存在差异”这一零假设,接受备择假设,即“两个自然班的英语成绩存在显著性差异”。
情感教学法适用于初中英语课堂教学。
应用举例(2)⏹某省属重点高中从新一届学生中抽出若干学生组成考查样本,检查高一新生整体水平是否高于往届。
根据往年的录取分数,已知往届学生总体成绩服从正态分布,标准差为10分,且进校的平均分数为500分。
新一届学生的平均成绩为504分,且总体成绩服从正态分布。
请以0.01的显著水平检验新生的成绩是否高于往届学生。
⏹零假设:新生的进校成绩与往届学生没有差异⏹检验方法:根据已知条件,建立一个均值为500分,标准差为10分的标准正态分布,检验504分是否落在概率为99%的区域内。
如果落在99%的区域内,接受零假设。
如果落在99%的区域外,即1%的区域内,我们可以拒绝零假设而接受备择假设“新生的进校成绩高于往届”。
⏹结论:经统计检验,504分虽然高于往届新生成绩,但该分数落在99%的区域内,因此接受零假设。
即本届新生与往届学生相比没有差异,平均分差异由偶然因素(如个别尖子生或特差生)造成。
检验方法⏹常用的检验方法有Z检验、T检验、F检验、x2检验等。
⏹根据研究问题不同,可以采用单尾(单侧)检验和双尾(双侧)检验的方法。
单尾检验分为左尾(左侧)检验与右尾(右侧)检验。
⏹判断技巧:如果研究问题是某个样本的均值是否小于给定的总体均值,选用左尾检验;如果研究问题是某个样本的均值是否大于给定的总体均值,则选用右尾检验;如果研究问题是某个样本均值是否属于某个特定的总体,选用双尾检验的方法。
⏹单双尾检验的差别还在于显著水平相同时,临界值的不同。
例如,显著水平为0.01时,单尾检验的Z值是2.33,双尾检验的Z值是2.58;显著水平为0.05时,单尾检验的Z值是1.65,双尾检验的Z值是1.96。
T检验(T-Test)⏹应用范围用于检验两个样本的均值之间是否存在显著性差异,被用来估计两个样本的均值是来自同一个总体还是来自不同的总体。