世界汉语教学2002年第4期(总第62期)词汇量测试研究初探钱旭菁提要词汇量的多少是决定第二语言学习成功与否的一个重要因素。
本文在介绍了国外有关研究成果的基础上,提出了设计词汇量测试的方法和原则。
根据这些方法和原则,我们分别运用释义法和翻译法设计了两个3000常用词等级上的词汇量测试,并对学习汉语的日本学生进行了测试。
用这两种方法测得的结果之间存在一定的差异。
造成测试结果差异的主要原因是完成这两种测试所涉及的认知任务不尽相同。
本文最后讨论了词汇量测试在汉语教学、词汇习得研究中的作用。
关键词词汇量测试词汇学习0引言词汇学习是语言学习的重要组成部分。
学习者获得词汇知识的过程、策略和方法都是词汇习得研究者的兴趣所在。
不同的学者对什么是词汇知识有不同的看法。
不过对以下两个范畴学者们的意见则比较一致:(1)词汇广度知识)词汇深度知识。
广度知识是指学习者词汇量的大小(Wesche&Paribakht,1996;Hazenberg&Hulstijn,1996)。
深度知识(depth of knowledge)包括词的语音形式、文字形式、概念义、联想义、语法特点、搭配、语用等(Henricks-en,1999;Read,1993;Wesche&Paribakht,1996)。
(2)词语接收)生成性知识(receptive-produc-tive knowledge)(Henricksen,1999;Melka,1997)。
一般第二语言学习者都有这样的体会:自己能理解的词远比会用的词多。
能理解的词构成接收性词汇;能理解并能自由运用的词则是生成性词汇,这二者都是学习者头脑中内在的知识。
要研究学习者是如何学习这些词语知识的,首先面临的问题就是怎样才能了解这些深藏在学习者头脑中的词语知识,为此我们需要依赖于测量词语知识的手段,例如要研究学习者学习词汇广度知识的情况,就需要有相应的词汇量测试作为研究的工具。
1词汇量测试的设计词汇量测试的目的是要考察学习者掌握了多少目的语的词语。
设计词汇量测试时首先应该考虑以下几个问题:(1)什么是词?(2)怎么选词?(3)用什么测试形式?1.1确定词的范围与选词设计词汇量测试首先要确定词的范围,哪些是词?哪些不是词?5现代汉语词典6、5汉语水平词汇与汉字等级大纲6(以下简称5等级大纲6)可以作为确定词的参考标准。
¹确定了词的范围以后,并不意味着所有的词都适用于词汇量测试。
还要考虑实词和虚词的问题。
钱旭菁:词汇量测试研究初探汉语虚词是表达语法关系的重要手段,很多虚词都没有实在的词汇意义,因此汉语学习者对虚词的掌握情况更多地反映了他们的语法知识,而不是词语知识。
基于这一点,词汇量测试的内容应该主要选择实词。
另外怎样处理固定词组、成语、熟语、专名、方言词、兼类词也是需要考虑的问题。
选词的方法有两种。
第一种是词典法:选一部词典,如5现代汉语词典6,根据所需词语的数量,从词典中随机选词,比如选取每10页的第一个词语。
学习者词汇量测试的正确率乘以该词典的总词数就是他的词汇量。
第二种是频率表法:根据某一词频表,从不同的频率等级中选取相同数量的词语组成测试内容。
频率表法有一个假定的前提:无论第一语言(以下记作L1)还是第二语言(以下记作L2),人们一般总是先掌握高频词,后掌握低频词。
Hazenberg&Hulstijn(1996)的研究发现词语的频率对非母语者的词语知识有显著性影响(P <0.001),非母语者不同频率等级上的词语知识存在显著性差异(P<0.05)。
因此学习者对各个词频等级上词语的掌握情况可以反映出他对整个目的语词汇的掌握情况(Wesche&Pa-ribakht,1996)。
如果词汇量测试针对的是L2学习者,那么测试内容应该从学习者可能掌握的词中选取(Schmitt,2000:165)。
1996年版的5现代汉语词典6收字、词6万余条,对学习汉语的留学生来说,根本不可能掌握这么多词语。
我们在设计词汇量测试时,可以采用以词频统计为主要依据的5等级大纲6(详见2.1)。
1.2测试形式常见的词汇测试形式有词表法、多项选择、翻译法和释义法等。
词表法(Checklist tests)。
将选出的目标词列成词表后,让学习者判断是否知道这些词。
如果知道某个词就在该词后打/K0。
早在1890年人们就已开始使用这种形式测量母语者的词汇量。
这种形式最大的优点是可以测试大量词语;但它的问题是学习者很可能高估自己的水平。
为了弥补这一缺陷,测试的设计者要在词表中加进一些符合目的语构词法的假词。
如果学习者选择了这些假词,那么就说明他对自己的水平估计过高(Read,2000)。
影响较大的Eurocentres Vocabulary Size Test采用的就是这一形式,不过,该形式的效度一开始就受到怀疑。
Sims的研究发现用该方法测试儿童词语知识的结果和其他一些词语测试的结果不相关,他认为这种方法测试的是儿童对目标词的熟悉程度,而不是他们对这些词理解的程度(转引自Read,2000)。
词表法在效度上存在的问题主要是没有办法证实学习者的回答是否可靠。
另外,学习者心目中/知道0的概念可能和研究者并不相同,这样测试的结果和研究者预期的结果可能会有出入。
多项选择。
从若干选项中选出和目标词意思相同或相近的选项。
选项可以是目标词的同义词或近义词,如例(1);也可以是对目标词的解释,如例(2)。
(1)中国人怎么称不认识的人?A.看B.想C.叫(2)商店里东西的位置变了A.多少钱B.怎么放C.在哪儿这种方法评分和分析比较容易,但编写选项比较费时,而且需要多次预测和调整。
此外,这种测试形式测的可能只是学习者对干扰项的知识,而不是目标词的意思(Wesche&Paribakht,1996;Read,2000)。
翻译法。
让学习者写出目标词的母语对应词。
Nation(1990)认为/让学习者给出母语世界汉语教学2002年第4期(总第62期)的对应词是辨认测试的最好形式。
这一形式容易设计,而且任务也和学习者平时阅读或听的过程相似。
其缺点是评分比较复杂,且评分者需要熟悉学习者的母语。
0(Nation,1990)释义法。
这是Nation(1990)设计的Vocabulary Levels Test所采用的形式。
它从不同频率等级中选出若干名词、动词和形容词,然后要求学习者选出目标词正确的意思。
如下例(横线上的数字是要求学生填写的答案):1)表情2)公式3)饭馆4)穷人5)秘书6)座儿5)在办公室帮助别人工作的人1)脸上的样子2)S=P R2该测试对阅读的要求最低,做起来也比较快,因此能测试较多的词语。
虽然每组只有3个词需要找出相应的意思,但实际上测试的是6个词。
对被试在测试过程中的行为观察表明:学习者在较难的项目上会逐一比较6个词和3个定义(Read,2000)。
Read(2000)还考察了这一测试是否具有等级性,即学习者掌握的高频词是否比低频词多。
考察结果显示这一测试的等级系数是0.90,而等级系数在0.60以上就可以认为它具有等级层次,由此可见,该测试的等级性很高。
以下我们介绍的两个汉语词汇量测试采用的分别是翻译法和释义法。
两种测试中的词语都是在没有语境的情况下单独展示。
一般认为,词汇项目最好在句子或更大的语境中出现,因为实际交际时,人们是在有语境的情况下而不是孤立地理解单个的词语。
然而在词汇测试中,如果词汇项目在语境中出现的话,势必会增加阅读的要求。
这样,一方面词汇能力的测试会受到阅读理解能力的干扰,测试的效度就会受到影响;另一方面由于增加了阅读任务,能测试的词语数量也会相应地减少。
因此词汇测试必须在语境和测试数量这二者之间作出选择,很多词汇测试专家都选择了后者(Read,1993)。
另外有研究(Stalnaker&Kurath, 1935)表明词汇测试中有无语境区别不大,因此我们设计的词汇量测试都没有给出语境。
(转引自Schmitt&McCarthy,1997)23000常用词等级上的两个词汇量测试实例2.1确定词的范围和选词汉语常用词大致为3000左右,5等级大纲6的甲乙两级词(3051个)基本上就是常用词的范围。
因此我们的词汇量测试以5等级大纲6中的甲乙级词为范围º,选取了其中的名词、动词和形容词。
动宾和动补等结构、成语、习用语等未标注词性的未选。
兼类词语按照标注的第一个词性归类,比如甲级词中的/演出0标注的是/(动、名)0,就把它归入动词。
甲乙级词中名词、动词和形容词的数量如下(见表一):表一甲乙两级词中名词、动词、形容词的数量名词动词形容词合计甲级372250116738乙级8006212771698合计11728713932436确定选词范围以后需要决定的是选多少词。
测试词语的多少对测试结果的影响很大。
钱旭菁:词汇量测试研究初探表二在90%水平上不同词语数量的测试所对应的置信区间»(Nation,1993)词语数量1001502003004006001200最大置信区间?8%?7%?6%?5%?4%?3%?2%如果某一测试的总词数是100,某个学生的成绩是80,那么可以有90%的把握说,这个学生的成绩是在72~88(即置信区间是?8%)之间。
词语数量越多,测试成绩越准确。
但由于受到考试时间的制约,测试词语的数量不可能太多。
因此我们的词汇量测试选择了300个词语,测试结果的置信区间是?5%。
这样既能保证较高的准确度,又能使测试在相对短的时间内完成¼。
要从上述2436个词中选取300个,我们先给名词、动词、形容词分别编号,然后每7个抽取1个。
名词、动词、形容词在300个词中所占比例和它们在3000词中的比例大致相同。
甲乙级词在300词的比例也与它们在3000词中的比例一致。
各类词的分布见表三:表三300词的词汇量测试中甲乙级词与名词、动词、形容词的数量名词动词形容词合计甲级46311491乙级987734209合计144108483002.2测试形式我们采用的测试形式分别是释义法和翻译法。
释义法要求学习者找出目标词的正确意思;翻译法则要求给出目标词的母语对应词。
我们设计的翻译法测试和释义法测试,二者所测词语相同。
释义法词汇量测试首先需要编写目标词的意思。
大部分目标词是多义词,我们在设计测试时,给出的解释针对的都是目标词最常用的义项。
由于5等级大纲6未分义项,哪个义项最常用只能根据笔者自己的经验。
有的词义项较多,很难判断哪个义项最常用,这样的词只好放弃。
如/点0的动词义项有11个,我们很难判断其中哪个义项更常用。
释义所用的词语,其频率应该比目标词高。
我们基本上都使用了甲级词。