解。
钱先生的评价,就“排印、打电报、打字”来说,基本合理;只是对汉字的总体评价显得“以偏盖全”,“攻其一点而不计其余”和“矫枉过正”。
但20世纪最后二三十年汉字处理电脑化成功实现后,他们论断的失当就显得非常明显。
在汉字成功适应信息新技术的今天,仍然把这些论断视为至理名言,完全无视活生生事实,就真让人匪夷所思了。
参考文献[1]周有光《汉字的技术性和艺术性》,刊于《科学地评价汉语汉字》(尹斌庸,苏培成选编,华语教学出版社,1994)12—16页[2]高等院校文字改革委员会筹备组《语文现代化》71页,1980[3]钱玄同《汉字革命》,《国语月刊》(汉字改革号),1923[4]王开扬《汉字现代化研究》,齐鲁书社,2004[5]苏培成《语言文字应用探索》,商务印书馆,2004[6]潘钧《汉字研究文集》,云南大学出版社,2007[7]马克思、恩格斯《马克思恩格斯全集》第7卷382页,人民出版社,1979[8]马克思、恩格斯《马克思恩格斯全集》第30卷318页,人民出版社,1974[9]许寿椿《文字处理技术的历史发展》见《文字编辑与电脑打字》(许寿椿编著,中央民族学院出版社,1989年)第一章[10]许寿椿《文字信息处理技术的三个历史时代和汉英文字比较》见《文字比较研究散论》(许寿椿编著,中央民族学院出版社,1993年,50—66页)—文字信息处理技术的历史通观》,《中国计算机报》1992年,No.2,37,41版[11]许寿椿《电脑打字的历史文化意义——[12]许寿椿《文字处理技术与汉字文化兴衰》,《现代与传统》第九辑74—79页,1995[13]林立勋《电脑风云五十年》,电子工业出版社,1998[14]王蒙《新世纪讲稿》,上海文艺出版社,2005(作者为中央民族大学教授)建立在语料库基础上的汉语本体研究与对外汉语教学—以现代汉语离合词研究为例——王海峰王铁利1.语料库与本体研究和语言教学1.1语料库的作用上世纪60年代初,世界上第一个机读语料库在美国布朗大学建成,此后大量的语料库陆续建成。
我国的语料库建设开始于上世纪80年代,近些年来取得了长足的发展。
随着语料库的不断建设,人们的语言学理念也因之不断更新。
Halliday(2004)指出,语料库最主要的优点是语料的真实性,真实的自然的语料之所以重要,是因为理想中的语言与实际运用中的语言是不完全相同的,本族语者的直觉并不总是准确的。
利用语料库进行语言研究的经验启示我们,通过对语料库进行大规模的语料调查,我们会发现一些习焉不察的语言规律。
在语言教学上,语料库产生了巨大的影响,语言现象的分布和频率等信息可以用来指导教师确定哪些是教学重点和难点。
—以离合词为例1.2语料库在汉语研究和教学中的必要性——现代汉语离合词是当前汉语教学和研究的重点和难点。
多年来人们对离合词的性质、用法、语法规律等各方面进行了许多有益的探索,但许多问题我们仍然没有得出一致的结论。
我们认为主要原因之一是,人们在讨论离合词问题时忽视了语言的客观实际,多凭语感去主观设想,因而一些问题众说纷纭,莫衷一是。
“说到离合词,一般的语法书都指出可以在离合词中插入‘了、着、过’可以插入补语和定语。
如果直接把这些规律搬到对外汉语教学中就显得线条太粗、太笼统。
”(饶勤1997)由此看来,解决现代汉语离合词的教学与研究的难题首先要从摸清离合词的“底细”做起,而这个工作仅凭语感是不够的,必须借助于大型的语料库进行定量研究。
2.利用语料库考察离合词的基本理念及步骤2.1基本理念本研究主要借鉴语料库驱动的研究方法(corpus-driven approach)。
这种方法主张语言学家要关注语料库本身,语言描述必须全面关照语料库提供的证据。
理论陈述应完全和语料证据相符,即理论直接从语料证据中归纳出来并反映这些证据,语料必须保持原貌,不经任何加工。
出现频率较高的型式及其分布是语法范畴的最基本证据。
语言表达的可能性与典型性应区分开,有些表达尽管在理论上有可能,但在实际使用中很少出现或几乎不出现;而另外一些表达上不但理论上可能,而且在实际使用中出现的频率很高,这是典型的表达。
语料库驱动的研究方法关注的是后者。
(参见Hunston&Francis2000,Tognini-Bonelli2001,王勇2008)2.2选定语料库本文考察统计主要使用北京大学汉语语言学研究中心语料库(简称CCL语料库)网络版现代汉语部分,约1.15亿字。
2.3确定考察范围及理由对《汉语水平词汇与汉字等级大纲》(国家汉办1992,以下简称《大纲》)中的离合词进行考察,摸清离合词家族的底细,进行深入研究。
理由是:离合词问题不仅是理论问题,更是实践问题。
我们的思路是在理论探讨的基础上,以满足对外汉语教学的实际需要为目标。
3.离合词及其离析形式考察统计结果及分析3.1离合词的鉴定及其离析情况考察统计分析3.1.1离合词的甄别鉴定《大纲》中有392个可离析双音结构,经过分析甄别,392个双音结构中,有45个双音结构没有出现离析现象(44个述宾结构,1个述补结构),我们认为,这些结构不具备离合词的典型特征,我们姑且不将其作为重点考察对象;29个述补结构也不宜看作离合词①。
还有111个双音结构,如:干活、办事、送礼、降价等,经过分析鉴定,它们意义上基本是A和B的简单相加,因此接近或属于词组。
这样我们认定的离合词就只有207个(见文后附录)。
3.1.2离合词的离析情况统计3.1.2.1离析频率分析为了更加准确地反映离合词的离析情况,我们要分析统计每个离合词的离析频率。
离析频率公式如下(参照任海波等2005):离析例数——离合词的离析频率(F)=—————————有效例句总量离析例数就是我们从语料中得到的含有离合词离析形式的例句数。
所谓有效例句总量,是指出现该离合词的有效例句量和出现该离合词离析形式的例句量之和。
3.1.2.2离合词离析频率分布特点离合词家族各成员离析频率不一样,有些离析频率高,有些离析频率低甚至基本不产生离析现象。
请看表1:我们看207个产生离析现象的离合词,这些离合词的平均离析频率仅有0.059,离析频率超过0.5的只有4个。
207个离合词中71%的离合词离析频率低于0.1,86.5%的离合词其离析频率低于0.2。
由此可见,在实际语言中绝大部分离合词(占98.1%)“合”大于“离”。
3.1.2.3重点离合词和核心离合词考察发现,只有60个离合词离析频率超过0.1,我们称之为重点离合词。
请看:叹气、搞鬼、沾光、听话、把关、放假、当面、干杯、吃亏、出名、鞠躬、泄气、吃苦、请假、洗澡、接班、帮忙、争气、吃惊、见面、问好、打针、劳驾、上当、睡觉、拐弯、操心、念书、随便、照相、排队、告状、敬礼、出神、吵架、拜年、狠心、遭殃、开课、打架、鼓掌、交手、下台、吵嘴、留神、翻身、插嘴、化妆、丢人、走道、结婚、跳舞、做主、站岗、随意、生气、理发、挂钩、倒霉、伤心。
我们确定离析频率超过0.1,且离析例数在200句以上的16个离合词为核心离合词,应该说这16个核心离合词的典型性更强。
这16个核心离合词是:叹气、听话、把关、当面、吃亏、出名、鞠躬、吃苦、洗澡、帮忙、吃惊、见面、上当、睡觉、结婚、生气。
用典型范畴理论来说,范畴里最大量出现的实例总是例示(instantiate)了该范畴的原型(prototype)。
应该说,那些高离析频率和高使用频率的离合词代表了离合词的特点,可以作为我们教学科研的重要依据;而那些低频离合词的代表性较差,不具备典型性。
3.1.3离合词离析形式考察我们通过CCL语料库对圈定的207个《大纲》中的离合词离析形式进行了穷尽的考察,得到含离合词离析形式的离析形式句14,968句。
通过对207个离合词的离析形式进行细致的归纳整理,我们发现离合词在实际语料中的离析形式可以大致归纳为13种。
3.1.4离合词离析形式出现种类情况考察我们发现,虽然207个离合词出现的离析形式有13种,但是,这些离合词离析形式出现的种类分布并不一致。
统计发现,离合词离析形式的出现种类与以全部这些形式离析的离合词的数量和所占比例成反比:越是离析形式种类少的离合词,其数量和所占比例就越大;反之亦然。
请看下图:我们发现,大多数离合词出现的离析形式种类在四种以下,占到68.1%,出现五种以上(含五种)离析形式的离合词,只占31.9%;出现七种以上(含七种)离析形式的离合词,只占15%;出现九种以上(含九种)离析形式的离合词,只占6.8%;而出现十一种以上(含十一种)离析形式的离合词,则不到1%。
由此,我们结合上文3.1.2统计结果认为,无论从离合词离析频率分布特点来看,还是从离析形式分布特点来看,都可以得出以下结论:所谓离合词,实际上“合”是“常态”(regular),“离”是“异态”(idiosyncratic)。
3.2离合词的语体分布特征我们对16个核心离合词在不同语体中的分布进行统计。
我们发现,离合词在小说戏剧等接近口语的语体中大量出现。
请看下图:上图显示,离合词在自然口语、戏剧、小说等口语体中出现量高;在语体介于口语和书面语的散文中出现量居中;《人民日报》新闻语体一般比较正式,书面语化程度较高,出现量较低;学术著作尤其是法律文本是最书面语化最正式的语体,离合词出现量最低。
这就告诉我们,离合词倾向于出现在口语或接近口语的文体中,语体越正式越书面语化出现量越低。
3.3离合词的离析形式偏爱的句式我们通过对北京自然口语、小说、戏剧、散文、新闻、学术著作和法律文本的离合词离析形式出现的句式情况调查统计发现,离合词的离析形式常出现于逻辑关系句(条件句、假设句、因果句、目的句等)、心理-认知动词句、虚拟推测句、情态句、评议句、描述句、恒常句、感叹句、祈使句、疑问句以及否定句等非事件句中。
这些语句有一个共同特点,就是不倾向于客观叙述一个事件,而是常常表达对客观现实的主观评判,我们将其统称为主观句。
下面是离合词离析形式主观句在不同语体中出现情况表:可以看出,离合词在各种语体中离合词离析形式主观句出现的平均频率高达0.77;有意思的是总字数一百多万字的学术著作和法律文本离析句出现得极少,一共只有3句,但都出现于主观评议句或意愿句中。
4.语料库基础上的本体研究在对外汉语教学中的应用对外汉语教学要解决的问题,无非是怎么教和教什么的问题。
语料库考察结果,可以帮助我们很好地解决离合词教学问题。
4.1教什么4.1.1离析方式我们借助大型语料库得出每个离合词的离析方式及其使用频率数据,这些离析方式及各自使用频率的高低反映其在语言使用中的真实情况,是我们教授离合词的重要依据。
我们可以将在语料中得出的离析方式按出现频率分清主次教授给学生,并解释清楚其用法。