语料库的功能
(The functions of language corpora)
语料库的核心功能是反映语言使用的实际情况,也就是说人们究竟是如何使用语言的。
具体而言,语料库的第一个重要功能是统计词汇频率和词汇意义使用频率。
大家都知道,语言学习者不可能也不必要学习某种语言的全部词汇。
那么如何决定学习哪些词汇、不学习哪些词汇呢?另外,有些单词有几种甚至几十种意义,那么学习者应该学习哪些意义、忽略哪些意义呢? 很显然,学习者应该学习那些使用频率较高的词汇和词汇意义。
般地,大型语料库能够对基本词汇及其意义进行准确、可靠的频率统计,这对语言教学和教材编写有重要的意义。
另外,频率统计还有利于解决语言使用中一些有争议或模糊不清的问题。
比如:英语中的begin、start和commence都有“开始”的意思,但这3个词到底有什么区别?很多词典尽力解释这3个词的意义区别和用法区别,但大多数英语学习者还是不清楚这3个词到底有什么区别。
其实,根据COBUILD的语料库The Bank of English的统计,这3个同使用的语境和用法没有根本的区别,但它们的使用频率却不同。
其中start的使用频率大约是commence的125倍。
另外,begin和start在意义和用法方面几乎没有什么区别,但start的使用频率比begin高10%左右。