语料库语言学
我们认为较为准确全面定义:
语料库(corpus 或corpora [复数]) :是指按 照一定的语言学原则, 运用随机抽样方,收 集自然出现的连续语言运用文本或话语片 段而建成的具有一定容量的大型电子文本 库。
语料库语言学:在文本语料的基础上进行 语言研究的一门学科。
语料库语言学的研究对象
语料库语言学是以语料库中收集储存的真实语言材 料做为唯一的研究对象,以语言现象出现的概率为 依据。因此,语料库语言学为语言学研究提供了一 种全新的研究思路。一个合格的语料库必须以电子 计算机为载体来存放语言材料,这些存放在电子计 算机中的语言材料是在语言的实际使用中真实出现 过的。因此,它们可以如实地反映语言现象,克服 语言学家观察语言现象时的主观性。
(7)语料库语言学与语用学和语篇分析。语料库 常常是把话语从上下文或语篇中分离出来,因此
其所收语料在很大程度上脱离了上下文或社会背
景,而语用学和语篇分析对于场景和上下文又具
有一定的依赖性。故以语料库为基础的语用或语
篇研究相对较少,但语料库为这些领域所作的贡
献是不可否认的。语用学及相关领域的研究通常 是以会话为基础的,如伦敦—伦特语料库 (London - Lund Corpus) 和柯林斯出版公司与伯 明翰大学联合开发的“英语库”( The Bank of Eng2lish ,简称BOE) ,前者收集的是日常会话, 后者的口语部分包括日常会话会议、讨论、采访、 电台广播等。
3、语料库语言学与辞典编纂
语料库不仅能够提供更完备和详尽的关于词义和 词汇搭配的信息,而且利用语料库中的频率统计 可以直观的反映词汇用法的使用情况。如英国考 林斯出版社和伯明翰大学编辑出版的《国际通用 词典》在很大程度上打破了词典编撰的传统,从 词条的选定及解释、用法到释义的先后顺序等都 依据了由2亿词次的COBUILD语料库中统计出的 频率。由于语料库的素材来自实际使用的语言, 利用其素材作为词典的例句更具真实性和准确性。 利用语料库编撰词典不仅能反映语言的真实变化, 而且编撰周期也会大大缩短。
(5)语料库语言学与语义研究。语料库可 用来对为语义提供客观标准,并适当考虑 到语义的不确定性。如民特(Mindt ,1991) 指出,词项和语言结构的意义常常是根据 语言学家本人的直觉来描写的,而事实上 语义区别是同句法、词法和韵律街上下文 的语篇相关,通过语料库来调查这些相关 成分,可以找到特定语义区别的客观指示。
第一、语料库容量大,可以储存大量的文 本,这样为实现不同目的、要求以及规模 的语言测试提供可能。
第二、语料库的设立是建立在语料库语言 学理论基础上,符合语言测试要有理论 依据的要求。
第三、语料库真实性与可靠性等特点以及 某些测试如GRE 所体现的可行性,又正好 迎合了语言测试评估中的要求。
第四、语料库能或多或少地补充和纠正所 储存的语料内容,这样又为语言测试的设 计,试题提供和评估等提供了基础。
此外, 语料库语言学还为话语及会话分析、 言语变体(口笔语,语言与性别,方言)、 语音科学、儿童语言习得研究等方面提供 了非常丰富的实例, 充分体现了语料库语言 学在语言研究方面的作用。
2、语料库语言学与语言测试
从语料库语言学和语言测试的内涵以及两 者的关系出发,探析基于计算机的语料库 应用于语言测试的必要性、可能性、可行 性和局限性等问题。
(8)语料库语言学与文体学。文体学研究 的主要对象是作家的写作风格以及比较一 个作家在某一特定历史时期的作品与其同 时代其他人的作品。语料库为文体学研究 提供了量化的实际语料,避免了主观因素。
(9)语料库语言学与心理语言学。语料库 是心理语言学家进行测试研究的有力工具。 尤其在语言病理分析方面能帮助研究人员 准确确定问题到底发生在语言发展的哪一 阶段。
(3)语料库语言学与句法、词法及自动语法分析。 利用语料库进行语法分析是语料库语言学的早期目 的之一。如今,人们对语料库内的语料进行更高层 次的研究,对入库的语篇进一步的处理,如进行词 性附码和句法分析(词性附码:对库内语篇中所有 的单词根据其语法作用加注词性编码。句法分析: 对经过自动词性附码的语料库根据某种特定的语法 描述进行语法分析),使语料的自动语法分析成为 可能。从而也大大方便了词的语义及功能研究、近 义词的比较研究、搭配及其结构的研究、语体的研 究、英语口语音型和语调研究、英语名词短语的成 语性研究和英语句法发展的研究。自动语法分析还 被应用于语法检查、词义排歧、自然语言接口、对 名词短语辩识的改进、机器翻译等。
语料库语言学的应用
1、语料库语言学与语言研究 (1)语料库与语言学理论。语料库的建立使语
言的理论研究的手段和方法发生了巨大的变 化, 它不但修正了语言的一般性规则, 而且对 语言的理论探索也产生了深远的影响。
(2)语料库语言学与语言史研究。大多数语 料库的语料都有特定的年代跨度,根据不同
的研究目的,从一年至百年不等。如为了研 究英语史而建立的Helsinki Corpus of English Tests 的历史部分, 年代跨长从公元 850年至1720年,这一语料库无疑为研究语 言的历史和发展提供了丰富、可靠的素材。
(4)语料库语言学与口语研究。语料库在 口语研究中的作用有两个方面:
第一,它能提供空前广泛的口语素材,使对 口语的概括和对特定语言内方言变异的研 究成为可能。
第二,其提供的是自然真实的而非人工条 件下产生的话语。这就保证了语料库所提 供的语言现象是真实存在的,并能准确反 映实际生活中真正使用的语言的特点。
(6)语料库语言学与社会语言学。社会语 言学作为一个经验研究领域,主要依赖于 具体的语料数据。如何提高数据的自然性 和代表性,减少其诱导因素等一系列问题, 都可通过对语料库的运用一步步找到解决 途径。如介尔默(Kjellmer ,1986 )曾经调 查了man/ men ,woman/ women 及其它相 应的代词,结果表明男性代词出现的频率 要比女性代词出现的频率高。
语料库语言学 介绍
语料库和语料库语言学的定义
国外对语料库语言学的定义: 1、根据篇章材料对语言的研究称为语料库语言学。
(K. A ijm er &B. itenberg, 1991) 2、基于现实生活中语言运用的实例进行的语言研究
称为语料库语言学。(T. M cEnery &A. W ilson, 1996) 3、以语料为语言描写的起点或以语料为验证有关语 言的假说的方法称为语料库语言学。(D. Crystal, 1991)