当前位置:文档之家› 语料库语言学与教学

语料库语言学与教学

8
3.运用语料库进行外语研究:方法和实例 3.1 分析词语的方法
3.1.1 不同语域词频差异的调查 3.1.2 根据搭配调查语义差异 3.1.3 根据搭配调查语义韵差异
3.2 学习者中介语的调查 3.2.1 学习者与本族语者之间的对比 3.2.2 不同母语背景学习者之间的对比 3.2.3 不同层次学习者之间的对比
语料库建库原则
表1.“英语用法调查”语料库 (I)原始书写语料(100篇) (A)印刷品(46) (B)非印刷品(36) 人文科学 6 ┌ 想象性 连续书写品┤ 自然科学 7 └ 资讯性 教学 6 ┌ 一般新闻 4 ┌亲密 报刊┤ 社交书信┤平等 └ 专门报导 4 └疏远 文书 4 ┌平等 非社交书信1┤ 法律 3 └疏远 论说文 5 日记 散文小说 7 (C)口语(18) ┌资讯性 剧本 4 谈话┤ └想象性 正式演说(经转写) 3 故事 广播新闻 3 5 6 6 4 4 4 4 4 4 2 2
4
语料库建库原则
语料库的主要用途之一是发现语言的主要的和典 型的用法。 一般用途语料库的语料随机地取自各种来源,在 语域方面尽量避免偏向,例如Brown语料库在语域 上分为15个类别(新闻报导、社论、新闻评论、 宗教、技能和爱好、学术和科技、各类小说和幽 默等等)。 语料采集方式最根本的目的在于尽可能保证所采 集的语料具有代表性,保证所收录的语料最大程 度地涵盖具体语言在诸如语体、语域、地域变体、 作品年代、作者性别、题材类型等多方面的比例 合理性,进而保证建成后的语料库能囊括具体言 语行为的普遍规律性。 5
9
3.1 分析词语的方法
3.1.1 不同语域词频差异的调查 Rundell就曾利用BNC的口语部分调 查发现: began在书面语中出现的次数几乎 是 started的两倍,而在口语中出现的频率 要比started低得多。
10
不同语域词频差异的调查
certain, sure, definite在社会科学和小说中的 频率分布图
语料库在外语教学研究中的 应用及方法
潘璠
计算机辅助语言教学研究所 华 中 科 技 大 学 外 国 语 学 院 2008年4月
1
Outline: 1.语料库和建库原则 2.语料库检索方式 3.运用语料库进行外语研究:方法和 实例 4.语料库资源介绍
2
1.语料库和建库原则
语料(corpus),又称为素材,是自然 发生的语言材料(包括书面语和口语) 的集合。 可以用来作为描述一种语言的出发点 或用于证实有关一种语言的假设的手 段(Crystal,1991)。 语料语言学(corpus linguistics)是 以语篇(text)语料为基础对语言进行 研究的一门学科,是计算语言学的一 个分支。
较为典型的检索工具是1996年牛津大学出版社推 出的Mike Scott所编制的Wordsmith软件包。这套 软件不仅提供了词语检索(Concordancing)并共现 上下文的常用功能,还可统计计算出索引单位搭 配行为的T(或Z)值、信息相关值(即MI: mutual information)和x平方值,并予以列表显 示。它还能快速识别某种文体中经常出现的多词 集合,且提供在整个语料库中对英语教师和英语 学习者具有价值的语言特征。就连传统的关键词 (keyword)功能在Wordsmith软件包中也已赋予 新用途,如可列选出在特定文本或文体类型中出 现频率特别高的词,以帮助研究者得出某种语域 或文体的显著词汇特征。
3
语料库
对语料的处理由较为简单的机器可读形式发展到 人工或自动词性附码(tagging)和句法分析 (parsing)的注释(annotated)形式。 利用语料对语言进行研究的成果已被用于辞典编 纂和语言教学等实际工作中,例如1980年由 Sinclair主持的Cobuild计划。这是Collins出版 公司与Birmingham大学的合作计划。他们搜集了 大量的现代英语口语和书面语素材,逐一分析每 个单词的词汇、语法、语义、语体和语用特点。 根据这些资料,陆续出版了一系列COBUILD词典和 语法等工具书。这些书中的例句取自真实的语言 素材,词典中词的释义排列顺序由语料库中得出 的统计结果来决定,更加客观地反映了英语的使 用情况。此外,词的释义方法更利于英语学习和 教学。因此,受到语言学界和语言教师及学生的 欢迎。
12
3.1.2 根据搭配调查语义差异: take a job 和take on a job
1)to pay off, she cannot now 2) iver. He is now leaving to 3) a kitchen assistant before 4)x years. Three years ago I 5)eir boy to be a lawyer. He take take taking took took a job paying less than pounds 12,000 a year. a job in Brussels as a European commissioner. a job as a pizza delivery driver 18 months a a part-time job and have received my tax allow. a job with the Ministry of the Interior but sp
400 350 300 250 200 150 100 50 0 社会科学
certain definite sure 小说
11
certain, sure, definite不同语域频率分布差异 在社会科学类文本中,用的最多是certain(1 百万词中359次),其次是definite(114次), sure最不常见(74次);而在小说类型的文本 中, sure 比 certain 要常见得多( 353 次对 179 次),而definite就极为少见(仅11词次)。 这说明在表达比较严谨的文本中,更倾向于使 用 certain 和 definite ,而在表达相对自由的 小说中,较为口语化的sure用得更多。不同语 域同义词的取舍有一定的指导意义,形成一定 的优先原则。如在社会科学类的文本中,可优 先考虑 certain ,其次为 definite ;而在小说 中,则sure将是首选,其次才为certain。
6
语料库建库原则
(Ⅱ)原始口说材料(100)篇 有准备的演说(未转写) ┌演说 自发言语┤ ┌体育 └评论┤ └其他 6 10 4 4 ┌ ┌亲密 │不公开┤ │ └疏远 │ ┌亲密 交谈┤可公开┤ │ └疏远 │ ┌亲密 │电话┤ └ └疏远 24 10 20 6 10 6
7பைடு நூலகம்
2.语料库检索方式
相关主题