当前位置:文档之家› 语料库与英语教学

语料库与英语教学

LOGO
语料库与英语教学
赵鸿雁 hongyan_z@ 上海交通大学外国语学院
1
contents
I II
语料库简介
语料库研究成果与外语教学
学习者语料库数据的利用 语料库使用演示
III
IV
2
I. 语料库简介
语料库语言学是一种全新的研究思路。它以真 实的语言数据为研究对象,从宏观的角度对大 数量的语言事实进行分析,从中寻找语言使用 的规律。
7
语料库的种类
1.通用语料库:British National Corpus(1亿) 2.专业语料库:JDEST(100万),古汉语语料库 (3000万) 3.监控语料库:Corpus of Contemporary American English(3.6亿) 4.口语语料库: Corpus of Spoken American English(25万) 5.学习者语料库: International Corpus of Learner English(每个子库20万) 6.平行语料库:联合国文件数据库( 80万份六种语 言平行文档)
much routine in policy. These are t twenty years know that these are ce between the two phrases -- are ermore, if two parties (usually, but personal is broader than, and does r facilities are advertised, they may overs all accommodation and does ldren's facilities, for example, does remember that past performance is
5
语言学研究三种方法的比较
特 点 内省法 诱导法 语料库
1.是否简单易行(速度、费用)
2.是否受到被试态度的影响 3.是否提供概率信息 4.是否客观 5.能否收集大规模数据 6.非母语者能否使用 7.能否涉及不同文体与语域

√ × × × × ×
×
√ × √ /× √ /× √ ×
×
× √ √ √ √ √
3
语料库的特征
1. 语料库的设计和建设具有明确而具体的目标 e.g. LOB vs. BROWN 2. 语料库必须具有代表性,是语言运用的自然语料
3. 语料以电子文本形式储存并通过语料库索引软件检 索和处理 4. 基于语料库的研究以概率统计为基本手段,以数据 驱动为基本理念
4
语言学研究的三种方法
1. 内省法: -语言学家依靠自己的语感判断语言现象 -个人的直觉不可靠 2. 诱导法: -通过实地调查收集人们对于语言现象的看法和对语 言材料的心理反应 -费时费力;被试的主观判断不可靠 3. 语料库方法: -收集有代表性的大量真实语言材料,是语言运用的样本 -研究语料库中的语言材料即近似于研究语言本身 -研究结果9
1. 频数、概率信息的应用
语言系统的频数信息和概率信息是教学设计的科学参照依据。 e.g. COBUILD语料库研究显示: 1)频数最高的700个英语词覆盖文本约70%的内容; 2)频数最高的1500个英语词覆盖文本约76%的内容; 3)频数最高的2500个英语词覆盖文本约80%的内容。 英语学习者的学习重点应当是: 1)语言中最常用的词形; 2)这些词形的核心用法型式; 3)由这些词形构成的典型词语组合。
8.能否进行历时研究
9.是否真实的、实际的语言运用
×
×
×
×


6
语料库的应用
1. 语言频率统计 e.g.常用词教学词表(英语中的词汇频率统计) 2. 词典编纂 e.g.词条的选择,义项的确定,词义的阐释,例句的选用 3. 词语搭配研究 e.g.为词语搭配研究提供客观的量化分析的依据 4. 语言教学 e.g.数据驱动学习 5. 自然语言处理 e.g.语音识别,错误识别
mean that all local party chiefs
forces for continuity but they m the major problems. Philip Naga so. They may exist in favour of , husband and wife) make „mutu involve, the family. Legal withd be available in all resorts in the distinguish between local classif mean it is unsuitable for all fami a guide to the future. Anyone w
10
2.可能性、典型性与教学内容
翔实的典型形式实例是选择、安排和组织教学内容的有效依据。 e.g. “necessarily” 《新英汉词典》《英汉大词典》:adv. “必定,必然”
JDEST: 使用频数 not + ~
264次 136次
11
“necessarily” 索引行示例
as in the case of Georgia. This did
not necessarily
not necessarily not necessarily not necessarily not necessarily not necessarily not necessarily not necessarily not necessarily not necessarily
12
Oxford Advanced Learner‟s Dictionary 8th (2010):
13
3.扩展意义单位
语言组织机制的两种理论模型:
1)开放选择原则视文本为一连串的空位,由符合语法限制 的词汇来填充。 e.g. I want some apples. Bring me a beer. vs. Colorless green ideas sleep furiously.
相关主题