当前位置:文档之家› 语料库语言学基本概念

语料库语言学基本概念

A collection of sampled texts, written or spoken, in machine-readable form which may be annotated with various forms of linguistic information. (McEnery et al. 2006cited data, 2nd person “What would you say?”
Observation: naturalistic data, 3rd person “What do they actually say?”
语料库研究的方法种种
You shall know a word by the company it keeps. Can we use shall here?
软件
语料库应用

外语教学
外语研究
语料库建设相关的几个概念
取样(sampling) 代表性(representativeness) 标注(annotation)
语料库分析相关的几个概念
频率(frequency) 索引工具(concordancer) 形符(token)与类符(type) 主题词(keywords) 搭配(collocation)及搭配强度 类联接(colligation) 语义韵(semantic prosody)
方法一:依靠内省数据 方法二:依靠诱发方法 方法三:依靠真实数据
语料库及其基本类型
Corpus
A collection of pieces of language that are selected and ordered according to explicit linguistic criteria in order to be used as a sample of the language. (Sinclair 1996)
语料库及其基本类型
按照语言类型来划分 按照语料样本所代表整体的不同来划分 按照语料库中语言种类的多少来划分 按照语言产出者身份的不同来划分 按照语料库中语言所产生的年代来划分 按照语言传播媒介来划分 ……
语料库应用基本流程
建库论证
采样标准
转写或文本采集
文本清洁
标注集确定
标注
语 入库

软件设计与开发
语料库语言学基本概念
梁茂成 中国外语教育研究中心
主要内容
语言研究的方法种种 语料库及其基本类型 语料库应用基本流程 语料库建设相关的几个重要概念 语料库分析相关的几个重要概念
语料库研究的方法种种
Intuition: introspective data, 1st person “What do I think I say?”
相关主题