当前位置:
文档之家› 美国当代英语语料库COCA使用介绍
美国当代英语语料库COCA使用介绍
美国当代英语语料库COCA使用介 绍
图2.1.1-2
使用CHART显示
美国当代英语语料库COCA使用介 绍
图2.1.1-3
例句显示区使用的是KWIC显示
美国当代英语语料库COCA使用介 绍
KWIC显示方式
美国当代英语语料库COCA使用介 绍
KWIC显示方式
• 蓝色——名词 • 紫色——动词 • 绿色——形容词 • 棕色——副词 • 灰色——代词 • 黄色——介词
美国当代英语语料库COCA使用介 绍
COCA语料库简介
COCA简介
– COCA美国当代英语语料库涵盖美国这一时期 的口语(spoken)、小说(fiction)、流行杂志(pop magzine)、报纸(newspaper)和学术期刊 (academic)五大类型的语料库,并且在这五个类 型方面基本呈均匀平衡分布。
➢主要包括三大功能区:
➢ Ⅰ 显示及查询条件界定区,包括:显示方式区, 字串查询区,语料库分类区,查询结果排列方式 区。
➢ Ⅱ 查询结果数据显示区 ➢ Ⅲ 例句显示区
美国当代英语语料库COCA使用介 绍
COCA界面简介
美国当代英语语料库COCA使用介 绍
COCA界面简介
• 显示方式区:
• 1.LIST——列表显示 • 2.CHART——图表显示,可以显示在各语料库类型中的使
美国当代英语语料库(COCA)使用说明
美国当代英语语料库COCA使用介 绍
美国当代英语语料库COCA使用介 绍
一、COCA语料库简介
• COCA简介
– COCA:美国当代英语语料库(Corpus of Contemporary American English)是由美国杨 伯翰大学(Brigham Young University)的 Mark Davies 教授开发的美国最新当代英语语 料库,是当今世界上最大的英语平衡语料库。
美国当代英语语料库COCA使用介 绍
POS LIST
det.GEN 类指限定词 det.POS 物主限定词 num.CARD 基数词 num.ORD 序数词 conj.CRD 并列连词 conj.SUB 从属连词 Interj. 叹词 PUNC 标点
美国当代英语语料库COCA使用介 绍
POS LIST
pron.INDF 不定代词 pron.PERS 人称代词 pron.WH 疑问代词 pron.REFL 反身代词 adj.CMP 形容词比较级 (comparative) adj.SPRL 形容词最高级 (superlative) adv.particle 副词小品词 adv.WH 疑问副词
美国当代英语语料库COCA使用介 绍
POS LIST
verb base=动词原形 verb.INF=动词不定式 verb MODAL=情态动词 verb 3SG=动词第三人称单数 verb ED=过去式 verb EN=过去分词 verb ING=现在分词 verb.LEX=lexical verb实意动词 verb.[BE]=系动词 verb.[DO]=do verb.[HAVE]=have
美国当代英语语料库COCA使用介 绍
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
美国当代英语语料库COCA使用介 绍
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
美国当代英语语料库COCA使用介 绍
二、COCA主要搜索功能
• 2.1 搜索words、phrases、lemmas(单 词的所有形式)、wildcards(通配符)和 其他更加复杂的字词。
– 网址:
美国当代英语语料库COCA使用介 绍
选择学习COCA的原因
• 1. COCA免费且在线方便。 • 2. 规模大(4.5亿,1990-2012)、速度快
(一般几秒)、词性标注易于理解。 • 3.时效性强——每年至少更新两次,并且每
年新增2000万词汇。
美国当代英语语料库COCA使用介 绍
COCA界面简介
用频率和各时间段内的使用情况。 • 3.KWIC——Key word in context,上下文关键词显示 • PARE——单词比较显示,比较两个不同词或短语
的搭配情况。
美国当代英语语料库COCA使用介 绍
COCA界面简介
美国当代英语语料库COCA使用介 绍
COCA界面简介
• 字串查询区:
美国当代英语语料库COCA使用介 绍
COCA主要搜索功能
• 例2. 输入词组 “white+名词” (图2.1.2-1),得到 的结果都是white 后面跟的名词短语 (图2.1.2-2),检索 表达式为:white [n*]。
美国当代英语语料库COCA使用介
绍
图2.1.2-1
图2.1.2-2
White+名词的短语
• 例1. 输入单词“mysterious” (图2.1.1-1):得 到相关结果(图2.1.1-2):在各子库中的频率,每 百万词使用的频率。
• 若对图2中的相应条块进行点击,那么就可以看到 KWIC,如图2.1.1-3 (以点Fiction的条块为例):
美国当代英语语料库COCA使用介 绍
图2.1.1-1
• Ⅰ、WORDS:输入字符串。 • Ⅱ、COLLOCATES:上下文限定。 • Ⅲ、POS LIST:词性列表
美国当代英语语料库COCA使用介 绍
COCA界面简介
美国当代英语语料库COCA使用介 绍
COCA界面简介
• 语料库分类区(五大类型语料库共包括42个 子语料库)。
• 功能:此区可以对查询的字符串限定语料类型 (Genre)和时段(Year) ,并且可以明确到查询某一 个子语料库,时段也可以查询任何一年的某个字词 的使用情况。
规则:输入名词的话用正表达式: [nn*];动词: [v*]; 形容词: [j*]; 副词: [r*];代词:[p*];连词:[c*]……
美国当代英语语料库COCA使用介 绍
POS LIST 词性列表
美国当代英语语料库COCA使用介 绍
POS LIST
noun.ALL=名词 noun.SG=单数名词 noun.PL=复数名词 noun.CMN=普通名词 noun.+PROP=专有名词 noun.-PROP=非专有名词