当前位置:
文档之家› COCA语料库操作 演示.ppt
COCA语料库操作 演示.ppt
来自图1.1 COCA界面简介
1. 显示方式 2. 关键词输入栏 5. 结果栏
3. 子语料库 6. KWIC 栏 4. 最小匹配
2. 主要搜索功能
• 2.1 搜索words、phrases、lemmas、 wildcards和其他更加复杂的字词 • 2.1.1 输入单词“mysterious” (图2.1.1-1): • 得到相关结果(图2.1.1-2):在各子库中的频 率,每百万词使用的频率 • 若对图2中的相应条块进行点击,那么就可 以看到KWIC,如图2.1.1-3 (以点Fiction的 条块为例):
规则:在WORDS的方格里输入[=beautiful],表示和beautiful语义 相近的所有形容词。
• 再如:搜索动词clean的所有近义词,如下图:
图2.4.3-2
• 当然可以进一步搜索与clean语义相近的动词+the+ 名词的词组,[[=clean]].[v*] the [n*] 如下图:
图2.4.3-3
思考:
• 1)如何查询多义词特定的词性的KWIC,如for 作连词或介词等? • 2)如何查询某个词前/或者后面特定词性的若干 搭配词, 如confidence 前的形容词? • 3)词性附码应放置在什么位置?
杨百翰大学COCA语料库使用说明
1. 杨百翰大学COCA语料库简介
Corpus of Contemporary American English (1990-2012)能在线免费提供 400+ million 词,在线网 址为:/coca/ 但需要用电子邮箱注册才能使用,对不同使用者有 不同层次的要求,对最低层的使用者,每天可检索100 次,共10000个KWIC 行。 通过这个网址: 还可以搜索 到以下语料库:
规则:在WORDS里输入: smile.[n*],表示作为名词smile; 在COLLOCTES里输入: [j*]表示其前后出现形容词的语境。
Confidence前使用的常用形容词 图2.2-3
• 2.3 搜索在子语料库(register)内(或之间)出 现的频率(或比较)(不同语域中的用法) • 如在Fiction和Spoken子数据库中 passionate后面可以跟任何名词的词及频率, 分别如两图(2.3-1和2.3-2)
图2.1.4-1
规则:若要得到某个单词的所有单复数和时态形式,那么 就要在输入时,在这个单词外加 [ ]。
图2.1.4-2
形容词early的原形,比较级和最高级三种形式一次性检索出来检索
• 2.1.5 输入某种词性且部分带有某些字母的命令, 如要得到以 un- 开头、 -ed 结尾的所有形容词的所 有 形 式 ( 见 图 2.1.5-1 ) 和 得 到 动 词 + 任 何 词 +ground的所有词组(见图2.1.5-2): • 规则:若要得到某种词性且词中带有部分带有某 些字母的形式时,如要得到以 un- 开头、 -ed 结尾 的所有形容词的所有形式,那么输入: un*ed.[aj*]; 若要得到动词+任何词+ground的所有词组,那么输 入: [vv*]*[ground]即可。前者用来研究词汇,后者 用来查询特定词性的搭配。
图2.4.2
规则:在WORDS的方格里分别输入woman和man,再在 COLLOCATES方框里输入[j*],选在左3,表示前面3个跨 距内所有的形容词。当然也可以比较在某个子语料库中出 现的频率比较。
• 2.4.3 搜索近义词 • 如:搜索beautiful的所有近义词(如图2.4.3-1)
图2.1.5-1
图2.1.5-2
动词+任何词+ground的所有词组
• 2.2 搜索搭配词和出现的频率 • 如 “thick后跟的名词” (图2.2-1)
图2.2-1
规则:在COLLOCATES里输入[n*] 后选择4,表示 在thick后面(4跨距范围内)出现的任何名词
• 如跟在 “smile前面的形容词” (图2.2-2)
图2.1.2-2
White+名词的短语
• 2.1.3 输入通配符 (wildcards),如分别输入 un*ly和r?n*,结果如图2.1.3-1和.2.1.3-2
图2.1.3-1
图2.1.3-2
• 2.1.4 输入lemma(即一个单词的单复数、 时态等所有形式),若要得到sing这个单词 的所有形式,可以如下图所示(图 2.1.4-1 )
图2.4.1
规则:首先选择 COMPARE 显示。然后在WORDS的方格里分 别输入hot和warm,再在COLLOCATES方框里输入[n*],表示 后面所跟任何名词。当然也可以比较在某个子语料库中出 现的频率比较。
• 2.4.2 比较反义词 • 如:woman和man前面所跟的形容词的区 别(如图2.4.2)
图2.1.1-1
图2.1.1-2
使用chart 显示
图2.1.1-3
• 2.1.2 输入词组“white+名词” (图2.1.2-1) • 得到的结果都是white后面跟的名词短语 (图2.1.2-2),检索表达式为:white [n*]
图2.1.2-1
注意:选LIST
规则:输入名词 的话用正则表达式: [n*];动词: [v*]; 形容 词: [aj*]; 副词: [av*] ….. 既可以直接输入, 也可以从POS LIST 栏选择 对于“[n*]”,可 选择 “noun. All+”
图2.3-1
图2.3-2
图2.3-2
• 但是也可以之间对两者子语料库中它们出 现频率的对比,操作:分别选择section 1&2,如下图(图2.3-3):
图2.3-3
• 2.4 进行语义倾向比较 • 2.4.1 比较近义词 • 如:近义形容词hot和warm后面所跟名词的 区别(如图2.4.1):