当前位置:文档之家› 语料库语言学

语料库语言学


• 1)2010 首届广外应用语言学论坛。由广东外语 外贸大学外国语言学及应用语言学研究中心于 2010 年9 月24-25日成功举办了备受瞩目的首届 广外应用语言学论坛。语料库语言学首次以独立 议题的形式提出。会议包括:1.语料库的资源共 享;2.双语语料库建设,我国单语语料库很多, 还没有高质量的英汉双语语料库;3.语料库促进 外语教学发展。外语学习者语料库等在外语教学 中的应用,推动外语教学的发展;4.语料库语言 学的现状和未来。桂诗春肯定了语料学对外语教 学的积极作用,并大力提倡资源共享,互助互利。
• 自 2010 年10 月29 日,首次中国外语教育研 究中心“语料库语言学沙龙”(Corpus Research Group)在北京外国语大学成功举 行之后,分别举行了2010 年秋季,2011 年春 季,2011 年秋季2012 年四期有关语料库语言 学研究的名家及学者的交流活动。沙龙由语言 学界的相关大家,许家金、文秋芳、冯志伟、 王克非,熊文新等参与讲座,对语料库语言学 的研究发展具有启发式的引导。 • 1.语料库建设。文秋芳的“学习者语料库的创 建与研究”。在介绍国内研究现状的同时,还 重点分析了语料库语言学研究方法的优势和局 限。
2.发展
• 语料语言学受行为主义的影响下,从60年代开始 发展,迄今已经有近五十年的历史。 • 语料库在发展的初期,只进行词的一般分析,如 词频统计等,后来增加了词的语法属性标注(如, 词性等),直到现在,人们越来越开始重视对语 料库作不同层次的标注,如:语音、构词、句法、 语义以及语用等层次的标注。 • 语料语言学在其发展的初期并没有引起太大的共 鸣,但是现代语料语言学已经得到越来越多人的 承认,其应用也越来越广泛,从语言分析、语言 教学、词典编撰到人工智能等领域都开始应用语 料库。
• 现代语料库语言学的一个里程碑是亨利· 库切拉和 W.纳尔逊弗朗西斯在1967年出版的《当代美语的 计算分析》(Computational Analysis of Present-Day American English)一书。该项工 作基于对布朗语料库的分析,布朗语料库是一个精 心编制的美国英语语料库,规模约有一百万词次。 库切拉和弗朗西斯将这些语料用于各种计算分析, 获得了丰富​和多样化的成果,该成果结合了语言学、 语言教学、心理学、统计学、和社会学元素。另一 关键出版物是1960年伦道夫· 夸克的《当代英语语 法》(Towards a description of English Usage),在这本书中他介绍了“英语用法调查” 项目(The Survey of English Usage)。
7.发展前景
• 我国目前已建成大量的英语语料库,在规模、设 计和研究目的等方面各具特色,已经被证明是对 英语语言进行广泛研究的最佳信息源,极大地促 进了对英语词汇、句法和语篇等的研究和描述, 同时也推动了对英语不同变体的比较研究和英语 定量的探索研究。英语语料库所蕴含的巨大的研 究潜力使得以语料库为基础的研究快速发展壮大 起来,英语语料库及语料库语言学研究有着广阔 的发展前景。英语语料库及语料库语言学将在英 语教学与研究方面发挥更大的作用。但是我国在 语料库的发展和应用上还处于起步阶段,需要更 多的探索。
• 布朗语料库也催生了类似的语料库:LOB语料库 (Lancaster-Oslo-Bergen Corpus,20世纪60 年代英国英语),科尔哈帕(Kolhapur,印度英 语),惠灵顿(Wellington,新西兰英语),澳 大利亚英语语料库(Australian Corpus of English,澳大利亚英语),皱眉语料库(Frown Corpus,20世纪90年代初,美国英语),以及 FLOB语料库(FLOB Corpus,20世纪90年代, 英国英语)。其他语料库包括国际英语语料库 (International Corpus of English),和英国 国家语料库(British National Corpus,收集了1 亿词次的口头和书面语料,在20世纪90年代时由 出版商、牛津大学、兰卡斯特大学和大英图书馆 创建)。至于说到当代的美国英语,现已有了美 国国家语料(American National Corpus),以 及可以在线访问的4亿多词次的美国当代英语语料 库(Corpus of Contemporary American English,1990年创建)。
5.近几年的发展成果
• 许家金和梁茂成(2011)认为语料库的建设之初, 主要是为了进行文本储存,而研究者要基于语料 库进行研究,则需要建设子语料库从不同的研究 目的出发,从而促进对比研究。他们旨在成为由 中国学者开发建成的BROWN(布朗)语料库的子语 料库,于2011 开发建设的CBROWN(科朗)语 料库和CLOB 语料库两个语料库。 • 张素敏(2011)基于自建语料库研究学习者因素 对教师话语的影响作用进行分析,研究表明教师 的母语使用与学习者的语言概念认知和态度情感 因素有关,且适当的母语使用有利于教学目标的 顺利实现。
• 2.新的研究工具和软件的介绍。开源统计软件R 的命令行操作方式以及下载模块的方法。语料库 文本元信息添加(作文作者性别、年龄、年级、 成绩等)方法的介绍。这些新方法和新工具的介 绍,也预示着语料库发展的新方向。 • 3.语料库在语言学上的研究成果。主要是有关语 料库与词汇、语法及话语分析的研究。链语法与 语料库语言学的研究,有关语料库在语言学方面 的应用,是一场变革和飞跃。
3.方法
• 语料库语言学已经有了一大批研究方法,这些研 究方法都试图找到从数据到理论的解决方案。瓦 利斯和尼尔森最先介绍了他们的3A观点:注释 (Annotation),抽象(Abstraction)和分析 (Analysis)。 • 注释 包括语料的数据库方案。注释可能包括结构 标注,词性标注,句法分析和其他形式。 • 抽象 包括该方案在理论上的启发式模型或数据集 中的翻译(映射)。抽象通常包括面向语言学家 的定向搜索,但也可能包括句法研究者的句法规 则学习。 • 分析 包括统计学探测,操纵和对数据集的归纳概 括。分析可能包括统计学评估,规则库优化和知 识探索方法。
约翰•辛克莱
• 约翰· 辛克莱是第一代现代语料库语言学家和 COBUILD项目的创始人。该项目的目标是为了学 习英语的外国学生,建立语料库驱动的词典。他 成为了柯林斯COBUILD英语词典(第一版出版于 1987年)的首席顾问。 • 他开创了对语料库语言学,话语分析,词典编纂 和语言教学的研究。
• 语料库语言学是一个独立的学科,它有自己独到 的理论体系和操作方法。由于语料库语言学立足 于大量真实的语言数据,对语料库所做的系统而 穷尽的观察和概括所得到的结论对语言理论建设 具有无可比拟的创新意义。而在另外一些研究者 看来,语料库语言学并非语言学的又一个分支学 科,而是一种研究方法,这种方法基于大量的真 实语言,可以用来回答通过其他途径很难回答的 问题,从而极大地丰富已有的研究方法。语料库 语言学以大量精心采集而来的真实文本 (authentic texts)为研究素材,主要通过概率 统计的方法得出结论,因此语料库语言学从本质 上讲是实证性的(empirical)。
4.在我国的发展与应用
• 语料语言学经历过这几十年的发展,不论在理论 上,还是在技术上,都已趋于成熟。在语言教学 领域中的应用也开始引起注意。我国对语料语言 学研究取得了一定的成果,早在1982年,上海交 通大学的黄人杰、杨惠中教授就主持建立了一百 万词次的专门用途英语语料库(JDEST)。2003 年,桂诗春和杨惠中两位教授主持完成了中国英 语学习者语料库(Chinese Learner English Corpus,简称CLEC),这是国际上第一部公开发 布的学习者语料库,它对研究中国学生的语言应 用和使用失误等特征,以及它们与外语学习之间 的关系等都具有十分重要的指导作用。
应用语言学的最新成果
语料库语言学(Corpu言学(Corpus linguistics)是基于语 言运用的实例(即语料库)的语言研究。语料库 语言学可以对自然语言进行语法与句法分析,还 可以研究它与其他语言的关系。语料库最初由手 工完成,而现在主要是由计算机自动完成。 • 语料库语言学家相信,可靠的语言分析需建立在 新鲜的语料、自然的语言环境,和最小的实验干 扰之上。在语料库语言学中,语料标注的意义众 说纷纭,从约翰•辛克莱主张最少量的标注,并允 许文本“为自己说话”,到“英语用法调查组” (设在伦敦大学学院)鼓励更多的标注,并认为 它是通向更完备和严谨的语言理解的道路。
• 刘日升,杨振力(2012)通过分析语料库共享平 台建设现状及其建设必要性,提出由图书馆起主 导作用的语料库资源共享平台建设的设想。这些 研究对语料库实现共享有重要意义。 • 桂诗春(2010)也积极推进语料库语言资源的共 享,语料库只有共享才能变成财富,“藏诸名山, 束之高阁”只能是一堆数据垃圾,必将自毁前程。 • 冯志伟(2010)支持语料库的共享,表明语料库 只有普及才能发展
• 2)2011 年语料库语言学大会。2011 年中国语料 库语言学大会是中国语料库语言学研究会成立后 的首届全国性语料库语言学的学术研讨会。大会 以“语料库语言学的多维视角”为主题,旨在加 强国内语料库语言学研究者的学术交流与合作, 探讨学术发展动态与关键技术,促进语料库语言 学学科建设和发展。1.“多维视角下的短语语料库 建设和研究”。2.“语料库加工处理技术研究”中 以汉语为处理语言的语料库加工技术,弥补了本 土语料库的不足。3.“语料库与语言描写”指出语 言描写不是语料库语言学研究的终点而是整个研 究的出发点,最终揭示语言系统隐含的规律和趋 势。4.“中介语语料库建设和研究”有助于发现和 分析英语学习者二语习得过程中经常遇到的问题, 这类语料库的建设和研究对二语习得及外语教学 研究具有重要意义。5.“平行语料库及翻译研究” 平行语料库的建设可以用于多译本的对比研究。
6.从国内学术组织和学术会议 看语料库语言学发展的最新动态
• 国内学术界出现了几只具有代表性的团队,其蓬 勃的生命力不断推动了国内语料库语言学的发展。 北京外国语大学中国外语教育研究中心以梁茂成、 许家金、文秋芳等为代表的研究团队。以李文中 为中心主任的河南师范大学语料库与外语教学研 究中心。以何安平为带头人的华南师范大学外文 学院语料库语言学研究室,以解放军外国语学院 团队,上海外国语大学研究团队,上海交通大学 外国语学院语言文字工程研究所,广东外语外贸 大学外国语言学及应用语言学研究中心等组织。 各组织的影响力体现在大型会议的召开,学术组 织的成立。语料库语言学研究会(Corpus Linguistic Society of China,CLSC)的成立, 成为中国语料库语言学发展的里程碑
相关主题