当前位置:文档之家› 基于规则的机器翻译系统详解

基于规则的机器翻译系统详解


寻找中间语的难度

“如果要设计出一种元语言(中间语)用来 解释,那么它就必须包含多种语言的所有 特征。这种努力不仅毫无止境,而且可能 毫无结果”
——法国人 斯莱德
基于规则的机器翻译系统


大致可分为三种类型: 1、直接翻译 2、结构转换翻译 3、中间语翻译
基于规则的机器翻译系统 之 直接翻译


是把原语中的单词或句子直接替换成相应 的目的语的单词,必要时对词序进行适当 的调整。 这是机器翻译最初的构想。从目的语中寻 找与原语词汇相对应的单词.但并不是电子 词典的word-to-word形式,而是翻译句子中 所有的词汇。到后期也加入了一些简单句 法甚至语义规则,对替换后的词语进行重 新排序,生成目的语文本。
分析
转换
生成
机器翻译(machine translation)

机器翻译主要有两套系统:
一、基于规则的(Rule-based System) 二、基于语料库的(Corpus-based System)


基于规则的机器翻译系统



规则主要包括: 1、词法 2、句法 3、短语规则 4、转换生成语法

基于中间语的机器翻译原理就是不同语言 之间建立一个通用的语义-句法表达式,如 图所示:
SL
分析
中间语表达式
TL
合成
SL词典和语法库
SL词典
TL词典和语法库
个人见解





货币的本质是一种等价物,那意味着所有的物品 都可以用货币去衡量,就相当于一种中间语,用 货币比喻如图: 1000RMB=一头牛 100欧元=一个花瓶 1000RMB=100欧元=1货币 在这个比喻中,虽然不能把一头牛直接等价于一 个花瓶,也不能直接把1000RMB直接等价于100 欧元,但是它们都有相同的等价物1货币,这1货 币就是它们之间的桥梁,它们可以互相交换。 这就和中间语的功能是相似的
机器翻译原理

基于规则的机器翻译系统 (Rule-based System)
机器翻译(machine translation)

机器翻译原理本质:
是人类思维和语言活动的模拟; 是探索如何借助计算机程序将文字或语言 从一种自然语言翻译成另一种自然语言的 技术。
பைடு நூலகம்



机器翻译的翻译过程如图所示:
(输入)原语 目的语(输出)

其翻译模式如下图:
SL输入
形态分析
双语词典查询
语序调整
TL输出

在孩子的教育问题上,家庭教育与 学校教育同等重要
Family education play an equally important role in children's education as school education.
基于规则的机器翻译系统 之 转换系统


通常包括: 分析、转换和生成三部分 其中从原语向目的语的转换是该系统的核 心。 这种方法被认为是模拟人类翻译活动最恰 当的机制。
机器翻译的三个阶段




1957年,美国学者V.Yingve提出了翻译的三 个阶段,即: 1、用代码化的结构标志转换为目的语句子 结构标志(分析阶段) 2、把原语句子的结构标志转换为目的语句 子的结构标志(转换阶段) 3、有目的语句子结构都标志生成目的语句 子(生成阶段)

由于原语与目的语在句子语法结构上千差万 别,翻译出来的句子的可读性可想而知。 但它是机器翻译的最实质性的一步,是机器 翻译从梦想到现实的一次飞跃。
基于规则的机器翻译系统 之 转换系统


为了提高译文的可读性,人们更多的从句 子的层面来分析处理原语与目的语的特征。 于是在直接翻译系统之上,出现了机器翻 译的转换系统。
个人见解
SL表层结 构 我 SL深层分 析 5 TL深层结 构 Five TL表层结 构 I

2 0 分析 转换
Two Zero
Love You

生成
三阶段的新诠释

法国人B.Vouquois将三阶段诠释为六个步骤
分析 转换 生成
原句词法
原句句法
双语词法
双语句法
目的语句法
目的语词法
奈达对翻译过程的诠释

奈达根据乔姆斯基的“转换生成语法”做 的诠释
SL表层结构
分析 TL表层结构
生成
SL深层结构
转换
TL深层结构

机器翻译中,从原语(SL)句子的表层结 构到其深层结构需要经过词法、句法、语 义等分析。性层的深层结构是一种树 (syntax tree)。它反映的事一个句子内部 的语法结构,这种结构认为是人类抽象思 维的逻辑表达式。不同的语言具有相同或 相似的深层结构。就像是一座桥梁,把人 类不同的语言连接恰来,使彼此可以翻译 交流。

问题:

这两种诠释有什么相似之处?
基于规则的机器翻译系统 之 中间语翻译

自然语言大多一个单词有多种意思,比如, 中文的“方便”二字就有很多不同的意思, 容易产生歧义。在机器翻译中,为了简化 纷繁的表达结构,避免其含糊不清的语言 现象,独立于各种自然语言,同时又能清 晰准确地表达各种自然语言的人造计算机 语言英语而生。这种人造计算机语言就是 中间语(interlingua,IL)
相关主题