当前位置:
文档之家› 翻译技术的知识体系化演进—以双语术语知识库建设与应用为例_苗菊 宁海霖
翻译技术的知识体系化演进—以双语术语知识库建设与应用为例_苗菊 宁海霖
以本 体视 角进 行 专业领域 知识 的概 念 网络构 建 ,建 立知 识 化语 言资 源和 科研 基 础设施 。基 于 以上 三 个 研究视 角 ,双 语术语知识库理论基础主要包括
:
(一 )知 识 组 织 理 论
如 前 文所述 ,知 识 组织理 论 是 一 个 宏 观 的方 法 论概 念 ,为 双 语术 语 知识库 的建 设 与应 用提 供整 体 知识 性 的研 究 框 架 。整 个建 库 过 程 分 为知识 获 取 、 表示 、 知识运用三个 阶段 ,每 个 阶段步骤 缜密 、 任务 明确又彼此呼应 :(1)知 识获取 ,主 要指运用信息技 术 手段 构建 大规模 数 据并 从 中进 行 自动化术 语 信 息 的抽取 和预处理 ;(2)知 识表示 ,指 对专业领域知识 的描述 ,构 建知识 网络 ,实 现计算机对于领域 知识 的 ・ 61・
,
合发展是 与生俱来 的本质属性 。 随着科技 的飞速进 步和多学 科交叉研 究 的不 断 深入 ,当 今 应 用翻译 研 究 的 内容 已远超 出霍姆 斯 的 框架范畴 ,最 初提 出的四个分支的 内涵 ,发 生 了很大 翻 翻译 技术 、 语 言服 务 业 、 变 化 ,涵 盖 了翻译教 育 、 翻译资源建设等 译生态环境 、 翻译质量评估与标准 、 计 算 科学 、 丰 富 的研 究 内容 ,涉 及 教 育学 、 术 语学 、 生态 学 、 计算语 言学 、 社会 语料库 语 言学 、 管理 学 、 工 、 。 、 知识 程学等多学科理论 学 信息科学 职业译者科华 (Chiew Kin 美 国翻译技术专家 、
;
(三 )信 息 可 视 化
信 息 的 日益膨 胀带来 认知模 式 的转 变 。相 比单 纯依靠文字 的方 式 ,人 们越来越 倾 向于 以更加直 观 、 简 易、 高效 的可视化手段获取信息和知识 ,而 对于翻 译工具而 言 ,信 `患 、 可视化主要体现 为两点 :一 、 术语 、 条 目信 启 立 体 化 ,采 取 高 粒 度 信 息分 类 法 ,引 入 图 像、 视频 等直观展示概念 内涵 的非文字手段 ;二 、 建 立 专业领域 信息知识 网络 ,规 避 杂乱而孤立 的数 据
(一 )专 业 领 域 化
信 息膨 胀 的负面效应 之 一是 数 据 的无 序 化 ,即 各领 域 各种来 源 的数 据混 杂 ,导 致 用户无 法 有效 地 、 。而在 实际 翻译 过程 中 ,译 者未 必 能 定 位 专业 信 启 翻译 规 范 够 从 翻译 公 司或 客户手 中获 得 专业 词 典 、 或术 语 库 等 辅 助材 料 ,至 此译 者 需在 多领 域 的混 杂 亍 信 息 的检 索 定位 ,这 种不 准 确 的 的海 量 数 据 中进 彳 信息源增加 了出现误译 的几率 。
,
领域 的标 准化术 语 信 息 ,包 括标 准化 的术 语 和对 应 译文 、 词性 、 术语 定义 、 适 用语境 、 相关领域 、 语种 、 展示该领域 的知识 网络 ,即 概念 接受度等信息 ;二 、 之 间的相互关联 。 四 、双 语 术 语 知 识 库 的 理 论 基 础 以知 识组 织视 角设 计 总 体研究框 架 ,将 整个 研 究分 为知识采集 、 知识表示 、 知识运 用三部分 ,每 一 部分都 为下 一 阶段 的研究奠 定基 础 ;以 术语 学视 角 进行基 础数据 的组织整理 ,完 成术语 的标 准化 工 作
翻译技术的知识体系化演进
—— 以双语术语知识库建设与应用为例
茴菊
摘
宁海霖
南开大学
技术应 用于社会 翻译实践 的产物 ,而 信 `巳 化的翻译工具在彻底改变翻译方式和迅速提 高翻 要 :翻 译技术是信‘ 息 译效率的同时 ,也 存在 着一 些 与生俱 来的遗憾 ,至 此翻译技术的更新升 级 、其知识体 系化演进的趋势愈发突显 。作 为知识体 系化翻译 工具的范例 ,双 语术语知识库展现 了术语 学、知识工程和知识 本体理论对翻译技术知 识体 系化发 展趋势的推动力,与 此也将在翻译数字化教 学环境、语 言服务业技术传播、人文 学科科研 基础设施建设等方面体现 其应用价值。 关键词 :翻 译技术 ;知 识组织 ;本体 论 ;术 语知识库
(二 )知 识 体 系化
知识体系是 指专业领域 中的概念相 互关联 而形 成 的知识 网络 ,它 不仅包括概念本 身的 内涵定义 ,还 展示 了概念之 间的逻辑关 系和知识框架 的构建方式 。 翻译 的重 要功 能是 通过 文 字 的转 换 而传达 语义 ,因 此译者不仅需要平面化 、 单 一 化的 匹配信 息 ,更 需要 获得 检 索 信息所 包含 的知识 ,即 特定领域 中重 要概 念 之 间 的联 系 。 由于社 会 分 工 的专业领 域 化 ,市 场 对 专业 领 域 知识 的需 求量 增大 ,译 者 更希 望获取 知 识体系化 的信息 ,以 满足翻译活动 的质量要 求 。
识 库 的结合 体 ,模 拟领 域 专 家对概 念 与相 应 术语 的 认知模 式 (Meyer,19” :159)。 实验 室还 开 发 了 名为 COGNITERM的 测试性英法双语术语管理系统 来验证这 一理念 。 当今 国际 著 名 的术 语 知 识库 有 加 拿 大 的 TERMIUM和 西班牙的 EcoLe蛀 con等 。TERMIUM 加 是 世 界上 最 大 的术 语 库 ,它 由加拿 大 政 府 出资 、 拿 大 翻译 局主 持 建 设 ,开 始 为英 法双 语 术 语 库 ,随 后又 加 入 了西班 牙 语 和 葡 萄 牙 语 两 个 语 种 的 内容 。 TERMIUM的 术语词 条包括术语所 属 的领 域 、子领 词性、 定义 、 语 境 等 信 息 。其 Plus 翻译 、 来源 、 域、 版 本 于 ⒛ 09年 10月 对 公 众 免 费 开放 ,其 官 网设 有 很 多英 法 写作 工 具链 接 ,用 户可 借 此 了解 法 语 动词 的词形变 化 、 信件 写作 贴士 、 英 文写作风格 指南等 。 EcOLex妃 on是 由西 IJE牙 格拉纳达大学 (U血 ve雨 ty of
,
引入 能够形 象展示概 念外 延 与概 念系 统 的知识导航 系统 ,形 成利于知识掌握 与推理 的认知机制 。 三 、知 识 化 翻 译 工 具 的产 生 知识化翻译工具是在知识工程 、 主题 知识本 体 、 图等 知识技术基础上 构建 的翻译工具 ,能 够立体化 、 形象化 、 专业 化 地 描 述 和 定 位 资 源 ,弥 补 信 息 化 翻 译工 具 的不足 。作 为术 语学 和知识工程 学 相 结合 的 成果 ,双 语术 语 知 识库 正 是 当今 最具 代 表 性 的知 识 化 翻译 工 具 ,是 知识 化 的术 语库 。这 一 概 念 最 早 由 迈尔 加拿 大渥 太华 大 学人 工智 能实验 室 的英格 丽 ・ (Ingnd Meyer)提 出 ,认 为术语知识库是术语库与知
中图分类号 :H059
文献标识码 :A
文章编号 :1000-叩 3X(2016)06-0“ 0-Os
(U1rych,⒛ 02:2OO)。 正 因应用翻译研究包括 了与 信 `自 、 技术飞速发展和创新应用是 当今时代文化 、 翻译 实践 活 动相 关 联 的多学 科领 域 ,其 多学 科 的融
引言 计算 机 辅 助 翻 贸 易传 播 的突 显特 征 。从 机 器 翻译 、 语 联 网智 译 已 发展 到大数 据 时代 的互联 网云 计算 、 慧云翻译平 台 ,体 现 了语言技术资源 的创新建设 ,推 动 了科研 、 教育 、 语言服务业运行模 式的革新 。新型 流 程 和服 务 实 的知 识 服 务 体 系将 整 合 资 源 、 技术 、 力。翻译技术 的发展 ,需 要持续更新升级 ,提 高其知 识化 、 可视化效果 ,以 迎合 人类知识再现 、 信 息传递 和认知思维模式变化发展的需要 。 当今 的翻译技术是在 信 息检 索 与匹配技术 的基 础上实现 的 ,具 现化为 工 具 ,一 般可 以分 为机器翻译 工具 和 计算机辅 助 翻译 工 具 两 大类 ,统 称 为 信 息化 翻译 工 具 。应 用信 息化翻译 工 具提高 翻译效 率和 质 量 ,产 生的推动效应不言而喻 ,语 言服务业也突显其 应 用技 术 条件之 特 征 。然 而 ,行 业 的兴 盛 依 然不 能 知识化 、 可视化方面 忽视信息化翻译 工 具在标准化 、 的缺憾 ,而 随着市场对产品要求不 断提高 ,存 在 的问 题 和矛盾会愈 发 明显 。至 此翻译技术 需要 实现进 一 步完善发展 以满足实际翻译活动 的需求 。 一 、应 用 翻 译 研 究 的 多 学 科 发 展 荷兰 阿姆 斯 特丹大学 翻译理 论家詹姆 斯 ・ 霍姆 (James Ho1mes)在 翻译研究 的名与实 》一 文 斯 《 中将 翻译 研 究 划 分 为 纯 翻译 研 究 与应 用 翻 译研 究
Quah)将 翻译技术分 为 自动翻译 系统和计算机辅助
翻译 工 具 两 部分 ,并 将 语 言 工 具 和本 地 化 工 具纳 入 计算 机 辅 助 翻译 工 具 的范 畴 ,突 出了翻译 技 术 的多 双 语术 语 知 识 学 科 发 展 特 性 (Quah,⒛ 06:绲
)。
库是 翻译 技 术 知 识 体 系化演 进 的新 成 果 ,体 现 了语 本 体论 、 知识组织理 论 与翻译 料库语 言学 、 术 语学 、 技术 研 发相 互 交融 渗 透形 成 的联 合 优 势 ,证 明多 学 科研 究 成 果 是建 设 知识 文 化资 源 的基 础 ,更 多相关 学科 与理 论成果 的交 汇融合 必将 推 动翻译技术 的进 一 步发展 。 二 、信 息 化 翻 译 工 具 的 潜 在 问 题 科华将 机器 翻译 的关键技术按 发展 的时 间脉 络 中介语技术 、 转换技 划分 为 五 大类 :直 接 翻译技术 、 (同 -泓 上 :⒆ 机器 实例 化技术 术、 数据化技术 、
翻译记忆 、自动 匹配 等重要辅助 为 日后的语料对齐 、 翻译技术奠定 了基础 。 艮 务市场 的迅速扩大 和翻译 活动依赖 随着语 言月 工 具 的 日益 加深 ,信 息化 翻译 工 具 的缺憾 之处 愈 发 知 明显 ,需 要在 以下 三方 面进行改善 :专 业领域化 、 识体系化和信息可视化 。