当前位置:
文档之家› 基于多译本多译本语料库的译文对比研究_对_傲慢与偏见_三译本的对比分析_徐欣
基于多译本多译本语料库的译文对比研究_对_傲慢与偏见_三译本的对比分析_徐欣
Corpus-based Version Analysis — Take Pride and Prejudice for example
XU Xin
( School of Foreign Languages,Shandong University,Jinan 250100,China)
Abstract∶ The article reports a study of the features of three versions of Pride and Prejudice on the basis of a corpus-based comparison. The study finds that the three versions show a preference to use a certain number of words. More high frequency words,especially conjunctions and pronouns are chosen by the translators. It is also found that the three versions influenced by the source language,demonstrate a strong tendency to use some fixed expressions. Moreover,on the syntactic level,in comparison with the figure of LCMC,the versions are characterized by longer sentences on average. Key words∶ translation research; multiversion analysis; corpus
2. 语料库与检索方案 2. 1 语料库
本文所使用的语料库包括:兰开斯特现代 汉语语料库( LCMC) 、北京外国语大学的通用 汉英对应语料库( CEPC) 和自制英语名著《傲 慢与偏见》三译本平行语料库。
需要指出:LCMC 在此只作为一个参照库。 本文使用的是自制的《傲慢与偏见》语料库,该 库是一个文学翻译库。将 LCMC 作为一个现代 汉语书面平衡语 料 库 引 入 进 来 ,可 以 更 为 客 观 地反映汉语书面语的词汇特征。 2. 2 检索方案
Std.TTR 50
40
30
20
10
0 孙译本 王译本 张译本 LCMC
Std.TTR
图一:标准类符 / 形符比 图一所示,三译本的标准类符 / 形符比的 数值相差无几(23. 43 ~ 23. 75) 。但明显低于 LCMC 值近 20 个百分点(23. 43 vs. 43. 35) 。这 一差异说明:《傲慢与偏见》译本的词语变化性 明显低于现代书面汉语。这在一定程度上验 证了翻译小说词语“简化”的假设[16:248]。
2) 词表( Wordlist) : 这 是 语 料 库 索 引 工 具 的基本功能之一,是 按 照 类 符 的 频 率 高 低 列 出 的类符表。WordSmith Tools 4. 0 提供的词表功 能除了普通的词 表,还 有 可 按 字 母 顺 序 随 意 改
54
变次序的词表,同时也提供了语料库的各种基 本统计信息。
LCMC 频率 % 的 51,324 6. 75 了 13,124 1. 73 是 12,599 1. 66 在 10,527 1. 38 一 10,115 1. 33 不 7,766 1. 02 和 7,370 0. 97 他 5,899 0. 78 我 5,686 0. 75 有 5,642 0. 74
就三个译本而言,在类符 / 形符比上王译 本与张译 本 相 差 无 几,而 孙 译 本 较 高,这 说 明 孙译本词语变化性较大,用词较丰富。总体来 说,三个译 本 之 间 的 词 汇 丰 富 程 度 相 当,用 词 变化性不大。但相比汉语总体( LCMC) 水平而 言,有一定差距。为了验证这个结论,我们 进 一步从 LCMC 中提取了其小说部分的语料,本 文称之为 LCMC 子语料库。对 比 了 三 译 本 与 LCMC 子语料库的标准类符 / 形符比。( LCMC 子语料库的 Std. TTR 为 44. 02) 。从中验证译 本受原著 的 影 响,用 词 丰 富 程 度 不 够,词 汇 缺 乏变化性。 3. 2 词表
3. 语料库检索、统计结果分析 依据检索方案,运用 WordSmith Tools 4. 0、
AntConc、ParaConc 等语料库检索软件对相关语 料进行检 索 分 析、统 计,对 比 三 个 译 本 得 出 下 列数据: 3. 1 类符 /形符比
一般说来,语料库规模越大,类符 / 形符比 越小。若语料库规模相同,高比率意味着作者 使用的词 汇 量 较 大,用 词 丰 富; 低 比 率 则 表 示 作者所用的词汇范围较窄。通过 TTR 值的大 小可以比较不同语料中词汇变化的大小。
4) 词串:连续的词语组合,大多数词串不 是完整的句子结构单位,也不是习语或固定表 达方式,因此不能用一个单词来替换整个词串 序列[14:156 ]。词串统计指对预定长度的词 语组合在语料库中查找,并统计其复现频数。
5) 平均句长:英语句子受复合句影响,专 业作者的平均句长为 20 个词[15:64 ]。译本 的句子长度呈现怎样一种趋势呢? 译者对句 子长度处 理 是 更 倾 向 于 源 语 还 是 游 离 在 源 语 与译语之间,有待进一步实证分析。
利用 WordSmith Tools 4. 0 分别做出《傲慢 与偏见》三个译本和 LCMC 词表,并进行对比。
孙译本 频率 1 的 4,717 2 她 2,847 3 了 2,684 4 他 2,641 5 我 2,612 6 你 1,789 7 是 1,606 8 说 1,191 9 先生 1,025 10 在 965
如表一所示,三个译本和 LCMC 词表前 10 位都 大 多 是 以“的、他、她、在、了、我、你、说、 这、是”等 单 字 词 构 成 的。 这 些 单 字 词 的 高 频 现象是 汉 语 词 表 的 普 遍 现 象。 结 构 助 词“的 ” 在四个词表中均列第一位。而三个译本词表的 前 5 位所涉及的单字更是完全一样,只是顺序 稍有差异。值得注意的是,各个译本前 5 位的 高频词 中,仅 人 称 代 词 就 占 了 三 个,分 别 为 “她、他、我”。第三人称代词“她”高居第二位。
3) 个性词:译者受个人语言风格、语言规 范、地域方 言 等 因 素 影 响,译 者 之 间 的 语 言 运 用特征会 有 差 异; 在 多 译 本 里,会 出 现 某 些 词 在甲译本里高频使用、而在乙译本中低频甚至 零频次使用的情形。我们把这类词汇称为“个 性词”。对这些词的分布和使用情况进行考察 可以揭示译者的翻译策略和语言使用习惯。
目前对《傲 慢 与 偏 见 》的 中 文 译 本 有 不 少 研究,主 要 方 法 是 摘 取 典 型 例 句 进 行 人 物 形 象、风格 再 现 等 方 面 的分 析[10;11;12;13 ]。 本文的分析更注 重 宏 观 描 述,同 时 也 希 望 构 建 一种基于语料库的多译本分析模式。
( 山东大学 外国语学院, 济南 250100)
摘 要:本文基于多译本语料库对比分析了《傲慢与偏见》的三个译本,旨在探讨译本间以及译语与源语之间的 差异。研究认为,与汉语原创文本相比,三译本用词丰富程度不够;译本倾向使用更多的高频词汇,连词、代词使 用频率明显偏高;受源语影响,译本中出现了一定数量的固化表达式;译文的平均句长也高于汉语原创文本。 关键词:翻译研究;多译本分析;语料库
本研究分 别 统 计 了 三 个 译 本 和 LCMC 这 四个语 料 库 的 标 准 类 符 / 形 符 比 ( Std. TTR) 。 计算标准类符 / 形符比( Std. TTR) 的原因:《傲 慢与偏见》语料库和 LCMC 库容差异较大 ( 各 单译本子库实例数量上小于 LCMC,约为 1:3) , 简单的 TTR 值计算没有说服力。因此,在进行 TTR 计 算 时,使 用 了 Wordsmith4. 0 提 供 的 以 1000 词为计算单位的计算方式,得到标准化类 符 / 形符比( Std. TTR) ( 如图一) 。
2010年 3 月 第 33 卷第 2 期
外国语 Journal of Foreign Languages
文章编号:1004 - 5139(2010)02 - 0053 - 07
中图分类号:H059
March 2010 Vol.33 No.2
文献标识码:A
*
基于多译本语料库的译文对比研究
——— 对《傲 慢 与 偏 见 》三 译 本 的 对 比 分 析 徐欣
1. 引言 传统的译本研究长于典型例句分析,主要依
赖研究者个人的直觉和感受。较窄的考察范围 和过多个人感性因素的介入在一定程度上影响 了研究深度和结论的可信度。语料库的出现给 我们更全面深入地考察翻译语言提供了重要帮 助,因为“它借助现代计算机技术,不仅从语言学 和比较语言学的角度,而且从政治、意识形态、经 济、文化等宏观的角度去研究翻译现象,揭示翻 译中存在的概然性法则,系统地总结出翻译文本 和翻译过程中的‘翻译总特征’,从而对翻译得 到了广角的全面认识”[1:72]。
目前,用双语平行语料库研究翻译语言在 国内已取 得 一 些 成 果[2 ;3 ;4 ;22 ]。 依 照 现 有 的思路和方法,本项研究通过多译本平行语料 库研究翻 译 语 言 的 个 性 特 点 和 共 同 特 征。 该 研究方式对译本进行定量分析,直观反映不同 译本的词 汇 丰 富 程 度、用 词 倾 向、译 文 的 归 化 或异化程 度 等。对 不 同 译 本 翻 译 语 言 的 量 化 的、多层面 描 写,有 助 于 对 各 类 翻 译 现 象 的 成 因、发展趋向进行深入分析。