当前位置:文档之家› 本地化工程常见问题

本地化工程常见问题

本地化工程常见问题
1) 本地化工程是做什么的?为什么称为“工程”?
本地化工程是本地化流程中的关键步骤。

本地化工程师负责流程中所有和技术相关的工作。

其中包括:项目文件准备、软件安装、编译和发布,以及支持翻译和项目经理,屏幕截图和测试等等。

之所以称为“工程”,是因为负责本地化的技术相关的工作的人必须具有从事技术工作的能力,必须具备相当程度的专业知识,必须熟练试用各种软件工具、翻译工具,熟悉多种操作系统、开发环境和本地化模式。

他们必须理解特定软件程序是怎样工作的,并且具有使用软件行业标准开发和编程环境的经验,例如Microsoft Visual Studio、Borland Delphi、Java Development Kit,还要能够选择并使用合适的辅助翻译工具,最后,还要能够对软件程序的功能进行测试,有时还有对发现的BUG进行修正。

另外,最基本的还需要具有读写英语的能力。

2) DTP是做什么的?
DTP (Desktop Publishing)是桌面排版。

DTP 就是使用计算机及排版软件对版面上的文字和图片的位置布局进行编排。

另外还包括图片的本地化(编辑和修改图片和图表)。

3) 文本增长(Text Expansion)是什么意思?
翻译后的文字比原文更长的情况叫做文本增长,例如从英文翻译成波兰语,通常会增长20%左右。

这一特点对软件界面的显示有很大影响,必须增大显示区域或者缩小字体。

4) 对库(Alignment)是什么意思?
使用逐句匹配的方法,从翻译好的译文和源文中生成翻译记忆库的方法或操作。

5) 内部重复(Internal Repetitions)是什么意思?
在同一个文档内重复出现的文字或句子。

通常他们的翻译也是相同的,所以只需要翻译一次。

6) 100% 匹配(100% Matches)是什么意思?
100%匹配也叫做“完全匹配”或“精确匹配”。

在使用翻译记忆库工具时,如果在一个文档中,其中的某些短语或句子,能够与翻译记忆库中已有的文字片段完全相同,那么这些文字片段,就是100%匹配的。

通常可以直接利用以前保存在翻译记忆库中的翻译成果,无需再次重复翻译。

7) 模糊匹配(Fuzzy Matches)是什么意思?
模糊匹配,在使用翻译记忆库工具时,如果在一个文档中,其中的某些短语或句子,能够与翻译记忆库中已有的文字片段相似,那么这些文字片段,就是模糊匹配的。

翻译时可以作为参考。

例如,“Click OK to display messages”与“Click OK to display changes”是相似度75% 的模糊匹配。

8) 复用率(Leverage Rate)是什么意思?
复用率一般用百分比表示,是指需要翻译的文件中有多少文字,以前已经翻译过了,可以在翻译记忆库中找到并重复利用。

9) 字符集(Charset)和编码(Encoding)的区别?
字符集是字符的集合。

我们必须将字符逐一编码成2进制的字节形式,计算机才能够处理。

例如:这个字符 '☯' 在Unicode字符集中有这个字符,可能其他字符集中也有这个字符。

但是他们可以有多种实现方式,在不同的编码方式中编码不同。

Unicode character: ☯
UTF-16 encoded: 26 2F
UTF-8 encoded: E2 98 AF
10) 如何识别文件/字节流是什么字符集/编码?
严谨的答案是:无法识别。

编码方案其实是一种密码,对于一段字节流,在不知道其采用何种编码方式的情况下,很难破译。

而且各种编码之间互有交集,比较混乱。

但是就如同破译密码一样,有时是可以根据一些技巧,予以破译的。

在实际工作中,可以用常用的一些字符集,逐一试验。

例如,使用WORD软件的
“打开时确认转换”功能(工具 >> 选项 >> 常规),在打开文件时,用各种编码方式进行解码,逐一试验。

11) 用写字板打开一个不带BOM的UTF-8文件,然后另存时,为什么在另存为窗口中仍然显示为ANSI的文件?
这种情况是正常的。

当文件内的所有字符都是ASCII字符集内的字符时,两种编码方式是相同的。

而且这个UTF8的文件,没有BOM。

如果是用写字板另存UTF8,会自动添加BOM。

如果你使用其他工具,可选择另存为,带BOM的UTF-8格式,就不会在写字板中打开另存时显示为ANSI 文件了。

相关主题