双语平行语料库的制作流程
Step 5.利用ParaConc软件对双语语料库进行检索统计。步骤如下:
1.运行ParaConc269软件,如下图:
2.点击“File”,在下拉列表中选择“Load Corpus Files”,如下图:
3.在Align format处,选择“Start/stop tags”,如下图:
4.点击“add”,分别添加Step 4中得到的中文txt文本和英文txt文本。如下图:
3.点击“导出”,如下图:
点击“确定”,关闭该软件。
4.找到导出文本所在文件夹,可以看到txt格式的中文文本和英文文本,打开中文文本,如下图:
点击“文件”,选择“另存为”,如下图:
在“编码”处可看到当前编码为“UTF-8”,点击,在下拉列表中选择“ANSI”,如下图:
选择“是”,关闭记事本。
注意:与英文txt文本不同,中文txt文本必须经过这一步改成ANSI格式。若文件数量大,也可使用编码批量转换软件。
点击“OK”,双语语料库制作完成。
Step 6.在该语料库中执行“搜索”功能。例如,查询“shall”在该语料库中对应的中文翻译。
1.点击“Search”,在下拉列表中选择“search”。在跳出的选框中输入“shall”,如下图:
点击”OK”,即可得到搜索结果,如下图:
2.可将搜索结果保存下来:保持该搜索界面不变,点击“Search”,选择“Save as File”,如下图:
点击“文件”→“另存为”txt文本,如下图:
点击“保存”,关闭Heartsome TMX Editor。
Step 4.利用TMX-ParaConV软件,从上一步得到的txt中英文本中分别导出中文txt文本和英文txt文本。步骤如下:
1.运行TMX-ParaConV,如下图:
2.点击“选择文件”,找到Step three中得到的txt文本,如下图:
1.运行Heartsome TMX Editor,如下图:
2.点击“文件”,选择“打开TMX文件”,如下图:
选择从trados记忆库中导出的tmx文本,点击“打开”,如下图:
3.点击“编辑”,在下拉列表中选择“清除所有标记”,如下图:
点击“确定”,“降噪”完成。
4.点击“文件”→“保存”。
5.从文件夹中找到该文本,用记事本打开,如图:
双语平行语料库的制作流程
Ste导出tmx文本。步骤如下:
1.启动ABBYY Aligner,如下图:
2.点击“文件图标”导入英文文档
英文文档导入后会自动弹出对话框,在对话框中选择中文文档导入,如下图:
3.点击Align,利用该软件自动对齐,结果如下图:
勾选“Sequential number in each line”,点击“OK”,如下图:
输入文件名,在这里可命名为“shall”,并将其保存在某文件夹中。
3.打开该文件,如下图:
制作完成,关闭ParaConc软件。
1.启用SDL Trados Studio 2011,如下图:
2.点击左上角“升级翻译记忆库”
点击“添加文件”,
点击“关闭”
点击“是”。
3.打开该翻译记忆库,则左侧“翻译记忆库”下方出现该记忆库。
选中该记忆库,右击,选择“导出”
完成,关闭Trados。
Step 3.利用Heartsome TMX Editor软件,对上一步中得到的tmx文本“降噪”。步骤如下:
接下来需要手动修改,将文档中没有对齐的地方整理对齐。(为了确保准确和高效,建议首先整理上图中标色部分,这是该软件自动识别标出的有可能没有对齐的句子。把这些修改完后,再从头到尾检查一遍,修改其余没检测出来的未对齐句子。)
修改后如图:
4.点击Export to TMX,保存对齐之后的tmx文本
Step 2.利用trados软件,将Step 1中的tmx文本导入记忆库,并从记忆库中导出新的tmx文本。步骤如下: