当前位置:文档之家› 多语种翻译机器人方案

多语种翻译机器人方案

多语种翻译机器人系统方案目录第一章概述 (2)第一节、市场分析 (2)第二章系统总体设计 (3)第一节、系统功能 (3)第二节、产品形态 (4)一、自助查询服务机器人 (4)二、便携式翻译机器人 (5)第三章系统技术分析 (6)第一节、系统设计分析 (6)一、设计思想 (6)二、设计原则 (6)三、C/S模式体系架构 (7)第二节、系统相关技术 (8)一、数据库并发处理技术 (8)二、机器翻译算法 (8)第三节、外围设备分析 (9)一、触摸屏 (9)二、UPS电源 (9)第四节、系统安全策略 (9)一、网络物理安全 (10)二、网络结构安全 (10)第四章项目实施与技术服务 (11)第一节.项目管理 (11)一、项目组织 (11)二、项目管理 (11)第一章概述第一节、市场分析义乌是浙江中部快速崛起的一座商贸城市,本地人口70.7万,外来经商务工人口2007年已突破100万,城区常住人口中有来自100多个国家及地区的近万名外商和国内40个民族的2.6 万少数民族人口。

市场是义乌经济的最大特色和优势。

义乌不仅拥有丰富的商贸资源,同时也在语言生活方面体现出鲜明的义乌特色。

中国小商品城经营总面积达400余万平方米,商位6.2万个,从业人员16万,商品170多万种,日客流量20多万人次。

市场的巨大吸引力汇聚了全国乃至世界各地的客商,义乌成了名副其实的“联合国社区”,小商品经销的全球化,同时推动了文化交流的国际化。

义乌的公交车是中英文双语报站;许多商店招牌用中、英、韩、阿拉伯文字交相展示;市区有基督教堂、礼拜场所、清真寺,还有国际学校;在繁华的国际商贸城内,随时都能听到经营户、客商或翻译交流交易时所使用的汉语、英语、韩语、俄语、阿拉伯语等近十种语言,市场成了各种语言的交汇点。

但对于这个外向度达60%以上的国际性市场来说,市场若能提供多语种服务,将能够提升市场品位,加速市场与国际的接轨。

第二章系统总体设计第一节、系统功能针对市场经营的实际情况,我们团队根据需求分析以及查找相关资料,形成一套比较完善的应用方案。

本系统将由自助查询服务机器人和便携式翻译机器人两部分组成。

自助查询服务机器人包含多语种功能(支持8种外语)、商铺问路功能、商品查找功能、市场情况介绍、交通出行、商品资讯、免费下载等。

多语种功能是指系统能以8种语言与用户进行交流互动;商铺问路功能是指能根据用户输入的商铺名展示商铺位置的示意图以及行走路线;商品查找功能是指能根据用户输入的商品查找有该商品出售的商铺以及该商品的相关信息;市场情况介绍是指介绍遇到一些常见问题的帮助方式以及相关管理部门的联系方式等信息;交通出行可以查询用户所在位置以及周边交通的出行方式,并可以打印出行路线;商品资讯是指提供市场相关商品的最新信息;免费下载是指提供的正版音乐、电影、游戏等内容下载。

便携式翻译机器人是指一种移动终端,类似与智能手机。

它支持手写输入和语音输入,能将输入的汉字等8种语言翻译成相应的语言,方便外国客商与商家的交流。

这种应用于移动终端的同声传译系统采用了包含3个中央处理器的芯片。

3个中央处理器同时工作时,可以瞬间从语音信息中识别并读出单词、词组,然后精确组合句子结构。

它能够识别将近5万个汉字和3万个英语单词,适合于在商品买卖等需要简单对话的场所使用。

当使用者对着安装了该系统的翻译机说话时,每说完一句话间隔5秒后,系统就能用文字和语音形式把语句转换成另外一种语言。

第二节、产品形态一、自助查询服务机器人相关硬件的技术特性如下:主控机:工控主机CUP PIII以上、512MB内存、硬盘80G、10/100M网卡显示屏:15寸液晶显示器,分辨率1024*768,亮度量260cd/ m2,对比度450:1触摸显示屏:15寸表面声波,高透光率,高精确度和耐久性;防尘、防水、防暴安全型表面声波;厚度:6mm,分辨率4096×4096,表面硬度:莫氏7级。

发票打印机:具备自动切纸功能的针式打印,支持长时间连续纸打印;有少纸、卡纸自动报警功能;UPS电源:专用工控主机电源,配备不间断电源多媒体:支持多媒体功放系统、防磁化立体音响大堂机柜:大堂式结构立式金属机柜,表面用豪华进口金属烤漆,主机模块支持导轨定位。

体积:(L)500mm×(D)650mm×(H)1500mm 使用环境:内部温度:+5℃~+45℃,相对湿度:10%~80%,输入电压:AC220V±10% 50Hz±1Hz二、便携式翻译机器人上图是该便携式翻译机器人示意图,实际中该翻译机利用头戴式麦克风输入语音,通过按钮进行翻译操作。

例如,当你对着麦克风输入“预约”一词,翻译机的液晶显示屏上就会出现20多例包含“预约”一词的句子,如果你选择了“可以预约明天吗?”这一例句,过一会儿机器中就会传出“Can I make a reservation for tomorrow?”的发音。

如果市场提供专用网络连接,该便携式翻译机器人将与萧山研究院的词汇数据库相连接,能够做到同声翻译。

第三章系统技术分析第一节、系统设计分析一、设计思想本系统将采用面向对象和构件式设计思想。

该设计思想是现代软件系统的基本设计思想,使用该设计思想进行开发有以下优点:1、易维护采用面向对象思想设计的结构,可读性高,由于继承的存在,即使改变需求,那么维护也只是在局部模块,所以维护起来非常方便而且成本较低。

2、质量高在设计时,可重用现有的,在以前的项目领域中已被测试过的类似系统满足业务需求,并且具有较高的质量保证。

3、效率高在软件开发时,根据设计的需要对现实世界的事物进行抽象,产生类。

使用这样的方法解决问题,接近于日常生活和自然的思考方式,势必提高软件开发的效率和质量。

4、易扩展由于继承、封装、多态的特性,自然设计出高内聚、低耦合的系统结构,使得系统更灵活、更容易扩展,而且成本较低。

二、设计原则根据自助服务系统特点,结合萧山工业研究院在系统集成和应用领域的项目开发实际经验,我们在设计该系统时依据如下设计原则:先进性采用目前最先进的机器翻译技术、计算机技术、数据通讯技术、网络技术和软件开发技术设计。

●实用性系统设计以满足用户需求为目标,以方便用户使用为原则,同时融入先进的管理经验,为用户量身定做一套先进的系统。

并且尽可能降低系统使用前的培训投入和使用中的维护投入。

●安全性采取物理、网络、应用全方位的安全策略,确保系统不受外来的非法入侵是本系统必须着重考虑的重要因素,同时亦照顾到内部访问级别授权等各种技术。

●可靠性系统对主要的设备实行备份,以保证系统能够稳定、可靠地正常运行。

●扩展性系统的设计考虑了以后业务的扩展和系统扩容,充分保护系统的投资。

●经济性在保证实现系统功能,保证系统先进性、可靠性、扩展性的基础上,尽量降低系统的成本,做到物美价廉。

●可维性系统的设计与建设都考虑到要方便维护,包括硬件的维护、软件的维护(更改、升级等)和网络的维护。

●支撑能力系统的软/硬件配置对新业务提供强有力的支撑能力,提供应用软件开发接口,让使用者十分简便地进行二次开发。

三、C/S模式体系架构C/S模式的软件系统体系结构,可以充分利用两端硬件环境的优势,将任务合理分配到client端和server端来实现,降低了通讯开销。

最简单的C/S体系结构的数据库应用,由客户应用程序和数据库服务程序两部分组成,使得数据库真正变成公共、专业化的仓库,受到独立的专门管理。

而本系统研制的终端机可以设置在市场各个公共场所,通过网络连接信息系统数据库,使用户通过本系统实现自助查询功能。

由于C/S形式的进一步成熟及向分布式的WEB应用发展的趋势,使本课题选择C/S模式成为可行。

第二节、系统相关技术一、数据库并发处理技术本系统考虑信息系统的数据库将提供给前台多个客户端使用,因此在本系统中采用了ADO来处理数据库中的并发操作。

数据库中的锁定是指DBMS 通过该进程限制多用户环境中对行的访问。

当一行或一列被独占锁定时,不允许其他用户在释放锁定之前访问锁定的数据。

这确保了两个用户无法同时更新一行中的同一列。

从资源角度而言,锁定的成本可能非常高昂,只有在需要保持数据完整性的情况下才应当使用此功能。

在每秒有数百或数千用户试图访问某个记录的数据库(例如连接到 Internet 的数据库)中,不必要的锁定将很快导致应用程序性能的下降。

因此选择适当的锁定选项来控制数据源和 ADO 游标库管理并发性的方式将很好的解决这个问题,减轻网络传输的负荷,有利提高处理速度。

二、机器翻译算法在翻译机制方面,研究了现有的各种机器翻译方法,比较各自的优缺点并结合现有资源和工作实际,提出了基于转换与基于实例模式相结合(TB-EPB)的机器翻译方法。

该方法继承了基于转换方法的稳定性和基于实例方法译文质量高的特点。

基于实例模式方法是基于实例方法的扩展,在词法和浅层句法分析后,输入句子与实例模式库在多个层次上匹配,并产生译文。

评测和实验结果显示,译文质量综合评价值达到87.5,平均翻译速度为63.64单词/秒,译文正确率达到88%。

设计了一个基于规则的词法分析器。

结合系统模型,研究并设计了一个基于规则的词法分析器,以及贯穿整个机器翻译过程的语言学知识源——综合词典。

设计了词条检索的哈希算法,用形式语言描述了与该词法分析器相关的各种规则知识和数据结构。

提出了基于粗糙集的基本名词短语识别方法。

基本名词短语(BaseNP)识别是自然语言浅层分析的主要研究内容之一。

基于粗糙集的基本名词短语识别方法用粗糙集理论解决BaseNP标注问题,并在此基础上用一个有限状态转换器实现BaseNP识别。

结果表明,基于粗糙集的方法能够发现特征问的依赖性,并从整体上优化规则,BaseNP识别的Fβ值达到92.32%。

第三节、外围设备分析一、触摸屏触摸屏经历了从低档向高档发展的历程。

从红外屏、四线阻屏到电容屏,现在又发展到声波触摸屏、五线电阻触摸屏,性能越来越可靠,技术越来越先进。

而且触摸屏的信用范围非常广阔,例如公共信息的查询,如电信局、税务局、银行、电力等部门的业务查询。

目前触摸屏产品在中国已开始形成了产业,这就为本系统提供了宽阔的触摸屏选择空间,并使实现方便的人机交互成为可能。

二、UPS电源UPS电源伴随着计算机行业的发展而产生,并且已拥有相对成熟的技术和产品,例如:APC、美国德州山特、西门子、台达、KSTAR/科士达、四通等。

目前许多厂商的产品尤其是中大功率产品除了能够配合电源管理软件实现网络化的本地监控外,还可实现Web远程监控。

本系统属于C/S形式的体系架构,在数据操作上要确保数据的正确性及完整性,所以在出现断电的情况下,UPS的自动稳压、断电保护等功能,就能确保给系统留出一定的时间进行相应的断电处理。

相关主题