重要声明版权声明版权所有 © 2008, 安徽科大讯飞信息科技股份有限公司,保留所有权利。
商标声明安徽科大讯飞信息科技股份有限公司的产品是安徽科大讯飞信息科技股份有限公司专有。
在提及其他公司及其产品时将使用各自公司所拥有的商标,这种使用的目的仅限于引用。
本文档可能涉及安徽科大讯飞信息科技股份有限公司的专利(或正在申请的专利)、商标、版权或其他知识产权,除非得到安徽科大讯飞信息科技股份有限公司的明确书面许可协议,本文档不授予使用这些专利(或正在申请的专利)、商标、版权或其他知识产权的任何许可协议。
不作保证声明安徽科大讯飞信息科技股份有限公司不对此文档中的任何内容作任何明示或暗示的陈述或保证,而且不对特定目的的适销性及适用性或者任何间接、特殊或连带的损失承担任何责任。
本手册内容若有变动,恕不另行通知。
本手册例子中所用的公司、人名和数据若非特别声明,均属虚构。
未得到安徽科大讯飞信息科技股份有限公司明确的书面许可,不得为任何目的、以任何形式或手段(电子的或机械的)复制或传播手册的任何部分。
保密声明本文档(包括任何附件)包含的信息是保密信息。
接收人了解其获得的本文档是保密的,除用于规定的目的外不得用于任何目的,也不得将本文档泄露给任何第三方。
本软件产品受最终用户许可协议(EULA)中所述条款和条件的约束,该协议位于产品文档和/或软件产品的联机文档中,使用本产品,表明您已阅读并接受了EULA的条款。
版权所有© 安徽科大讯飞信息科技股份有限公司Copyrights © Anhui USTC iFLYTEK CO., LTD.目录前言 (1)1产品应用概述 (2)1.1小巧手机,强大语音——来电信息语音播报 (2)1.2小巧手机,强大语音——短信语音播报 (2)1.3小巧手机,强大语音——屏幕操作语音播报 (3)1.4系统提示 (3)1.5手机词典 (3)1.6手机导航 (3)1.7手机电子书 (4)2功能特性 (5)2.1多种代码页、广泛文本范围,全面支持 (5)2.1.1支持代码页 (5)2.1.2文本朗读范围 (5)2.2强大的智能处理能力,语随文动 (5)2.2.1数字和号码处理 (5)2.2.2多音字处理 (6)2.2.3常见符号处理 (6)2.2.4灵活标注 (6)2.3多语种多发音人,多选择、更丰富 (7)2.3.1语种 (7)2.3.2发音人 (7)2.3.3中英混读 (7)2.4兼容平台广泛,适应性强 (7)2.4.1完全与平台无关 (7)2.4.2资源占用低 (8)2.4.3资源放在存储卡上,仍可正常运行 (8)2.4.4播音设备兼容 (8)3技术指标 (9)3.1版本整体特性 (9)3.2发音效果指标 (9)3.3资源占用情况 (10)3.3.1内存占用 (10)3.3.2资源占用 (10)4附属产品 (11)5联系我们 (12)前言安徽科大讯飞信息科技股份有限公司的嵌入式事业部凭借着深厚的语音技术,积累了多年的嵌入式应用开发经验,在系统资源占用、语音合成效果、系统移植性等多个关键点取得了突破性的进展。
我们拥有一支强大的语音技术团队,一直致力于语音技术的研发和产品化工作,以确保产品具备目前最先进、最稳定的语音技术。
语音技术团队中的数据制作队伍历史悠久、经验丰富。
多年从事语音数据采集、整理、处理工作。
其所涉及的数据,范围广泛、数量庞大,极大地满足当前TTS技术的飞速发展,是我们坚强、可靠的后备力量。
成熟的研发队伍拥有一群长期不懈从事技术研发、产品完善的高科技技术人员。
他们技术背景深厚,经验丰富,对语音技术有其独特的见解和认识,并且孜孜不倦,是我们不断创新、不断前进的中流砥柱。
与此同时,我们还与科大讯飞研究院、中国科技大学联合实验室、清华大学联合实验室等多家专业语音研究机构始终保持着密切协同工作,确保最先进的技术成果能及时体现在产品中。
我们集中所有研发力量和现有技术开发出Aisound4系列,期待为您的产品带来价值提升、为您的使用提供更优质的服务。
1产品应用概述Aisound 4.9手机版是安徽科大讯飞信息科技股份有限公司基于其全球领先的语音合成技术基础上,开发的一款专门针对手机领域的语音合成软件模块。
1.1小巧手机,强大语音——来电信息语音播报小巧的手机现如今已经渗透进人们的日常生活的每个角落,并且功能和性能不断扩大和强化。
语音,作为一种最人性化的服务,也越来越多地融入手机的应用中去。
日常生活中:驾车、做家务,或对于视力不佳人群,在有限、狭小的手机屏幕上阅读,获得信息是比较麻烦的,甚至会出现一定的危险(例如驾车时)。
这时,一通来电,如果有语音为用户播报来电人姓名、信息号码等,会极大方便使用。
而仅靠传统录音的方式,来电信息播报也会变成一项繁重的工程。
手机需要所有联系人的语音还有号码的录音。
这样同时会出现两个问题:一,如果有新添加的联系人,用户还需要录音;二,手机本来资源空间就非常有限,哪里有这么大的空间存放这些录音数据,并且这些数据还会因联系人的增长而不断地扩大。
利用Aisound 4.9 手机版语音引擎,以上的问题迎刃而解。
集成了Aisound 4.9 手机版在手机中,手机的来电信息,无论是电话本中的联系人,还是陌生的来电号码,Aisound4.9 手机版都可以帮您合成,为您播报信息。
省去了在不方便的情况下,查看手机的烦恼。
并且它占用资源小,也不会随信息文本的增大而增大。
有了Aisound 4.9 手机版就等于给手机按了一个金嗓子。
1.2小巧手机,强大语音——短信语音播报短信的使用在手机使用中占据了重要的位置,而一些情况下,如驾车、家务过程中不方便查看;还有一些老年人、残疾人,视力不佳,查看短信非常麻烦。
这时候如果手机能够自动为用户朗读短信,就会减少这些麻烦,方便使用,使手机更加人性化。
因为短信的文本信息无法预知、千变万化,普通的真人录音途径根本无法实现短信朗读。
而Aisound 4.9手机版语音合成引擎则能轻松满足。
所有文本,无论中文、英文都能自如播报。
1.3小巧手机,强大语音——屏幕操作语音播报对于盲人和一些视力不佳的手机用户,掌握手机屏幕的当前信息是一件困难而麻烦的事情。
传递屏幕信息的一个重要途径就是用语音朗读出来,每切换一面屏幕,进入一个功能,手机都能自动地将当前屏幕上的内容为用户语音提示出来。
这也是手机设计上,考虑用户使用方便性的一个方向。
Aisound 4.9 手机版可以对屏幕提供可靠的语音服务。
屏幕上出现任何信息、功能都可以及时语音提示。
1.4系统提示对于手机设备中配备的其它功能,如菜单播报、开机问候语、语音提醒等等这些功能,不论是固定文本还是动态文本,Aisound 4.9手机版都可以帮助发音,省去了真人录音的工作及其占用的宝贵空间,还解决了真人发音都无法应对处理的动态文本问题。
1.5手机词典现在的手机,除了基本的应用外,也集成了越来越多附加功能,以增强竞争力。
其中电子词典是热门的应用之一。
电子词典如果能在查字词的同时给出字词的示例读音,字词的学习会更加直接和高效,这也是电子词典的一个必然发展方向。
如何让词典中成千上万的字词都具备正确的读音呢?普通的真人预录音在有限的手机资源下,肯定不行。
Aisound 4.9 手机版则资源占用小,全面支持中文、英文朗读,所有问题迎刃而解。
1.6手机导航手机导航也是手机多种功能中的另一项热门应用。
利用手机,定位加导航,非常方便。
如果再加上语音导航服务,那功能就更强大、更完善了。
Aisound 4.9 手机版同样可以用来播报导航信息,让小巧的手机也能像专业导航仪一样专业。
1.7手机电子书闲暇时间收听电子书也是一种不错的娱乐选择。
对于存在手机里的电子小说、文章等这些大篇幅的电子类阅读内容,Aisound 4.9手机版同样可以有声有色地帮助用户朗读,让读书有机会变成听书,解放双眼的同时还能获得知识。
加入了Aisound 4.9手机版语音引擎,上面的所有应用的语音服务都能轻松实现。
Aisound 4.9手机版全面贴近手机应用,解决真人语音服务所不能解决的问题,资源占用小,并提供完善的语音服务和方案。
手机得力的语音助手——Aisound 4.9手机版将会使其功能更完善、更强大。
2功能特性2.1 多种代码页、广泛文本范围,全面支持2.1.1支持代码页我们支持所有常见的代码页:UTF-16;UTF-8(CP65001);简体中文GB18030(CP936,兼容GB2312-80、GBK);繁体中文Big5(CP950,支持HKSCS);Phonetic Plain(金山词霸音标字体)。
因此无论最终产品面向中国大陆还是香港、澳门、台湾,Aisound 4.9手机版都能顺利处理。
2.1.2文本朗读范围Aisound 4.9手机版支持中英文中字、词、句、篇章朗读,其中,中文支持Unicode 5.0标准定义的所有汉字。
Aisound 4.9手机版支持全/半角的字母、数字、号码、时间、日期、标点、常见符号的朗读,并且还根据实际应用场景判断使用中/英不同方式朗读。
Aisound 4.9手机版还可以自动判断、智能处理,合成如人名、地名、电话号码等等一些特殊应用场景文本。
2.2强大的智能处理能力,语随文动Aisound 4.9手机版在数据挖掘、人工智能领先技术的基础上,通过智能决策来处理文本,以保证其在统计意义上效果达到了最优。
Aisound 4.9手机版分别针对一下做重点处理:2.2.1数字和号码处理对于数字Aisound 4.9手机版会根据上下文和语境判断朗读方式,是朗读成数值还是号码,也可以根据需要强制指定处理方式。
另外如果朗读成号码,常见的电话号码、手机号码、小灵通号码、长途区号等等,Aisound 4.9 手机版都有专门研究和处理,让号码播报能按正常的规则和韵律朗读,符合通常人们念号码的习惯,更人性化,更方便理解。
还有一些号码的习惯念法(例如,“1”念成“幺”)Aisound 4.9手机版充分考虑。
2.2.2多音字处理汉语的词语、成语和一般语境中有不少多音字,Aisound 4.9手机版会根据上下文和语境判断这些多音字的读音,同时还考虑到人名、地名等一些特殊情况。
例如:例1:“重庆重工业重新崛起,成为其重要生产力。
”其中的“重”字是多音字,有时念“zhòng”,有时念“chóng”,TTS会自动判断,正确合成。
例2:“银行行长行走在人行道上。
”其中的“行”也是多音字,有念“háng”,也有念“xíng”的,TTS会自动判断处理。
2.2.3常见符号处理Aisound 4.9手机版会根据上下文和语境处理文本中各类常见标点符号,它们的念法或停顿的长短。