当前位置:文档之家› 数字语音合成

数字语音合成

数字语音信号处理
语音合成


一、概 述 二、语音合成的原理及分类 三、语音合成的方法
一、概 述
语音合成是人机语声通信的一个重要组成部分,解 决让机器像人那样说话的问题。 最早的合成器是1835年由W.von Kempelen发明,经 Weston改进的机械式会讲话的机器。而最早的电子式语 音合成器也是1939年Homer Dudley发明的声码器,它不 是简单的模拟人的生理过程,而是通过电子线路来实现 基于语音产生的源-滤波器理论。
TTS系统的构成
对输入文本进行分析切割出字词以后,通过语音合 成方法把这些字词的发音合成出来,并串接起来,通过 韵律调整,就可以得到较为自然的语句的发音。
谢 谢
Return~
系统中存储的是音素的声学参数,以及由音素组 成音节、由音节组成词、由词组成句子的规则;控制 音调、轻重音等韵律的各种规则。 规则合成方法的语音库的存储量更小,这是以牺 牲音质为代价的,这种方式涉及到许多语音学和语音 学模型,系统结构复杂。目前合成规则还不完善。
三、语音合成的方法
1、共振峰合成法 利用语音信号的生成模型,将声道视为一个谐振 腔,利用腔体的谐振特性,共振峰频率及其带宽,为 此构造一个共振峰滤波器。对激励信号进行处理,可 到合成语音。挑选 Fra bibliotek合回放
合成 语音
合成单元越大, 合成的自然度越好,系统结构简单 ,价格低廉,合成语音的数码率较大,存储量也大,因而 合成的词汇有限。在自动报时、报号、报站或报警等装置 中,多采用这种技术。
2.参数合成 参数合成法也称为分析合成法。 参数合成法有:发音器官参数合成和声道模型参 数合成。 发音器官参数合成法: 是对人的发音过程直接进行模拟。它定义了唇、 舌、声带的相关参数,如唇开口度、舌高度、舌位置 、声带张力等,由发音参数估计声道截面积函数,进 而计算声波。
在语音合成技术发展中,早期研究主要是采用参数 合成方法。 1990年提出的基音同步叠加PSOLA方法,使基于时 域波形拼接方法合成的语音音色和自然度大大提高。 我国的汉语语音合成研究从80年代初就基本上与国 际研究同步发展。大致也经历了共振峰合成、LPC合成 到应用PSOLA技术的过程。
二、语音合成的原理及分类
参数合成方法 优点:音库一般较小,并且整个系统能适应的韵 律特征的范围较宽,这类合成器比特率低,音质适中. 缺点:算法复杂,参数多,并且在压缩比较大时, 信息丢失亦大,合成出的语音总是不够自然、清晰。 为了改善音质,近几年发展了混合编码技术,以 改善激励信号的质量。
3.规则合成 这种合成方法以通过语音学规则来产生任何语音为目 的,规则合成系统存储的是较小的语音单位的声学参数以 及由音素组成音节,再由音节组成词或句子的各种规则。 当输入字母符号时,合成系统利用规则自动将它们转换为 连续的语音声波。 由于语音中存在协同发声效应,单独存在的元音和辅 音与连续发音中的元音和辅音不同,所以合成规则是在分 析每一语音单元出现在不同环境中的协同发音后,归纳其 规律而制定的。
另一种波形合成法是波形编辑合成,它把波形 编辑技术用于语音合成,通过选取音库中采取自然 语言的合成单元的波形,对这些波形进行编辑拼接 后输出。它采用语音编码技术,存储适当的语音基 元,合成时,经解码、波形编辑拼接、平滑处理等 输出所需的短语、语句或段落。
语音库 输入 (语音单元) 语音 语音的波形 编码
2、线性预测合成法(LPC编码) 将语音生成模型简化,将辐射、声道和声门激励进行 组合,用一个时变数字滤波器来表示。
格型滤波器语音合成技术框图
3、TTS合成技术(文语转换系统) 文-语转换是语音合成技术的延伸,它能把计算机 内的文体转换成连续自然的语音流。 若采用这种方法输出语音,应预先建立语音参数 数据库、发音规则库等。 需要输出语音时,系统按需求先合成语音单元, 再按语音学规则或语言学规则,连接成自然的语流。 文-语转换的参数库不随发音时间增长而加大;但规 则库却随语音质量的要求而增大。
1、波形合成 波形编码合成法是一种波形合成法,类似于语音 编码中的波形编解码方法,该方法直接把要合成的语 音的发音波形进行存储或者进行波形编码压缩后存储 ,合成重放时再解码组合输出。 特点:所需的存储容量太大,词汇量不能很大; 相对简单,通常只能合成有限词汇的语音段。目前用 于自动报时、报站和报警等。
相关主题