当前位置：文档之家› 数字语音合成

数字语音合成

数字语音信号处理
语音合成
目
录
一、概述二、语音合成的原理及分类三、语音合成的方法
一、概述
语音合成是人机语声通信的一个重要组成部分，解决让机器像人那样说话的问题。最早的合成器是1835年由W.von Kempelen发明,经 Weston改进的机械式会讲话的机器。而最早的电子式语音合成器也是1939年Homer Dudley发明的声码器，它不是简单的模拟人的生理过程，而是通过电子线路来实现基于语音产生的源-滤波器理论。
TTS系统的构成
对输入文本进行分析切割出字词以后，通过语音合成方法把这些字词的发音合成出来，并串接起来，通过韵律调整，就可以得到较为自然的语句的发音。
谢谢
Return~
系统中存储的是音素的声学参数，以及由音素组成音节、由音节组成词、由词组成句子的规则；控制音调、轻重音等韵律的各种规则。规则合成方法的语音库的存储量更小，这是以牺牲音质为代价的，这种方式涉及到许多语音学和语音学模型，系统结构复杂。目前合成规则还不完善。
三、语音合成的方法
1、共振峰合成法利用语音信号的生成模型，将声道视为一个谐振腔，利用腔体的谐振特性，共振峰频率及其带宽，为此构造一个共振峰滤波器。对激励信号进行处理，可到合成语音。挑选 Fra bibliotek合回放
合成语音
合成单元越大，合成的自然度越好，系统结构简单，价格低廉，合成语音的数码率较大，存储量也大，因而合成的词汇有限。在自动报时、报号、报站或报警等装置中，多采用这种技术。
2.参数合成参数合成法也称为分析合成法。参数合成法有：发音器官参数合成和声道模型参数合成。发音器官参数合成法：是对人的发音过程直接进行模拟。它定义了唇、舌、声带的相关参数，如唇开口度、舌高度、舌位置、声带张力等，由发音参数估计声道截面积函数，进而计算声波。
在语音合成技术发展中，早期研究主要是采用参数合成方法。 1990年提出的基音同步叠加PSOLA方法，使基于时域波形拼接方法合成的语音音色和自然度大大提高。我国的汉语语音合成研究从80年代初就基本上与国际研究同步发展。大致也经历了共振峰合成、LPC合成到应用PSOLA技术的过程。
二、语音合成的原理及分类
参数合成方法优点：音库一般较小，并且整个系统能适应的韵律特征的范围较宽，这类合成器比特率低,音质适中. 缺点:算法复杂，参数多，并且在压缩比较大时, 信息丢失亦大，合成出的语音总是不够自然、清晰。为了改善音质，近几年发展了混合编码技术，以改善激励信号的质量。
3.规则合成这种合成方法以通过语音学规则来产生任何语音为目的，规则合成系统存储的是较小的语音单位的声学参数以及由音素组成音节，再由音节组成词或句子的各种规则。当输入字母符号时，合成系统利用规则自动将它们转换为连续的语音声波。由于语音中存在协同发声效应，单独存在的元音和辅音与连续发音中的元音和辅音不同，所以合成规则是在分析每一语音单元出现在不同环境中的协同发音后，归纳其规律而制定的。
另一种波形合成法是波形编辑合成，它把波形编辑技术用于语音合成，通过选取音库中采取自然语言的合成单元的波形，对这些波形进行编辑拼接后输出。它采用语音编码技术，存储适当的语音基元，合成时，经解码、波形编辑拼接、平滑处理等输出所需的短语、语句或段落。
语音库输入（语音单元）语音语音的波形编码
2、线性预测合成法(LPC编码) 将语音生成模型简化，将辐射、声道和声门激励进行组合，用一个时变数字滤波器来表示。
格型滤波器语音合成技术框图
3、TTS合成技术(文语转换系统) 文-语转换是语音合成技术的延伸，它能把计算机内的文体转换成连续自然的语音流。若采用这种方法输出语音，应预先建立语音参数数据库、发音规则库等。需要输出语音时，系统按需求先合成语音单元，再按语音学规则或语言学规则，连接成自然的语流。文-语转换的参数库不随发音时间增长而加大；但规则库却随语音质量的要求而增大。
1、波形合成波形编码合成法是一种波形合成法，类似于语音编码中的波形编解码方法，该方法直接把要合成的语音的发音波形进行存储或者进行波形编码压缩后存储，合成重放时再解码组合输出。特点：所需的存储容量太大，词汇量不能很大；相对简单，通常只能合成有限词汇的语音段。目前用于自动报时、报站和报警等。

e商务文档

数字语音合成

相关文档推荐：