当前位置:文档之家› 语音合成的原理及分类共52页

语音合成的原理及分类共52页


i(z)G •i 5 11b iz 1 1ciz 2
式中,G为增益因子。
一个五个极点的共振峰级联模型如下
激励源 G V1
V2 ---- V5
辐射模型 语音
17.05.2020
图9.2 共振峰级联模型
13
数字语音处理及MATLAB仿真 张雪英编著
9.3.2 并联型共振峰模型
在并联型模型中,输入信号先分别进行幅度 调节,再加到每一个共振峰滤波器上,然后将各 路的输出叠加起来。
17.05.2020
1
数字语音处理及MATLAB仿真 张雪英编著
在语音合成技术发展中,早期研究主要是采 用参数合成方法。
1990年提出的基音同步叠加PSOLA方法,使 基于时域波形拼接方法合成的语音音色和自然度 大大提高。
我 国 的 汉 语 语 音 合 成 研 究 从 80 年 代 初 就 基 本 上与国际研究同步发展。大致也经历了共振峰合 成、LPC合成到应用PSOLA技术的过程。
大(数千字) LPC,LSP,共振峰
2.4~9.6 kbit/s
15秒~100秒
100秒~7分
音节、词组、句 子
简单
存储器
音节、词组、句子
比较复杂 存储器和处理器
按规则合成方式 中 低 无限
LPC,LSP共振峰 50~75 kbit/s
无限
音素、双音素、音 节 复杂
处理器
17.05.2020
9
数字语音处理及MATLAB仿真 张雪英编著
17.05.2020
6
数字语音处理及MATLAB仿真 张雪英编著
9.2.3 规则合成法
规则合成方法:一种高级的合成方法,通过 语音学规则产生语音,可以合成无限词汇的语句。 合成的词汇表不是事先确定,系统中存储的是最 小的语音单位的声学参数,以及由音素组成音节、 由音节组成词、由词组成句子和控制音调、轻重 音等韵律的各种规则。
其传递函数为:
R
br z r
17.05.2020
5
数字语音处理及MATLAB仿真 张雪英编著
参数合成方法的优点:音库一般较小,并且整 个系统能适应的韵律特征的范围较宽,这类合成器 比特率低,音质适中。
缺点:算法复杂,参数多,并且在压缩比较大 时,信息丢失亦大,合成出的语音总是不够自然、 清晰。
为了改善音质,近几年发展了混合编码技术, 以改善激励信号的质量。
算法中,用于波形拼接和韵律控制的较有代 表性的算法是基音同步叠加PSOLA技术。
17.05.2020
7
数字语音处理及MATLAB仿真 张雪英编著
9.2.3 规则合成法
基音同步叠加PSOLA技术主要特点: 在语音波形片断拼接之前,首先根据语义,用 PSOLA 算 法 对 拼 接 单 元 的 韵 律 特 征 进 行 调 整 , 使 合成波形既保持了原始语音基元的主要音段特征, 又使拼接单元的韵律特征符合语义,从而获得很高 的可懂度和自然度。
数字语音处理及MATLAB仿真 张雪英编著
9.1 概述
语音合成是人机语声通信的一个重要组成部分, 解决让机器像人那样说话的问题。
最早的合成器是1835年由W.von Kempelen发 明 , 经 Weston 改 进 的 机 械 式 会 讲 话 的 机 器 。 而 最 早的电子式语音合成器也是1939年Homer Dudley 发明的声码器,它不是简单的模拟人的生理过程, 而是通过电子线路来实现基于语音产生的源-滤波 器理论。
9.3.1 级联型共振峰模型
在该模型中,声道被认为是一组串联的二阶谐 振器,共振峰滤波器首尾相接,其传递函数为各个共 振峰的传递函数相乘的结果。
17.05.2020
12
数字语音处理及MATLAB仿真 张雪英编著
五个极点的共振峰级联模型传递函数为:
即:
(z)
G
10
1 ak z k
k 1
5 (z)G • i 1
9.3 共振峰合成法
共振峰合成理论中声道参数、声道谐振特性 一直是研究的重点。
共振峰合成模型是把声道视为一个谐振腔, 利用腔体的谐振特性,如共振峰频率及带宽,以 此为参数构成一个共振峰滤波器。因为音色各异 的语音有不同的共振峰模式,以每个共振峰频率 及其宽带为参数,可以构成一个共振峰滤波器。
17.05.2020
17.05.2020
2
数字语音处理及MATLAB仿真 张雪英编著
9.2 语音合成的原理及分类
9.2.1 波形合成法
波形编码合成法是一种波形合成法,类似于语 音编码中的波形编解码方法,该方法直接把要合成 的语音的发音波形进行存储或者进行波形编码压缩 后存储,合成重放时再解码组合输出。
特点:所需的存储容量太大,词汇量不能很大; 相对简单,通常只能合成有限词汇的语音段。目前 用于自动报时、报站和报警等。
17.05.2020
4
数字语音处理及MATLAB仿真 张雪英编著
9.2.2 参数合成法
参数合成法也称为分析合成法。 参数合成法有:发音器官参数合成和声道模型 参数合成。
发音器官参数合成法: 是对人的发音过程直接进行模拟。它定义了唇、 舌、声带的相关参数,如唇开口度、舌高度、舌位 置、声带张力等,由发音参数估计声道截面积函数, 进而计算声波。 缺点:合成语音的质量不理想。
17Байду номын сангаас05.2020
8
数字语音处理及MATLAB仿真 张雪英编著
表9.1 三种语音合成方式的比较
项目 语音 可懂度 质量 自然度
词汇量 合成方法
数码率 1兆比特可合成
的语音长度
合成基元
装置 硬件主体
波形合成方式 高 高
小(500字以下) PCM,ADPCM 9.6~64kbit/s
参数合成方式 高 中
17.05.2020
3
数字语音处理及MATLAB仿真 张雪英编著
另一种波形合成法是波形编辑合成,它把波形 编辑技术用于语音合成,通过选取音库中采取自然 语言的合成单元的波形,对这些波形进行编辑拼接 后输出。它采用语音编码技术,存储适当的语音基 元,合成时,经解码、波形编辑拼接、平滑处理等 输出所需的短语、语句或段落。
10
数字语音处理及MATLAB仿真 张雪英编著
9.3 共振峰合成法
共振峰语音合成器的构成原理: 将多个共振峰滤波器组合起来模拟声道的传 输特性,对激励声源发生的信号进行调制,经过 辐射得到合成语音。 基于共振峰的理论有三种实用模型。
17.05.2020
11
数字语音处理及MATLAB仿真 张雪英编著
相关主题