当前位置:文档之家› 语音信号处理复习题

语音信号处理复习题

语音信号处理复习题1 由下面的WAV文件读出语音的编码信息:52 49 46 46 A4 9A 7B 01 57 41 56 45 66 6D 74 2010 00 00 00 01 00 02 00 44 AC 00 00 10 B1 02 0004 00 10 00 64 61 74 61 80 9A 7B 01 42 FF 35 FCE2 FE 07 00 E7 FE AF 03 5F FF 65 01.....................2 画出语音信号的产生模型,简述语音的产生过程。

语音的形成过程—空气由肺部排入喉部,经过声带进入声道,最后由嘴辐射出声波,形成语音。

3 为生么语音信号要进行“短时”分析。

答:语音信号特性是随时间变化的,是一个非平稳的随机过程,但在一个短时间范围内其特性基本保持不变,即语音信号具有“短时平稳性”,因而可将语音信号看成准平稳过程,对其进行短时分析.4 语音信号的时域分析方法有那些?答:短时能量,短时平均过零率,短时自相关函数5 语音信号频率范围是多少?答:语音信号的频率大约在20Hz~20KHz。

6 什么是浊音的基音频率(F0)?男性、女性和儿童的F0大致分布在什么范围。

答:浊音的基音频率(F0):声带张开和闭合一次的时间的倒数。

由声带的尺寸、特性和声带所受张力决定。

F0的大小决定了声音的高低,称为音高。

男性的F0大致分布在:60-200Hz,女性和儿童的F0大致分布在:200-450Hz7 可以认为多长的时间范围内,语音信号是平稳信号。

答:10-30ms8 电话语音的采样率为8kHz;纯语音在进行计算机录入时,一般采样率在15kHz~20kHz左右;音乐的采样率可以高达44kHz。

9 如何利用语音信号的时域分析方法进行清、浊判断。

答:1、短时能量分析依据:是基于语音信号幅度随时间变化》清音段幅度小,其能量集中高频段;浊音段幅度较大,其能量集中低频段;2、平均幅度分析的依据:清音段幅度小,浊音段幅度较大。

3、短时平均过零率:浊音平均过零率低,集中在低频段;清音过零率高,集中在高频段。

4、短时自相关函数:浊音语音的自相关函数具有一定的周期性;清音语音的自相关函数不具有周期性,类似噪声,有点如语音信号本身10 通过对语音信号进行分析,可以提取到那些特征参数(列举出三个以上)。

答:短时能量和短时平均幅度,短时平均过零率,短时自相关函数11 人的发音器官包括那些。

答:人体发音器官—肺、气管、喉(包括声带)和声道。

12、傅立叶分析在信号处理中有什么意义?答:1、它是分析线性系统和平稳信号和稳态信号特性的强有力手段。

2、以复指数函数为基函数的正交变换,理论完善,计算方便,概念容易理解。

3、傅里叶分析可以使信号的某些特性变得很明显。

语音信号的频谱具有非常明显的语言学意义,可以获得重要的语音特征(如共振峰频率和带宽等),13 文语转换系统(TTS)属于那种语音合成系统。

答:规则语音合成系统14 语音的共振峰是如何形成的?答:气流流过声道时犹如通过了一个具有某种谐振特性的腔体,放大某些频率,在频谱上形成相应位置的峰起,称为共振峰。

15 同态信号处理也称为同态滤波,画出同态滤波中特征系统框图16 语音合成的分类及特点,举出一个语音信号参数合成的例子。

1、波形合成法特点:简单/小词汇(报站器)2、参数合成法特点:可以合成大词汇(字典)3、规则合成法特点:实现难度较大如TTS系统(文语转换系统)17 画出实现语音信号时频语音增强功能的框图。

18 什么是语音信号的“短时”处理方法。

答:语音信号的能量是一种随时间变化的信号,可能是浊音激励也可能是清音激励,浊音的基音周期以及信号幅度等语音参数也都对时间变化,但这种变化时缓慢的,在一小段时间内10-30ms,语音信号近似不变。

于是,我们把变化的语音信号分成一些相继的段时间段来处理。

而每一段时间具有固定的特性,这种方法称为“短时”处理方法。

19 语音信号短时能量分析的用途答: 1、区分清音段与浊音段; 2、区分声母和韵母;3、在高信噪比下,区分无声与有声的分界;4、区分连字的边界;5、用于语音识别。

20 短时自相关函数的物理意义,性质,作用。

答:物理意义确定两个信号在时域内的相似性,用于研究信号本身。

表示方法h(n)性质:(1)对称性 R(k)= R(-k)(2)在k = 0处为最大值,即对于所有k来说,|R(k)|≤R(0)(3)对于确定信号,值R(0)对应于能量,而对于随机信号,R(0)对应于平均功率作用:a.区分清/浊音浊音语音的自相关函数具有一定的周期性。

清音语音的自相关函数不具周期性,类似噪声,与其本身相似。

b.估计浊音语音信号的周期,即估计基音周期。

21利用短时自相关函数进行语音分析时要注意的问题22 语音信号傅里叶分析的作用(p41)在语音信号处理中,傅立叶表示在传统上一直起主要作用。

其原因一方面在于稳态语音的产生模型由线性系统组成,此系统被一随时间作周期变化或随机变化的源所激励,因而系统输出频谱反映了激励与声道频率响应特性。

另一方面,语音信号的频谱具有非常明显的语言声学意义,可以获得某些重要的语音特征。

同时,语音的感知过程与人类听觉系统具有频谱分析功能是密切相关的23 短时傅里叶变换的滤波器的解释。

()()()()mnhkmxmxkRmkn∑+∞-∞=--=24 取样率的基本概念(1)时域取样率的基本概念。

(2)频域取样率的基本概念。

(3)总取样率的基本概念25 从如下语音信号的短时谱中能得到什么信息?答:1、快速变化,由激励信号引起的;2、慢速变化,声道滤波器的共振峰引起的;3、采用汉明窗得到的短时频谱较较矩形窗平滑。

26 倒谱分析的作用答:(1)区分清/浊音(2)求浊音的基音周期, 可以得到浊音的激励信号。

(3)得到声道的冲激响应h(n)27 简述语音信号的特点,基频、共振峰是什么含义?答:特点:语音一般由清音和浊音组成,语音信号具有短时平稳性。

基音频率:浊音的声带振动基本频率。

是声带张开和闭合一次时间的倒数。

共振峰:当元音激励进入声道时会引起共振特性,产生一组共振频率,称为共振峰频率或简称共振峰。

共振峰为频谱中明显的几个凸起点,它的出现频率与声道的谐振频率相对应。

28 线性预测的基本思想。

答:一个语音的抽样能够用过去若干个语音抽样的线性组合来逼近。

通过时实际语音抽样和线性预测抽样之间差值的平方和(在一个有限间隔上)达到最小值,即进行最小均方误差的逼近,能够决定唯一的一组预测数据,而预测系数就是线性组合中所用的加权系数。

29 线性预测分析如何用于语音编码和语音合成。

答:编码:预测误差e(n)就是激励信号G*u(n),预测系数{ak}就是声道虑波器的系数{dk}.ak=dk,e(n)=G*u(n)线性预测分析可以对生成模型的增益参数G和滤波器系数{dk}进行直接和高效率的计算。

合成:30 简述矢量量化的过程。

答:(书上定义):将语音信号波形的K个样点的每一帧,或有K个参数的每一参数帧,构成K维空间中的一个矢量,然后对这个矢量进行量化。

(课件上说):当给矢量量化器输入一个任意矢量Xi进行矢量量化时,矢量量化器首先判断它属于哪个子空间,然后输出该子空间的代表矢量Yj.矢量量化过程就是用Yj代替Xi的过程。

Yj=Q(Xi) 1<j<J 1<i<N31 通常线性预测分析设定的模型是什么模型。

答:全级点模型。

32 什么是矢量的失真测度?常用的失真测度有哪些答:失真测度(距离测度)就是将输入矢量Xi用码本重构矢量Yj来表征时所产生的误差或失真的度量方法,它可以描述两个或多个模型矢量之间的相似程度。

常用的失真测度为欧氏距离测度。

33 矢量量化器最佳设计的两个条件?答:最佳划分,最佳码本34 初始码书的生成方法随机选取法:从训练序列中随机选取J个矢量作为初始码字,从而构成初始码本。

分裂法:35 短时能量和短时过零率的的用途。

答:短时能量:1、区分清音段与浊音段;2、区分声母和韵母;3、在高信噪比下,区分无声与有声的分界;4、区分连字的边界;5、用于语音识别。

过零率: 1、区分清音和浊音:浊音平均过零率低,集中在低频端;轻音过零率高,集中在高频端。

2、从背景噪声中找出是否有语音,以及语音的起点。

36 对语音信号进行处理时为什么要进行分帧。

答:语音信号短时平稳,要将语音信号划分为很多短时的语音段,而每个短时的语音段称为一个分析帧。

这样,对语音信号进行分针处理就相当于对特征固定的持续信号进行处理。

经过处理,语音信号就已经被分割成一帧一帧的加过窗函数的短时信号,然后再把每一个短时语音帧看成平稳的随机信号,利用数字信号处理来提取语音特征参数。

37 为什么端点检测有重要意义?答:端点检测:从包含语音的一段信号中确定出语音的起点和终点。

有效的端点检测不仅能使处理的时间减到最小,而且能排除无声段的噪声干扰。

实验表明:端点检测的正确与否影响到识别率的高低。

语音端点检测的方法:短时能量和短时过零率。

38 什么叫LBG算法,怎样设计初始码本,并用来训练码本。

LBG算法是一种递推算法,从一个事先选定的初始码本开始迭代。

把训练序列按照码本中的元素根据最邻近准则分组,对每一分组找质心,得到新的码本,又作为初始码本,再进行分组,重复上述过程,直到系统性能满足要求和不再有明显的改进为止。

39 为什么说语音信号可以看成隐马尔科夫过程,隐马尔科夫过程有哪些模型参数。

HMM包含两个随机过程,三个概率矩阵,一个输出概率答:隐马尔可夫模型:只能观察到输出符号序列(ab),而不能观测到状态之间如何转移(状态转移概率)和状态的分布(状态的概率)。

而语音信号是一个可观察的序列:它是由大脑中的思维(不可观测)及语言需要和语法知识(不可观测)所发出的参数流。

40 列举常用语音编码速率的值。

答: 64kbit/s; PCM; 32kbit/s; ADPCM;4.8kbit/s; CELP; 2.4kbit/s; LPC声码器41波形编码、参数编码与混合编码各有什么优缺点。

答:波形编码:话音质量高,编码速率高。

参数编码:编码速率低,自然度低,对环境噪声敏感。

混合编码:质量高和速率低.42 在语音编码中,如何使用自适应技术。

答:利用自适应的思想改变量化间隔(量阶)的大小,即用小的量化间隔去编码小的差值,使用大的的量化间隔去编码大的差值43 语音合成的目的是什么?它主要分为哪几类?比较它们的优缺点。

答:目的:让机器说话,达到一定的音质与可懂度(或产生与人类通信相关的语音)(1)、波形合成法。

优点:合成音质好;缺点:存储空间大。

(2)、参数合成法。

优点:存储空间小;缺点:合成音质较差。

(3)、规则合成法。

优点:可以合成无限词汇,存储量小;缺点:合成音质效果较差44在TTS系统中,如何进行语音合成中的韵律控制。

相关主题