当前位置:文档之家› 语音信号时域特征参数提取

语音信号时域特征参数提取

学院:信电学院班级:电信102 姓名:徐景广学号:2010081261课程:专业综合实验实验日期:2014年1 月 3 日成绩:实验二、语音信号时域特征参数提取一、实验目的1.掌握利用matlab程序进行语音信号的录制与回放。

2.理解语音信号的时域特征参数的概念,如短时能量、短时过零率等。

3.掌握matlab的开发环境。

4.掌握对语音信号进行时域特征参数提取的方法。

二、实验原理本实验要求掌握时域特征分析原理,并利用已学知识,编写程序求解语音信号的短时过零率、短时能量、短时自相关特征,分析实验结果。

1.窗口的选择通过对发声机理的认识,语音信号可以认为是短时平稳的。

在5~50ms的范围内,语音频谱特性和一些物理特性参数基本保持不变。

我们将每个短时的语音称为一个分析帧。

一般帧长取10~30ms。

我们采用一个长度有限的窗函数来截取语音信号形成分析帧。

通常会采用矩形窗和汉明窗。

图1.1给出了这两种窗函数在帧长N=50时的时域波形。

学院: 信电学院 班级:电信102 姓名: 徐景广 学号: 2010081261 课程:专业综合实验 实验日期:2014年 1 月 3 日 成绩:0.20.40.60.811.21.41.61.82矩形窗samplew (n )0.10.20.30.40.50.60.70.80.91hanming 窗samplew (n )图1.1 矩形窗和Hamming 窗的时域波形矩形窗的定义:一个N 点的矩形窗函数定义为如下{1,00,()n Nw n ≤<=其他hamming 窗的定义:一个N 点的hamming 窗函数定义为如下0.540.46cos(2),010,()n n NN w n π-≤<-⎧⎨⎩其他=这两种窗函数都有低通特性,通过分析这两种窗的频率响应幅度特性可以发现(如图1.2):矩形窗的主瓣宽度小(4*pi/N ),具有较高的频率分辨率,旁瓣峰值大(-13.3dB ),会导致泄漏现象;汉明窗的主瓣宽8*pi/N ,旁瓣峰值低(-42.7dB ),可以有效的克服泄漏现象,具有更平滑的低通特性。

因此在语音频谱分析时常使用汉明窗,在计算短时能量和平均幅度时通常用矩形窗。

表1.1对比了这两种窗函数的主瓣宽度和旁瓣峰值。

学院: 信电学院 班级:电信102 姓名: 徐景广 学号: 2010081261 课程:专业综合实验 实验日期:2014年 1 月 3 日 成绩:00.10.20.30.40.50.60.70.80.91-80-60-40-200矩形窗频率响应归一化频率(f/fs)幅度/d B00.10.20.30.40.50.60.70.80.91-100-50Hamming 窗频率响应归一化频率(f/fs)幅度/d B表1.1 矩形窗和hamming 窗的主瓣宽度和旁瓣峰值2.短时能量由于语音信号的能量随时间变化,清音和浊音之间的能量差别相当显著。

因此对语音的短时能量进行分析,可以描述语音的这种特征变化情况。

定义短时能量为:221[()()][()()]nn m m n N E x m w n m x m w n m ∞=-∞=-+=-=-∑∑,其中N 为窗长特殊地,当采用矩形窗时,可简化为:2()n m E xm ∞=-∞=∑∑-==12)(N m n n m x E学院: 信电学院 班级:电信102 姓名: 徐景广 学号: 2010081261 课程:专业综合实验 实验日期:2014年 1 月 3 日 成绩:图1.3和图1.4给出了不同矩形窗和hamming 窗长的短时能量函数,我们发现:在用短时能量反映语音信号的幅度变化时,不同的窗函数以及相应窗的长短均有影响。

hamming 窗的效果比矩形窗略好。

但是,窗的长短影响起决定性作用。

窗过大(N 很大),等效于很窄的低通滤波器,不能反映幅度En 的变化;窗过小( N 很小),短时能量随时间急剧变化,不能得到平滑的能量函数。

在11.025kHz 左右的采样频率下,N 选为100~200比较合适。

短时能量函数的应用:1)可用于区分清音段与浊音段。

En 值大对应于浊音段,En 值小对应于清音段。

2)可用于区分浊音变为清音或清音变为浊音的时间(根据En 值的变化趋势)。

3)对高信噪比的语音信号,也可以用来区分有无语音(语音信号的开始点或终止点)。

无信号(或仅有噪声能量)时,En 值很小,有语音信号时,能量显著增大。

sampl e采样幅度sampl e短时能量sampl e短时能量sampl e短时能量sampl e短时能量sampl e短时能量sample采样幅度sample短时能量sample短时能量sample短时能量sample短时能量sample短时能量3.短时平均过零率过零率可以反映信号的频谱特性。

当离散时间信号相邻两个样点的正负号相异时,我们称之为“过零”,即此时信号的时间波形穿过了零电平的横轴。

统计单位时间内样点值改变符号的次数具可以得到平均过零率。

定义短时平均过零率:学院: 信电学院 班级:电信102 姓名: 徐景广 学号: 2010081261 课程:专业综合实验 实验日期:2014年 1 月 3 日 成绩:sgn[[]sgn[(1)]()n m Z x m x m w n m ∞=-∞=---∑其中[]sgn 为符号函数,{0)(,10)(,1)(sgn ≥<-=n x n x n x ,在矩形窗条件下,可以简化为11sgn[()sgn[(1)]2nn m n N Z x m x m N=-+=--∑短时过零率可以粗略估计语音的频谱特性。

由语音的产生模型可知,发浊音时,声带振动,尽管声道有多个共振峰,但由于声门波引起了频谱的高频衰落,因此浊音能量集中于3KZ 以下。

而清音由于声带不振动,声道的某些部位阻塞气流产生类白噪声,多数能量集中在较高频率上。

高频率对应着高过零率,低频率对应着低过零率,那么过零率与语音的清浊音就存在着对应关系。

.图1.5为某一语音在矩形窗条件下求得的短时能量和短时平均过零率。

分析可知:清音的短时能量较低,过零率高,浊音的短时能量较高,过零率低。

清音的过零率为0.5左右,浊音的过零率为0.1左右,但两者分布之间有相互交叠的区域,所以单纯依赖于平均过零率来准确判断清浊音是不可能的,在实际应用中往往是采用语音的多个特征参数进行综合判决。

短时平均过零率的应用:1)区别清音和浊音。

例如,清音的过零率高,浊音的过零率低。

此外,清音和浊音的两种过零分布都与高斯分布曲线比较吻合。

2)从背景噪声中找出语音信号。

语音处理领域中的一个基本问题是,如何将一串连续的语音信号进行适当的分割,以确定每个单词语音的信号,亦即找出每个单词的开始和终止位置。

3)在孤立词的语音识别中,可利用能量和过零作为有话无话的鉴别。

学院: 信电学院 班级:电信102 姓名: 徐景广 学号: 2010081261 课程:专业综合实验 实验日期:2014年 1 月 3 日 成绩:sample采样幅度sample短时能量sample短时平均过零率图1.5 矩形窗条件下的短时平均过零率4、短时自相关函数自相关函数用于衡量信号自身时间波形的相似性。

清音和浊音的发声机理不同,因而在波形上也存在着较大的差异。

浊音的时间波形呈现出一定的周期性,波形之间相似性较好;清音的时间波形呈现出随机噪声的特性,样点间的相似性较差。

因此,我们用短时自相关函数来测定语音的相似特性。

短时自相关函数定义为:()()()()()n m R k x m w n m x m k w n m k ∞=-∞=-+--∑令'm n m =+´,并且'()()w m w m -=,可以得到:学院: 信电学院 班级:电信102 姓名: 徐景广 学号: 2010081261 课程:专业综合实验 实验日期:2014年 1 月 3 日 成绩:1''''()[()()][()()][()()][()()]N k n m m R k x n m w m x n m k w m k x n m w m x n m k w m k ∞--=-∞==++++=++++∑∑图6给出了清音的短时自相关函数波形,图7给出了不同矩形窗长条件下(窗长分别为N=70,N=140,N=210,N=280)浊音的短时自相关函数波形。

由图1.6、图1.7短时自相关函数波形分析可知:清音接近于随机噪声,清音的短时自相关函数不具有周期性,也没有明显突起的峰值,且随着延时k 的增大迅速减小;浊音是周期信号,浊音的短时自相关函数呈现明显的周期性,自相关函数的周期就是浊音信号的周期,根据这个性质可以判断一个语音信号是清音还是浊音,还可以判断浊音的基音周期。

浊音语音的周期可用自相关函数中第一个峰值的位置来估算。

所以在语音信号处理中,自相关函数常用来作以下两种语音信号特征的估计:1)区分语音是清音还是浊音; 2)估计浊音语音信号的基音周期。

延时kR (k )图1.6 清音的短时自相关函数学院: 信电学院 班级:电信102 姓名: 徐景广 学号: 2010081261 课程:专业综合实验 实验日期:2014年 1 月 3 日 成绩:延时kR (k )延时kR (k )延时kR (k )延时kR (k )图1.7 不同矩形窗长条件下的浊音的短时自相关函数三、实验仪器和设备PC 机1台,麦克风一个,matlab 编程软件四、实验内容及步骤1.安装Matlab6.x 软件实验平台 (如系统已安装Matlab 6.软件 ,直接进第二步)。

2. 利用麦克风录制一段自己的语音信号。

3. 利用matlab 绘制语音信号时域波形。

4. 对语音信号进行加窗处理,并比较汉明窗与矩形窗的区别。

5. 利用matlab 提取语音信号的短时能量、短时过零率以及自相关函数。

6. 分析不同语音信号的短时能量、短时过零率以及自相关函数的不同。

7. 分析上述三种语音信号特征对语音信号分析的意义。

学院:信电学院班级:电信102 姓名:徐景广学号:2010081261 课程:专业综合实验实验日期:2014年1 月 3 日成绩:图1为加汉明窗后的图形,图2为短时能量的图片,图3为求自相关函数,代码如下: Y=WA VREAD('XJG.WA V',[2700,3211]);% 加汉明窗window=hamming(32);subplot(2,1,1);plot(Y);for i=1:15y(i*32:i*32+31,1:1)=Y(i*32:i*32+31,1:1).*window;endsubplot(2,1,2);plot(y);% 求短时能量En=0;for k=1:15En=conv(window,Y.*a);% 求短时能量函数Enendfigure(2)plot(En);% 求自相关函数N=240R=zeros(1,240);for k=1:240for n=1:240-kR(k)=R(k)+y(n)*y(n+k);endendj=1:240;figure(3)plot(j,R);grid;学院:信电学院班级:电信102 姓名:徐景广学号:2010081261 课程:专业综合实验实验日期:2014年1 月 3 日成绩:图1 加汉明窗后的波形图2 短时能量学院:信电学院班级:电信102 姓名:徐景广学号:2010081261 课程:专业综合实验实验日期:2014年1 月 3 日成绩:图3 自相关函数a=wavread('XJG.WA V ');n=length(a);N=320;h=hamming(N);for i=1:n-1if a(i)>=0b(i)= 1;elseb(i) = -1;end学院:信电学院班级:电信102 姓名:徐景广学号:2010081261 课程:专业综合实验实验日期:2014年1 月 3 日成绩:if a(i+1)>=0b(i+1)=1;elseb(i+1)= -1;endw(i)=abs(b(i+1)-b(i)); %求出每相邻两点符号的差值的绝对值endk=1;j=0;while (k+N-1)<nZm(k)=0;for i=0:N-1;Zm(k)=Zm(k)+w(k+i);endj=j+1;k=k+N/2; %每次移动半个窗endfor w=1:jQ(w)=Zm(160*(w-1)+1)/(2*N); %短时平均过零率endplot(Q);grid;学院:信电学院班级:电信102 姓名:徐景广学号:2010081261 课程:专业综合实验实验日期:2014年1 月 3 日成绩:图4 短时平均过零率图5为加矩形窗后的图形,图6为短时能量的图片,图7为求自相关函数,代码如下:Y=WA VREAD('XJG.WA V',[2700,3211]);% 加矩形窗window=rectwin(32);subplot(2,1,1);plot(Y);for i=1:15y(i*32:i*32+31,1:1)=Y(i*32:i*32+31,1:1).*window;end学院:信电学院班级:电信102 姓名:徐景广学号:2010081261 课程:专业综合实验实验日期:2014年1 月 3 日成绩:subplot(2,1,2);plot(y);% 求短时能量En=0;for k=1:15En=conv(window,Y.*a);% 求短时能量函数Enendfigure(2)plot(En);% 求自相关函数N=240R=zeros(1,240);for k=1:240for n=1:240-kR(k)=R(k)+y(n)*y(n+k);endendj=1:240;figure(3)plot(j,R);grid;学院:信电学院班级:电信102 姓名:徐景广学号:2010081261 课程:专业综合实验实验日期:2014年1 月 3 日成绩:图5 加矩形窗图6 短时能量学院:信电学院班级:电信102 姓名:徐景广学号:2010081261 课程:专业综合实验实验日期:2014年1 月 3 日成绩:图7 求自相关函数利用matlab提取语音信号的短时能量、短时过零率以及自相关函数a=wavread('XJG.WA V');n=length(a);N=320;h=rectwin(N);for i=1:n-1if a(i)>=0b(i)= 1;else学院:信电学院班级:电信102 姓名:徐景广学号:2010081261 课程:专业综合实验实验日期:2014年1 月 3 日成绩:b(i) = -1;endif a(i+1)>=0b(i+1)=1;elseb(i+1)= -1;endw(i)=abs(b(i+1)-b(i)); %求出每相邻两点符号的差值的绝对值endk=1;j=0;while (k+N-1)<nZm(k)=0;for i=0:N-1;Zm(k)=Zm(k)+w(k+i);endj=j+1;k=k+N/2; %每次移动半个窗endfor w=1:jQ(w)=Zm(160*(w-1)+1)/(2*N); %短时平均过零率endplot(Q);grid;%求短时平均过零率学院:信电学院班级:电信102 姓名:徐景广学号:2010081261 课程:专业综合实验实验日期:2014年1 月 3 日成绩:图8 短时平均过零率学院:信电学院班级:电信102 姓名:徐景广学号:2010081261课程:专业综合实验实验日期:2014年1 月 3 日成绩:五、实验总结这次实验我获益匪浅,掌握了利用matlab程序进行语音信号的录制与回放,理解了语音信号的时域特征参数的概念,如短时能量、短时过零率等,掌握,对语音信号进行时域特征参数提取的方法。

相关主题