目录第一章引言• (2)第二章总体设计方案 (3)2.1 设计思路 32.2 总体设计框图 3 第三章设计原理 53.1 系统功能模块分析 53.2 WAV文件格式分析 (5)3.3 语音的录制和采集 63.4 时域和频域分析83.5 数字滤波器的设计原理93.6 软件介绍11 第四章系统实现12 第五章总结14 附录一:效果图附录二:程序参考文献摘要语音信号处理是研究用数字信号处理技术对语音信号进行处理的一门学科,是一门新兴的交叉学科,是在多门学科基础上发展起来的综合性技术。
它涉及到数字信号处理、模式识别、语言学、语音学、生理学、心理学及认知科学和人工智能等许多学科领域。
语音信号处理是目前发展最为迅速的信息科学研究领域中的一个,其研究设计一系列前沿课题,切处于发展之中。
其研究成果具有重要的学术及应用价值!语音信号的采集和分析技术的应用和发展与语音学、声音测量学、电子测量技术等学科紧密联系,其中语音采集和分析仪器的小型化、智能化、数字化以及多功能化的发展越来越快,分析速度较以往也有了大幅度的提高。
本次课程设计主要介绍了语音信号的录制、语音信号的采集与分析、语音信号的采样、语音信号的合成、加噪后滤波器的设计。
通过PC机或录制一段语音信号,运用MATLAB! VC++6.0,设计滤波器加入噪声进行滤波处理,比较前后语音的区别。
关键词:语音信号,采集与分析,语音合成,加噪,滤波器, MATLAB第一章引言语言是人类最重要的交流工具,它自然方便、准确高效。
随着社会的不断发展,各种各样的机器参与到了人类生产活动和社会活动,因此改善了人和机器之间的关系,使人对机器的操纵更加便利就显得越来越重要。
随着电子计算机和人工智能机器的广泛应用,人们发现:人和机器之间最好的通信方式是语言通信,而语音是语言的声学表现方式。
要使机器听懂人讲话,并说出话来,需要做很多工作,这就是科研工作者研究了几十年的语音信号处理技术。
语音信号处理技术是计算机智能接口与人机交互的重要手段之一。
就语音识别技术而言,其基本任务是将输入的语音转化为相应的文本或命令。
语音识别也可将文字以口授的方式输入到计算机中,即广泛开展的听写机研究。
语音识别技术还可用于自动口语翻译,可将输入的语音翻译成另外一种语言的语音输出,实现跨语言的交流。
基于信号的情感处理研究是当前一个重要的研究方向,人们发现情感和态度所引起的变化对语音合成、语音识别、说话人确认等方面的影响较大,因而语音信号中情感处理的研究逐步引起了人们的重视。
目前许多研究者都在致力于研究情感对语音的影响以及情感状态下语音信号处理的有效方法。
对说话人识别技术,近年来已经在安全加密、银行电话查询服务等方面得到了很好的应用。
此外,在公安机关破案和法庭取证方面也发挥着重要的作用。
语音合成技术,现在已经在很多方面得到了实际应用,发挥了很好的社会效益,如公共交通中的自动报站、电话自动查询服务和文本校对中的语音提示等。
在电信声讯服务领域的智能电话查询系统中,满足了海量数据和动态查询的需求,可查询一些动态信息,如股票、成绩、节目、机场等信息。
因此,我们此次做了基于VC和MATLAB勺数字语音信号处理课程设计。
第二章总体设计方案2.1设计思路1. 语音信号采集(1)使用电脑的声卡设备或其他录音设备采集一段语音信号,并将其保存为WAV格式在电脑中。
(2)原语音在MATLAB^进行预处理,并显示波形和频谱。
2. 语音信号的处理在MATLAB^,编写相应程序,实现对原始语音的合成、滤波、加噪等处理3. 语音信号的呈现在Vc中利用链接程序,把它与 MATLAB!接起来,再通过Vc内部的编写程序实现语音信号在其界面中的显示。
图2.1语音信号设计流程图2.2总体设计框图总体设计是对信号源(即原始语音信号)进行观察与测量,然后进行信号表示,再进行信号的处理和变换,最后对信号进行提取和利用。
信号合成 信号加噪图22信号处理总体示意图信号滤波第三章设计原理3.1系统功能模块分析本系统根据研究内容涉及到语音的采集、播放、存储、分析等方面的内容,语音采集、播放、存储主要是为时域分析、频域分析等处理与分析提供底层服务支持,从而可以划分两大基本块:底层服务和分析处理。
主要功能模块图如下:图3.1系统功能模块示意图3.2 WAVE文件格式分析WAVE文件是多媒体中使用语音文件格式之一,以RIFF格式为标准。
RIFF是英文Resource Interchange File Format的缩写,每个 WAV文件的头四个字节便是“ RIFF”。
WAV文件由文件头和数据体两大部分组成。
其中文件头又分为 RIFF/ WAX文件标识段和声音数据格式说明段两部分。
常见的声音文件主要有两种,分别对应于单声道(11.025KHZ采样率、8Bit 的采样值)和双声道(44.1KHZ采样率、16Bit的采样值)。
采样率是指:声音信号在“模一数”转换过程中单位时间内采样的次数。
采样值是指每一次采样周期内声音模拟信号的积分值。
对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH);而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位和低八位分别代表左右两个声道。
WAV文件数据块包含以脉冲编码调制(PCM格式表示的样本。
WAV文件是由样本组织而成的。
在单声道 WAVE 文件中,声道0代表左声道,声道1代表右声道。
在多声道 WAV文件中,样本是交替出现的。
WAVE文件的每个样本值包含在一个整数i中,的长度为容纳指定样本长度所需的最小字节数。
首先存储低有效字节,表示样本幅度的位放在i的高有效位上,剩下的位置为0,这样8位和16位的PCM波形样本的数据格式3.3语音的录制和米集对于语音信号的录制与采集主要可以使用两种方法:使用windows自带录音机录制、使用其他录音工具 sndren32。
1.语音信号的录制<一>使用 window 自带录音工具使用windows自带录音机录制语音文件,进行数字信号的采集。
将话筒输入计算机的语音输入查扣上,启动录音机。
录制一段录音,录音停止后,文件存储器的后缀默认为.Wav。
将录制好文件保存,记录保存路径。
<二>使用其他录音设备使用sndren32录音设备录制声音。
打开设备后,点开始录音键进行录音,默认保存为 WAV格式,而且还可以进行频率的选择。
图3.2 windows 自带录音机Fam *RcmarakHr 燧忻.離口昭 gje..图3.4sndren32 选择区2.语音信号的采集利用MATLAB 进行对语音的处理,来获取原始语音信号的波形和频谱。
代码:close all;i=1;[x,fs,bits]=wavread('91.wav') soun d(x,fs,bits);N=le ngth(x);n=0:N-1;figure(i);subplot(2,1,1); plot( n, x);xlabel(' n');ylabel('x( n)');title(' 原始语音信号');subplot(2,1,2);[H,f]=freqz(x,1,512,fs); plot(f,20*log10(abs(H))); xlabel(' n');ylabel('x( n)');title (' 原始语音信号的频谱');结果图:原始语音信号原始语音信号的频谱图 3.3sndren32 界面 计算机HI 驷时a_ l^iUKdEfiistm : [KM [1 怦⑴ |s OK' kH=. fi ft. **:• rra?®~3n3.5原始语音的波形和频谱3.4时域和频域分析1. 时域分析语音信号本身就是时域信号,进行语音信号分析时,最直观的就是语音信号的时域波形,因而时域分析是最早使用、应用范围最广的一种方法。
时域分析具有简单直观、清晰易懂、运算量小、物理意义明确等优点。
语音信号是一种典型的非平稳信号。
但是,由于语音的形成过程是与发音器官的运动密切相关的,这种物理运动比起声音振动速度要缓慢的多,因此语音信号常常可假定为短时平稳的,即在 10〜20ms这样的时间段内,其频谱特性和某些物理特征参量可近似地看作是不变的。
这样,我们就可以采用平稳过程的分析处理方法来处理了。
所以在时域分析过程中采用的短时能量分析、短时过零率分析、短时平均振幅都是在这种短时平稳假定下从时域来分析的一些物理参量。
2. 频域分析语音信号的频域分析就是分析语音信号的频域特征。
从广义上将,语音信号的频域分析包括语音信号的频谱、功率谱、倒频谱、频谱包络等,而常用的频域分析方法有带通滤波器组法、傅立叶变换发、线性预测法等几种。
因为语音信号是非平稳过程,因此适用于周期、瞬变、或平稳随机信号。
标准傅里叶变换不能直接表示语音信号,而应该用短时傅立叶变换对语音信号的频谱进行分析,相应的频谱成为“短时谱”把语音信号加载入MATLA仿真软件平台的工作空间中,然后画出信号的时域波形,然后再对语音信号进行频谱分析。
MATLAB提供了快速傅立叶变换算法 FFT计算DET的函数fft 。
时域到频域图3.6傅里叶变换与反变换关系图在时域内,语音信号具有“短时性”的特点,即在总体上,语音信号的特征是随着时间而变化的,但在一段较短的时间间隔内,语音信号保持平稳。
在浊音段表现出周期信号的特征,在清音段表现出随机噪声的特征。
在频域内,语音信号的频谱分量主要集中在 300〜3400Hz的范围内。
利用这个特点,可以用一个防混迭的带通滤波器将此范围内的语音信号频率分量取出,然后按8kHz的采样率对语音信号进行采样,就可以得到离散的语音信号。
信号x(n)的短时傅里叶变换定义为(e jwn 'oO)=送 x(m)w(n_m)e 」wm式中,w(n)为窗口函数。
可以从两个角度理解函数 X n (e jw )的物理意义:一是当 n 固定时,例如n = n .0, X no (e jw)是将窗函数的起点移至n °处的截取信号x(n),再经傅利叶变换 得到的一个频谱函数。
这是直接从频率轴方向来理解的。
二是从时间轴方向来理解,当频率固定时,例如w = W k ,X n (e jwk)可以看作是信号经过一个中心频率为 W k 的带通滤波器产生的输出。
这是因为窗口函数 w(n)通常具有低通频率响应,而指数ejnwk对语音信号x(n)有调制的作用,可使频谱产生移位,即将 x(n)频谱中 对应于频谱W k 的分量平移到零频。
3.5数字滤波器的设计原理数字滤波是语音信号分析中的重要组成部分之一, 与模拟滤波相比,它具有 精度和稳定性高、系统函数容易改变、灵活性强、便于大规模集成和可实现多维 滤波等有点。