目录一、绪论 (1)1.1 课题研究背景和意义 (1)1.2 国内外研究现状和发展趋势 (2)1.2.1研究历史和现状 (2)1.2.2发展趋势 (2)1.3本文所要研究的内容 (2)二、麦克风阵列的处理模型和方法介绍 (4)2.1麦克风阵列信号处理模型 (4)2.1.1远场模型 (4)2.1.2远场麦克风阵列均匀线阵模型 (5)2.2基于时延估计声源定位方法的介绍 (6)2.2.1广义互相关时延估计法 (6)2.2.2互功率谱相位时延估计法 (7)2.2.3基于基音加权的时延估计法 (7)2.2.4基于声门脉冲激励的时延估计法 (7)2.2.5 基于LMS 的自适应时延估计法[8] (8)2.2.6 基于子空间分解的时延估计法 (9)2.2.7基于声学传递函数比的时延估计法 (9)三、麦克风声源定位的研究与设计 (11)3.1广义互相关时延估计设计流程 (11)3.2 时延估计定位算法实验研究 (12)3.3互相关延时估计方法 (12)3.4互相关延时估计加权函数性能分析 (15)3.5声源定位的模型分析 (16)3.6时延估计的测量与计算 (17)四、总结 (20)4.1 本文研究的问题与难点 (20)4. 2课题研究总结 (20)参考文献 (22)致谢 (24)摘要随着科技的进步和发展,麦克风阵列的声源定位技术已经成为人们研究的重要课题之一。
用麦克风阵列接受语音信号就是声源定位技术的一种,接受到的语音技术再输出到计算机,经过计算机技术的分析和处理,然后可以确定声源是从哪个方位传过来的。
声源定位技术的广泛应用在许多领域,如定位技术,在军事上的语音识别,视频会议的定位技术。
麦克风阵列对于噪声、声源定位、跟踪这些方面都比单个麦克风要好,从而大大提高语音信号处理质量。
本文主要是用麦克风阵和时延估计声源定位方法对于声源的定位。
首先介绍了几种常见的声源定位方法和各自的优缺点,在此基础上研究基于时延估计的声源定位方法(GCC),比较远场定位和近场定位的差别,确定本文研究的方法远场定位法。
由于远场定位时,只需要测出声音信号到达各个麦克风阵列的时延(TDOA),剩下的就是简单的数学公式推导。
由于该方法计算量小,易于实现的优点,实际应用比较广泛。
关键词:麦克风阵列,声源定位,时延估计,GCCAbstractWith the progress and development of science and technology, the microphone array sound source localization technology has become one of the important topic studied by e a microphone array to accept the speech signal is a kind of sound source localization technology, accept to voice technology and then output to the computer, through the analysis of the computer technology and processing, and then can determine the source from which to get the bearing.Sound source localization technology is widely used in many fields, such as positioning technology, voice recognition in the military, the positioning technology of video meeting.The microphone array for noise, sound source localization and tracking these aspects are better than a single microphone, which greatly improve the quality of speech signal processing.This article mainly is to use a microphone array and time delay estimation of sound source localization method for sound source localization.Firstly introduces several common methods and their respective advantages and disadvantages of beam former, on the basis of the research of sound source localization based on time delay estimation method (GCC), to compare the difference in orientation of far field and near field and far field method in this paper, we study the method is determined.Due to the far field orientation, only need to measure sound signals to reach the time delay of various microphone arrays (TDOA), the rest is simple mathematical formulas are derived.Due to the small amount of calculation, this method is easy to implement, the advantages of more extensive practical application.K ey words: the microphone array, sound source localization, time delay estimation, GCC一、绪论1.1 课题研究背景和意义定位技术是我们一直研究的课题,目前有很多定位技术都开发的比较成熟,比如我们经常使用的GPS导航系统、手机的定位与查找、超声波定位技术、蓝牙定位技术等。
其中声源定位技术与语音增强在语音通信领域中是非常重要的两门技术。
例如,我们可以通过声源定位技术来定位的讲话人的具体方位,然后灯光就对焦于讲话的人;为了解决人们在高速公路上接电话的问题,车载电话由此诞生[1]。
当然我们不能排除车上会有噪音,这样就会影响语音系统对于我们声音的识别,然而麦克风声源定位技术可以帮助我们来解决噪声问题;在智能机器人领域也有很重要的应用,智能机器人通过传感器来定位面前的人,从而跟他交流或者接受命令。
声源定位已广泛应用于各个领域,它可用于医学研究,交通检测,雷达,视频会议,航天自动导航,智能机器人和其他成熟的先进技术。
麦克风声源定位技术大致可分为三方面:第一类是高分辨率谱估计技术,由于这类技术在计算时需要用的相关矩阵,这样我们的计算量会非常的大,同时这种定位技术跟其他技术相比定位的不准确,在实际操作过程中很少采用;第二类是最大输出功率的可控波束形成技术,这种技术室利用加权函数来求得的,原理是:1.麦克风接受语音信号;2.求加权和形成的波束;3.求出最大输出功率波束;第三类是基于声达时间差的定位技术,这种技术是利用声源传到各个麦克风阵列的时间差,然后求出角度,就可以再平面上确定声源的位置,这种技术的优点就是计算量比较小,对于噪声的处理也比较好,但是只适用与单个声源的定位,对于多个声源定位效果比较差。
1.2 国内外研究现状和发展趋势1.2.1研究历史和现状上个世纪80年代以来,人们就已经开始了对声源定位的研究,并取得了很多的成果,为人类的进步做出了积极的贡献。
在定位技术的人的研究有很多,包括定位技术的检测和识别,人脸GPS定位技术,基于麦克风阵列定位技术。
由于本文研究的是麦克风声源定位技术,下面就对声源定位技术的发展与进步进行大致的描述。
在上世纪80年代中后期到90年代初在这个时间段里,罗格斯大学Flanagan教授和来自布朗大学的Silverman教授是最早研究麦克风声源定位技术[2-3],从此以后,人们开始研究声源定位,语音处理,语音识别,视频跟踪的麦克风阵列技术。
人们研究发现你,麦克风阵列比单个麦克风在处理信号时有很多的优点,比如单个麦克风不是消除噪声干扰,同是拾取的信号范围也很有限,一个由多个麦克风组成阵列可以弥补单麦克风的缺点。
此外还可以增强语音信号和提高识别能力。
此外麦克风阵列可以进行生源定位,而单个的麦克风就不行。
1.2.2发展趋势在几十年的发展过程中,声测系统主要是通过系统化,集成化来提高性能,其基本原理是差不多的。
目前使用比较多的是麦克风阵列技术来接受信号,用无线电技术传输信号,示波器等技术来检测结果,然后用计算机技术解决问题。
目前,许多国家的声源定位技术研究的都比较成熟,很多技术已经应用的实战,目前,声测系统的侦察距离可达30km同时精度达到1%,无线电传输方式的展开时间仅需半小时,可同时测量50多个目标[4],打击精度比较高,而我国在这一方面的技术就比较落后,关于目标定位和精确的打击与其他国家之间的差距比较大。
1.3本文所要研究的内容本文研究的内容是学习阵列信号处理的基本理论;学习并掌握基于到达时间差的麦克风声源定位技术;学习并掌握各种到达时间差的估计方法;基于麦克风阵列建立广义的基于互相关时延估计,然后在MATLAB平台上实现基于到达时间差的声源定位系统。
具体的工作如下:第一章简单的叙述了声源定位的研究背景和国内外的发展状况第二章主要讲述了麦克风阵列的几种模型和介绍了时延估计法第三章麦克风声源定位的研究与设计第四章总结课题的难点和遇到的问题二、麦克风阵列的处理模型和方法介绍2.1麦克风阵列信号处理模型2.1.1远场模型麦克风声源定位可以分为远场模型和近场模型,这是根据麦克风和声源的距离确定的,当麦克风阵列的位置与声音的发射源的位置较近时就可以使用近场模型,因为麦克风阵列与声源位置较近就不能忽略阵列与阵列之间由于声源引起的幅度。
当麦克风的位置与声源较远时,我们可以使用远场模型,由于麦克风阵列与声源的位置较远,然而可以忽略声源到第一个和第二个阵列的幅度差比较小,可以比用考虑。