当前位置：文档之家› 声源定位算法及实现

声源定位算法及实现

麦克风阵列较之单个麦克风有许多优点，其优越性表现在：１）麦克风阵列系统具有空间选择性，可以用“电子”瞄准的方式从声源位
置处获取目标信号，并且抑制其它方向的干扰信号，其效果明显优于良好瞄准的、高方向性的单麦克风。２）麦克风阵列系统能够应用于自动跟踪识别声源，当声源移动时，麦克风阵列并不需要发生物理上的调整，只需系统改变其电子波束指向即可，
Ⅱ
ｍｅａｓｕｒｅｍｅｎｔｆｉｍｃｔｉｏｎｕｓｅｄｉｓｏｐｔｉｍａｌａｎｄｔｈｅｉｔｅｒａｔｉｏｎｉｓｃｏｎｖｅｒｇｅｎｔ．Ｆｉｎａｌｌｙ，ｔｈｅｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｄｅｍｏｎｓｌｒａｔｅｔｈｅｅｆｆｅｃｔｉｖｅｎｅｓｓａｎｄｈｉｇｈａｃｃｕｒａｃｙｏｆｔｈｅｐｒｏｐｏｓｅｄａｌｇｏｒｉｔｈｍ．Ｋｅｙｗｏｒｄ：ｓｏｕｎｄｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎ，ｃｒｏｓｓｐｏｗｅｒｓｐｅｃｔｒａｌｐｈａｓｅ，ｓｐｈｅｒｉｃａｌｉｎｔｅｒｐｏｌａｔｉｏｎ，ＬＭＳ
１．２研究历史及现状
基于麦克风阵列的声源定位，就是基于一组已知几何位置的阵列并利用阵元接收信号的相关性来确定声源方向或者空间位置。
根据声源、麦克风阵列、背景环境的不同情况，目前的声源定位研究主要可分为以下几类：
１）二维空间定位与三维空间定位２）近场定位与远场定位３）方向定位与距离定位４）理想环境下的声源定位与低信噪比，强混响环境下的声源定位随着声源定位应用背景的不断拓展，定位技术的理论研究也取得了长足的进步．由于工程应用的需求，在二维空间及理想环境下的理论研究已经不能满足要求，更多的研究致力于真实声场下的三维空间。在无线通信、雷达、声纳领域中，室外远距离的声源方向测定是焦点。在远场情况下，声源与参考传声器之间的距离大于材２／五。。，五。。是声源的最小波长，ｄ是阵列孔径，即相邻传声器之间的距离。此时认为声源信号为平面波，到达各个阵列的方向是近乎相同的，均匀线性阵列在这种环境中得到了广泛应用。然而在室内环境中，近场声源的研究则是热点，信号波前认为是球面，不仅可以定向，估计声源到阵列的距离也成为可能。在真实的声场中，声音除了通过空气媒介直接到达传声器以外，还通过各种障碍物（如墙壁、地板、天花板、室内物品）反射、衍射到达，这样传声器接收到的是
ｅｎｖｉｒｏｎｍｅｎｔａｎｄｆｍｒｔｈｅｌ＂ｉｎｃｒｅａｓｅｔｈｅａｃｃｕｒａｃｙａｎｄｒｏｂｕｓｔｎｅｓｓｉｓｓｔｉｌｌａｃｈａｌｌｅｎｇｉｎｇｔａｓｋ，ａｎｄｉｔｈａｓｂｅｅｎｒｅｃｅｉｖｅｄｍｏｒｅａｎｄｍｏｒｅｉｎｔｅｒｅｓｔ．
Ｔｈｉｓｍｅｎｓｉｏｎａｌｓｏｕｉｌｄｓｏｕｒｃｅｌｏｃａｌｉｚａｔｉｏｎｉｎｔｈｅｒｅａｌａｃｏｕｓｔｉｃｅｎｖｉｒｏｎｍｅｎｔ．Ｏｎｔｈｅｂａｓｉｓｏｆｔｈｅｐａｓｔｒｅｓｅａｒｃｈ，ａｍｏｄｉｆｉｅｄ
２
第一章绪论
原始直达声和经过延迟和衰减的声音的混合信号，这种导致音质变差的现象叫做多径效应（ｏｍｏｌｏｇｏ，１９９８）ｔｚｌｌ。多径效应将使麦克风获取的语音质量下降、声源定位的精度降低。从理论上讲，可用反滤波或反卷积的方法来消除混响，但这要求已知精确的混响冲击函数，而实际上环境的声学特性一般是很难获得的，因此这种方法不容易实现。抗混响的其他方法有子带（ｓｕｂ－ｂａｎｄ）处理法、自适应滤波（ａｄａｐｔｉｖｅｐｏｓｔ－ｆｉｌｔｅｒｉｎｇ）法和基于倒谱（ｃｃｐｓｍⅡｎ－ｂａｓｃｄ）处理的方法等（Ｂｒａｎｄｓｔｅｉｎ，１９９５）［埘。
Ｆｉｒｓｔｏｆａｌｌ，ｅｎｄｐｏｉｎｔｄｅｔｅｃｔｉｏｎｉｓａｃｒｕｃｉａｌｓｔｅｐｉｎｓｐｅｅｃｈｐｒｅｐｒｏｃｅｓｓｉｎｇ，ｗｈｉｃｈ
ｇｅｔｓｒｉｄｏｆｔｈｅｐｒｏｃｅｓｓｏｆｓｐｅｅｃｈｌｅｓｓｓｉｇｎａｌｓ，ｒｅｄｕｃｅｓｔｈｅｃｏｍｐｕｍｔｉｏｎａｌｃｏｓｔ，ａｎｄｉｍｐｒｏｖ船ｔｈｅａｃｃｕｒａｃｙｏｆｔｈｅｓｕｂｓｅｑｕｅｎｔｌｏｃａｌｉｚａｔｉｏｎ．Ｕｎｄｅｒｔｈｅａｓ￥ｕｌｎｐｔｉｏｎｔｈａｔｎｏｉｓｅｉｓｒｏｕｇｈｌｙＯａ惦ｓｉａｎａｎｄ∞ｕｒｃｅｓｉｇｎａｌｓａｒｅｓｔａｔｉｓｔｉｃａｌｌｙｉｎｄｅｐｅｎｄｅｎｔｏｆｎｏｉｓｅｓｉｇｎａｌｓ，
ｆｏｕｒｔｈ－ｏｒｄｅｒｃｕｍｌｄａｎｔｉｓｉｎｔｒｏｄｕｃｃｄｔｏｄｅｔｅｃｔｔｈｅｅｎｄｐｏｉｎｔ．，ｗｈｉｃｈｇｒｅａｔｌｙｓｕｐｐｒｅｓｓｅｓｔｈｅｅｆｆｅｃｔｏｆｎｏｉｓｅ．Ｓｅｃｏｎｄｌｙ，ｔｉｍｅｄｅｌａｙｏｆａｒｒｉｖａｌ（ＴＤＯＡ）ｂａｓｅｄｍｅｔｈｏｄｉｓｔｈｅｍｏｓｔ
Ｉｌｌ
第一章绪论
第一章绪论
１．１研究背景
阵列信号处理是数字信号处理领域的一大热点，它克服了单个传感器信息量少的缺点，利用各阵元信号之间存在的相关性对输入数据进行融合处理以实现对待测参数的估计。所述的融合处理可以在时域、频域或空域进行。在统计学的意义上，由阵列信号处理所得到的估计结果具有更高的精度。该技术已经在无线通信、雷达、声纳、医学成像、工业自动监控和故障诊断Ⅸａｒｉｍ，１９９６）ｎｌ等场合得到了广泛的应用。随着计算机技术的发展和人机交互需求的不断增加，其中如何在真实的房间场景中定位声源这个课题日益凸现其重要性，基于麦克风阵列的声源定位研究从上世纪八十年代开始就在国际上受到研究者越来越多的关注，而我国则起步较晚。
第一章绪论
减少了手工操作。３）麦克风阵列系统能够识别监控同时发生的多个声源，在一些多人会话等
场合有重要应用。４）麦克风阵列系统可以用于近场测距，这是单麦克风无法实现的。基于上述的优点，麦克风阵列定位技术目前已经在多种场合得到广泛的应用。如视频电话会议（Ｆｌ雒ａｇａｎ’１９８５）嘲中话者定向，控制摄像头指向说话者，并自动根据距离调焦；利用定位信息在混响环境中获取特定语音（Ｆｌａｎａｇａｎ，１９９３）ｔ７ｌ，实现自动监控系统（０Ｉｎｏｌｏｇｏ，１９９３）【８】（室内防盗监控，交通监控），车载系统（Ｇｒｅｎｉｅｒ，１９９２）ｔ９１，语音助听器装置（Ｇ∞即ｂｅｒ岛１９９２）【１０ｌ等。
阵列的使用在我们现实生活中其实非常普遍。“听声辨位”，人的双耳就是一个很好的例子。听觉是一种重要的感觉手段，尤其是在光线昏暗、视物不明和有障碍物阻挡的情况下更是视觉的有益补充。由于耳朵具有特殊的生理结构，能够捕获声源到达双耳的相位差和声压差信息，通过复杂的信息处理，使得我们能够准确地进行辨位，并估计出声源的距离。这是一个心理和生理感知的过程。仿生学在移动机器人领域得到了较多的应用【２１调，这些机器人模仿人的双耳，通过在相应位置放置一对麦克风，实现对声源的初步定位。由于模型和算法的准确度均不能与入耳相比，对于复杂声场下的定位效果并不理想。所以，现在更多的目光投向了多麦克风阵列，通过利用冗余麦克风提供的有效信息，从信号处理的角度解决定位问题。
关键词：声源定位互功率谱相位球形插值随机梯度下降
ＡｂＩ竹■ｃＩ
Ａｂｓｔｒａｃｔ
ＳｏｕｎｄＳＯｔＵ＇∞ｌｏｃａｌｉｚａｔｉｏｎｂａｓｅｄｏｎｍｉｃｒｏｐｈｏｎｅａｒｒａｙｈａｓｒｅｃｅｎｔｌｙｂｅｅｎａｎａｃｔｉｖｅ
ａｒｅａｉｎｓｉｇｎａｌｐｒｏｃｅｓｓｉｎｇ．Ａｓｔｈｅｒｅｓｅａｒｃｈｉｓｄｅｖｅｌｏｐｅｄ，ｔｈｅｔｅｃｈｎｉｑｕｅｈａｓｂｅｅｎ丽ｄｅｌｙａｐｐｌｉｅｄｉｎｔｈｅｆｉｅｌｄｓｓｕｃｈａｓｔｅｌｅｃｏｎｆｅｒｅｎｃｅ，ｉｎｔｅｌｌｉｇｅｎｔｒｏｂｏｔ，ｓｐｅｅｃｈｅｎｈａｎｃｅｍｅｎｔ，ｅｔｏ．Ｈｏｗｅｖｅｒ，ｈｏｗｔｏｌｏｃａｔｅａｔｈｒｅｅ－ｄｉｍｅｎｓｉｏｎａｌｐｏｉｎｔＳＯｔｌｌ＇∞ｉｎａｒｅａｌａｃｏｕｓｔｉｃ
ｔｏｔｈｅｒｅｓｕｌｔｓ，ｉｎｃｒｅａｓｅｓｔｈｅｗｅｉｇｈｔＯｉｌｔｈｅｍａｇｎｉｔｕｄｅｏｆｔｈｏｓｅｆｒｅｑｕｅｎｃｉｅｓ，ｓｕｐｐｒｅｓｓｅｓｔｈｅｕｎｅｘｐｅｃｔｅｄｆａｌｓｅｐｅａｋｓｉｎｔｈｅｃｒｏｓｓｃｏｒｒｅｌａｔｉｏｎａｎｄｉｎｃｒｅａｓｅｓｔｈｅａｃｃｕｒａｃｙｏｆ
ｅｓｔｉｍａｔｉｏｎ；ｆｏｒｌｏｃａｌｉｚａｔｉｏｎｅｓｔｉｍａｔｉｏｎ，ｔｈｅｃｌｏｓｅｄ－ｆｏｒｍｅｓｔｉｍａｔｉｏｎｏｆｓｐｈｅｒｉｃａｌｉｎｔｅｒｐｏｌａｔｉｏｎ（ｓｏｍｅｔｈｏｄｉｓｒｅｇａｒｄｅｄａｓｔｈｅｉｎｉｔｉａｌｖａｌｕｅ，ａｎｄｔｈｅｎＬＳＭａｌｇｏｒｉｔｈｍｉｓｅｍｐｌｏｙｅｄｔｏｏｂｔａｉｎｏｐｔｉｍａｌｒｅｓｏｌｕｔｉｏｎｉｎｔｈｅｌｅａｓｔ－ｓｑｕａｒｅｓｓｅｎｓｅｔｈｒｏｕｇｈｉｔｅｒａｔｉｏｎ．ＴｈｅｐｒｏｐｏｓｅｄｍｅｔｈｏｄｓｏｌｖｅｓｓｏｍｅｐｒｏｂｌｅｍｓｉｎＳＩｍｅｔｈｏｄ．Ｉｔｇｕａｒａｎｔｅｅｓｔｈａｔｔｈｅ
ｐｍｖａｌｅｍｍｅｔｈｏｄｉｎｓｏｕｎｄ￥ｏｕｒｔ∞ｌｏｃａｌｉｚａｔｉｏｎｗｈｉｃｈｃｏｎｓｉｓｔｓｏｆｔｗｏｓｔｅｐｓ，ｔｈａｔｉｓ，ｔｉｍｅｄｅｌａｙｅｓｔｉｍａｔｉｏｎａｎｄｌｏｃａｌｉｚａｔｉｏｎｅｓｔｉｍａｔｉｏｎ．Ｆｏｒｔｉｍｅｄｅｌａｙｅｓｔｉｍａｔｉｏｎ，ａｍｏｄｉｆｉｅｄｃｒｏｓｓｐｏｗｅｒｓｐｅｃｔｒａｌｐｈａｓｅ（ＣＳＰ）ｍｅｔｈｏｄｉｓｐｒｏｐｏｓｅｄ，ｗｈｉｃｈｆｉｌｔｅｒｓＯＵｔｔｈｅｃｒｏｓｓｐｏｗｃｒｓｐｅｃｔｒａｌｏｕｔｓｉｄｅｔｈｅｈｕｍａｎｖｏｉｃｅｆｒｅｑｕｅｎｃｉｅｓｔｈａｔｍａｋｅｓｌｉｔｔｌｅｃｏｎｔｒｉｂｕｔｉｏｎ
中国科学技术大学硕士学位论文
声源定位算法及实现姓名：杨祥清
申请学位级别：硕士专业：模式识别与智能系统
指导教师：汪增福 20070501
摘要
基于麦克风阵列的声源定位是近年来语音信号处理领域的一大研究热点。随着研究的不断深入，目前该项技术已经在视频电话会议、智能机器人、语音增强等场合中得到了广泛的应用。尽管如此，如何在真实的声场环境中定位三维空间的点声源，并进一步提高定位的精度和鲁棒性，仍然是一项有挑战性的课题，也因此受到了研究者越来越多的关注。

e商务文档

声源定位算法及实现

相关文档推荐：