当前位置:文档之家› 基于传声器阵列的声源定位

基于传声器阵列的声源定位


C+9/ ,7 L,E8!
,/7@:F8=96 6:E9 I,/F6 :; 345:@,7+E6 :; 7,E9 F943A 967,E37,:/ 3/F D@:?,F96 J,7+ 6:E9 4:=34,G37,:/ 345:@,7+E6K D@969/79FH
$D6B E043> % 3@@3A 6,5/34 D@:=966,/5 & E,=@:D+:/9 3@@3A & 6:8/F 6:8@=9 4:=34,G37,:/ & B@:66PLD9=7@8EPM+369
了几种搜索算法 ! 给出了基于互功率谱相位加权延迟估计的声源定位实验结果 " $ 关键词 % 阵列信号处理 & 传声器阵列 & 声源定位 & 互功率谱相位 $ 中图分类号 % *+)!#,$ 文献标识码 % .
/0123 /01456 70589:;8<:02 =8>63 02 ?:540@A026 .448B ’() *+,-.,/ ! 01 23,-4,/5
!"$
最小均方自适应滤波时延估计 该 方 法 的 基 本 原 理 就 是 利 用 G34 自 适 应 滤 波 方
法 求得时 延 ! 即 将 6 个 传 声 器 接 收 信 号 .7 #"$ 和 .6#"$ 分别当作目标信号和输入信号 ! 用 .6#" $ 逼近 .7#"$! 通 过调整滤波系数 ! 便可得到时延值 % 表示为
>%! 声 源 位 于 %’#*3<!4<!5<%"! 各 传 声 器 和 声 源 到 原 点 距
离 为 6" 和 9<& 其 中 6".
列 ! 其中 ! #" $为声源 !#5#" $和 #6#" $为传声器 7 和传声 器 8 拾 取 的 信 号 !$5 #" $ 和 $- #" $ 为 传 声 器 5!- 拾 取 的 除了声源信号外附加的噪声信号 % 因此 ! 在理想环境 下 ! 传声器 5!- 得到的信号可表示为
!%!
高阶统计量时延估计及基于建立信号和互功率 时延估计 高阶统计量时延估计和传统的广义互相关函数法
437,:/ :; 7+9 6:8/F 6:8@=9 4:=34,G37,:/ .369F :/ B@:66-LD9=7@8E-M+369 NBLMO 7,E9 F943A 967,E37,:/ E97+:F ,6 346:
"
引言
传声器阵列是指由一定的几何结构排列而成的若
论知识 !因而成为语音信号处理中难度大 ’ 且具有挑战 性的研究课题 ) 传声器阵列声源定位具有广泛的应用 前景 ! 它可用于电话会议系 统 ’ 视频会议系统 ’ 可视电 话等系统中控制摄像头和传声器阵列波束方向对准正 在说话的人 & 也可用于语音及说话人识别软件的前端 预处理 !以提供高质量的声音信号 ! 提高语音及说话人 识别软件的识别率 & 亦可用于强噪声环境下的声音获 取 ’ 大型场所的会议记 录 ! 以提高声音拾取的质量 & 还 可用于助听装置中 ! 更好地为耳障患者服务等 )
传声器对中点的距离 &
!"$
空间几何搜索声源定位法 设系统有 (") 个位于 %"#$3"!4"!5"%" $".>!)!( $)%!"*$% 误差准则 如果每组传声器的时延估计 !" 受到均值为零 ( 方
传声器组成 ! 传声器 > 为参考点 ! 坐标原点为 %>.*> !> !
和基于线性内插 $’( % 的算法 & 基于空间搜索算法运算 量大 ! 同时也易于陷入局部极值点 ’ 而基于空间几何的 方法虽然运算量小 ! 但它对传声器阵列的摆放有严格 的要求 ! 同时定位的精度并不是很高 ’’( 方法在远场定 位中精度较高 ! 但它需要较大数量的传声器阵列 ! 这就 增加了信号处理的复杂性 ! 同时它的近场定位误差很 大 ! 这对于拾取近场语音信号的处理方法不利 &
干个传声器组成的阵列 !它具有很强的空间选择性 ! 而 且不需移动传声器就可获取移动的声源信号 ! 同时它 还可以在一定的范围内实现声源的自适应检测 ’ 定位 及跟踪 ! 这使得它在诸多领域有着广泛的应用 ( 早在
!# 世纪七八十年代 ! 就已经开始将传声器阵列应用于
语音信号处理的研究中 ! 进入 $# 年代以来 ! 基于传声 器阵列的语音信号处理算法逐渐成为一个新的研究热 点 ) 目前传声器阵列系统已有许多应用 !其中包括视频 会议 ’ 语音识别 ’ 车载系统环境 ’ 大型场所的会议 记录 系统以及助听装置等 ) 传声器阵列声源定位是指用传声器阵列拾取声音 信号 !通过对多路声音信号进行分析与处理 ! 在空间域 中定出一个或是多个声源的平面或空间坐标 ! 即得到 声源的位置 ! 以进一步控制摄像机和传声器阵列波束 对准正在说话的人 ) 同时 Q 由于它涉及到阵列信号处 理 ’ 数字信号处理 ’模式识别和数据融合等多方面的理
!
声源定位技术
现有的声源定位技术基本上可以分为 % 类 ! 首先
是基于最大输出功率的可控波束形成技术 ! 它的基本 思想就是将各阵元采集来的信号进行加权求和形成波 束 !通过搜索声源的可能位置来引导该波束 ! 修改权值 使得传声器阵列的输出信号功率最大 ) 在传统的简单 波束形成器中 !权值取决于各阵元上信号的相位延迟 ! 同时相位延迟和声达时间延迟 RS< 有关 ! 因此叫作延 时求和波束形成器 ) 后来出现的一些更复杂的波束形 成系统中 !在进行时间校正的同时 ! 还对信号进行了滤 波 !根据不同的滤波器形成了不同的算法 ) 其次就是高
很相似 ! 不同的是它通过计算接收信号的三阶累积量 来压缩空间的加性高斯噪声 ! 由于该方法彻底地抑制 #7 $ 了高阶统计 量 #I+4$ 域 高 斯 噪 声 ! 所 以 在 低 信 噪 比 环 境下 ! 它 相 对 于 传 统 的 011 法 有 较 好 的 时 延 估 计 结 果% 基于建立信号和互功率时延估计利用了人耳定位 原理 ! 用快速傅里叶变换提取建立信号 ! 然后在通过估 计 6 个传声器的建立信号的互相关功率谱 ! 并减去平 稳的背景噪声互相关功率谱 ! 然后用互功率谱相位法 来准确地估计传声器之间的信号时延 ! 这种方法很大 #- $ 程度上抑制了混响的影响 ! 也是一种相对可靠的时延 估计方法 %
F基金项目 G 国家自然科学基金项目 *T#!U!#%U #K
电声技术 !""#$"%
" !
!"#$%&’()’* +,- ./0*"&1",’
分辨率谱估计技术 ! 这类的声源定位技术基于高分辨 率的谱估计算法 ! 其中包括了自回归 !" 模型 " 最小方 差谱估计 ##$ $ 和特征值分解方法 # 如 #%&’( 算法 $ 等 ! 所有这些方法都通过获取了传声器阵列的信号来计算 空间谱的相关矩阵 % 这时如果所需的矩阵未知 ! 则必须 通过已得到的数据进行估计 ! 这就要求空间中的声源 或噪声必须平稳时不变的 !但这对于语音信号来说 ! 这 种实际的声学环境很难实现 & 同时 ! 基于高分辨率的谱 估计声源定位还有很多的假设条件 ! 这对一个实时实 现的系统来说也不可能 &而且在计算中 ! 这种谱估计方 法的运算量很大 !还很容易导致定位不准确 ! 因而在现 代的声源定位系统中很少采用 % 最后就是基于声达时 间差 #)*+, $的定位技术 ! 这类声源定位方法一般分为 其中 !*% % #)$9+ #7 #)$#8 #)$ 是传声器 7!8 拾取信号的
:!
(% % #! $9
7 8
! "#)$* #)$< ! $ #)$< >)
;! %7%8 :! =-%)! ;! %7%-
=8#)!
>)9
) 电声技术 !""#$"% (
扬声器与传声器
!"#$%&’()’* +,- ./0*"&1",
2
!
基于时延的声源定位
考虑到声源定位系统的实时实现制约因素的影响 !
/
/
声达时间差 ).+, 估计
在现有的传声器阵列声源定位方法中 ! 基于时延
.7#"$9$1#0 $.6#";0 $:2#"$
09;/
#H $
估计定位法精度较高 !同时也易于实现实时系统 % 而时 延估计的精度是关系到声源定位精确与否的关键因 素 ! 时延估计的方法很多 ! 运用较多的是广义互相关函 数法 #011 $和最小均方差自适应滤波法 #234 $%
7 -
扬声器与传声器
"
?
#
8
相关谱 !& #)$ 是权函数 !$ # # #)$ 9& #)$4 # # #)$ 是 广义相
7 7 8
关谱 ! 这样声达时间差 )*+, 为
" ’9@AB C@D ( #!$ ! ##
!
, -
#E $
根 据 式 #- $! 选 取 不 同 的 权 函 数 & #)$ 就 可 得 到 不 同的声达时间差 ).+, 的不同算法 ! 它的选取可根据 实际的声学环境选择相应的准则 ! 使得 -% % #! $ 有个比
7 6
由 最 小 均 方 误 差 准 则 ! 当 滤 波 器 系 数 1 #"$ 9
(. . #"$ 6 时 !6 个信号之间的均方误差 + % 取最小 2 #" $ & (. . #"$
相关主题