音响论坛 门户 查看内容

声源定位技术的分类

2009-8-11 09:40| 发布者: | 查看: 1174| 评论: 0

现有的声源定位技术基本上可以分为3类,首先是基于最大输出功率的可控波束形成技术,它的基本思想就是将各阵元采集来的信号进行加权求和形成波束,通过搜索声源的可能位置来引导该波束,修改权值使得传声器阵列的输出信号功率量最大。

在传统的简单波束形成器中,仅值取决于各阵元上信号的相位延迟,同时相位延迟和声达时间延迟DOA有关,因此叫作延时求和波束形成器。后来出现的一引起更复杂的波束形成系统中,在进行时间校正的同时,还对信号进行了滤波,根据不同的滤波器形成了不同的算法。其次就是高分辨率谱估计技术,这类的声源定位技术基于高分辨率的谱估计算法,其中包括了自回归AR模型、最小方差谱估计(MV)和特征值分解方法(如Music算法)等,所有这些方法都通过获取了传声器阵列的信号来计算空间谱的相关矩阵。

这时如果所需的矩阵未知,则必须通过已得到的数据进行估计,这就要求空间中的声源或噪声必须平稳时不变的,但这对于语音信号来说,这种实际的声学环境很难实现;同时,基于高分辨率的谱估计声源定位还有很多的假设条件,这对一个实时实现的系统来说也不可能;而且在计算中,这种谱估计方法的运算量很大,还很容易导致定位不准确,因而在现代的声源定位系统中很少采用。

最后就是基于声达时间差(TDOA)的定位技术,这类声源定位方法一般分为2个步骤进行:先进行声达时间差估计,并从中获取传声器阵列中阵元间的声延迟TDOA;再利用获取的声达时间差,结合已知的传声器阵列的空间位置进一步定出声源的位置。这种方法的计算量一般比前2种要小,更利于实时处理,所以它在语音信号的声源定位中占有很大的比重。(电声技术)

微信扫码关注公众号