在免提通话设备中,声学回声(Acoustic Echo)和背景噪声(Background Noise)是影响用户体验的两大主要因素。随着设备向紧凑化、高声压输出方向发展,麦克风与扬声器的距离被压缩至数厘米,传统声学回声消除(AEC)算法面临收敛速度不足、双讲检测困难、非线性失真残留等挑战。
本文基于一款典型的紧凑型语音处理模块——A-29的技术资料,从AEC算法能力、双麦克风波束成形、参考信号适配、拾音距离控制及接口设计等维度进行分析,为音频系统工程师提供技术参考。
一、回声消除的核心指标:高回声返回损耗与延迟容忍
AEC系统的关键性能指标包括回声返回损耗(ERL)和可处理的回声路径延迟。A-29模块标称的消回音能力为100dB,这意味着当扬声器播放的信号强度比麦克风拾取的原始语音高100dB时,处理后残留回声仍可低于听觉阈值。在紧凑结构中,由于麦克风距离扬声器仅1-6cm,ERL往往超过60dB,因此100dB的指标提供了充足的裕量,能够应对结构反射、壳体共振等复杂声学环境。
另一个重要参数是可消除回声的空间延迟时间,A-29达到100ms。该延迟对应声音在空气中传播约34米,但更实际的意义在于覆盖系统链路中的固定延迟——例如蓝牙编解码、网络传输、音频重采样等环节产生的缓冲延迟。对于大多数消费电子和工业对讲设备,100ms足以容纳整个下行链路的延迟波动,保证了自适应滤波器能够在正确的时间窗口内对齐参考信号与回声信号。
从算法层面看,实现100dB的ERL通常需要结合自适应滤波与非线性处理(NLP)。自适应滤波器(如NLMS或频域分块滤波器)负责线性回声的抵消,而NLP在残余回声仍高于阈值时对其进行衰减,同时注入舒适噪声以避免语音空洞感。双麦结构(见第三节)可进一步提升NLP的准确性。
二、短路径高声压下的收敛与双讲检测
当麦克风与扬声器距离小于5cm且扬声器音量超过95dB SPL时,回声信号几乎瞬时到达麦克风,幅度远超近端语音。此时AEC面临两个工程难点:
快速收敛:滤波器需要在数十毫秒内完成初始收敛,否则远端用户会听到明显的回声尾巴。A-29能够在1cm距离、100dB喇叭音量下完全屏蔽回音,表明其自适应步长控制具备子带独立调节能力——低频部分快速收敛,高频部分谨慎更新。
双讲检测(DTD)鲁棒性:在高回声电平下,传统基于相关性的DTD容易将近端语音误判为回声变化,导致滤波器错误更新,甚至发散。A-29支持双麦克风输入,通过波束成形估算声源方向,辅助区分“来自扬声器方向的回声”和“来自用户方向的近端语音”,从而在双讲期间冻结滤波器系数更新。
三、双麦克风波束成形:空间滤波增强回声抑制与降噪
双麦克风阵列(间距推荐6cm,范围3-16cm)可构建广义旁瓣抵消(GSC)结构。GSC包含三个部分:
固定波束形成器(Fixed Beamformer):对准期望声源方向(如设备正前方)。
阻塞矩阵(Blocking Matrix):产生不含期望信号、仅含干扰信号的参考。
自适应噪声消除器:自适应地滤除输出信号中的干扰成分。
在A-29中,波束成形同时服务于两个目的:
(1)增强回声抑制
扬声器的物理位置相对于麦克风阵列是固定的(例如在设备底部)。通过阻塞矩阵保留来自扬声器方向的信号,可以生成一个“空间回声参考”,与传统的电学参考信号(LINE_IN)进行联合处理。这种双参考AEC结构可以有效应对参考信号与声学回声之间的非线性失真(如扬声器的谐波失真、D类功放的残留载波)。
(2)噪声抑制
将期望方向主瓣设置为±30°,侧向环境噪声可获得10-15dB的空间衰减。后置的单通道降噪(ENC)进一步压制剩余稳态噪声,标称的最佳降噪指标为45dB。这一数值需要综合测试条件(稳态噪声类型、信噪比、麦克风一致性)来验证,但在双麦配置下达到30dB以上的降噪量是合理的。
工程注意事项:
两个数字麦克风必须型号一致、灵敏度偏差<1dB,否则方向图畸变。
间距过小(<3cm)降低低频分辨力;间距过大(>16cm)引入栅瓣(高频空间混叠)。
四、参考信号的三种取点方式与线性失真管理
AEC算法需要参考扬声器播放的信号。A-29提供三种参考信号接入方式,对应不同的系统拓扑和失真成分:
| 取点位置 | 信号来源 | 包含的非线性失真 | 适用场景 |
|---|---|---|---|
| 功放输入端 | 小信号(DAC输出) | 极少(仅前置运放) | 功放与扬声器失真较小,或对回声要求中等 |
| 功放输出端(喇叭两端) | 大信号 | 功放失真、扬声器电-声转换部分 | 大功率功放或D类输出,需分压+滤波 |
| 模块SPK输出后接外部功放 | 模块内部参考 | 仅包含模块内DAC和前置放大 | 回声消除效果最优,需额外功放级 |
从信号完整性角度看,LINE_IN输入端ADC的最大幅度为1Vrms,超过该值会造成削顶,导致参考信号严重非线性。因此,若从功放输出端取信号(例如2W以上功放输出可达3-5Vrms),必须使用电阻分压网络。对于D类功放,还必须串联LC低通滤波器(截止频率约30kHz)滤除脉宽调制载波,避免载波进入ADC后产生采样混叠。
五、拾音距离的AGC策略与噪声底噪权衡
A-29支持通过固件切换拾音距离模式:近场10cm,中距几十厘米,远场最远500cm。这一功能的核心是自动增益控制(AGC)与增益调度。
近场模式:低增益,麦克风主要拾取直达声,背景噪声被自然衰减,信噪比最佳。
远场模式:AGC在信号电平低时提升增益最多约40dB。此时麦克风的等效输入噪声(EIN)以及PCB上的数字噪声都会被放大,因此要求麦克风本底噪声低于-115dBu,且电源纹波控制在50mVpp以内。
A-29的模拟输出信噪比为91dB,对应在最大输出1.5Vrms时本底噪声约42μVrms。在远场模式下,有用信号可能低至1-2mVrms,此时模拟输出信噪比下降至27-30dB,可闻底噪增加,但仍可保证语音可懂度。设计者应根据实际应用环境(背景噪声水平)选择是否启用远场模式。
六、数字音频接口的抗干扰价值
A-29同时提供模拟LINE OUT和I2S数字输出,二者并行有效。I2S接口(LRCK、BCK、DOUT)在以下场景中具有明显优势:
长距离板间传输(>20cm)或排线连接,模拟信号容易耦合噪声。
电磁干扰强烈的环境(车载、工业设备、对讲机)。
主控端无多余ADC通道,但有I2S输入接口(如DSP、Codec的数字接口)。
I2S为从机模式,需要主控提供BCK和LRCK时钟。典型采样率为16kHz或48kHz,对应BCK=0.512MHz或3.072MHz。时钟抖动对数据传输的影响极小(只要满足建立保持时间),但I2S时钟线的高速摆幅可能辐射谐波,建议在PCB上串接22Ω电阻并远离模拟音频线。
七、电气与机械可靠性要点
供电:DC 4V-6.5V,典型电流28-30mA,功耗约0.15W,适合电池设备。
工作温度:-20℃~85℃,湿度<90%(无冷凝),可用于室外监控、车载等环境。
模块尺寸:37.5×16mm,半孔焊盘间距1mm,兼容A-09/A-06脚位,便于原位替换。
模拟输入输出阻抗:LINE_OUT 10kΩ驱动能力,LINE_IN 47kΩ输入阻抗。
八、总结与应用建议
A-29模块的技术特征可归纳为三点:
强鲁棒性AEC:100dB回声抑制、100ms延迟容忍,适配紧凑结构和高声压输出。
双麦空间滤波:同时辅助回声消除和背景噪声压制,降噪量可达45dB。
灵活的参考信号与接口:支持功放前/后取点、模拟/I2S输出,适应多种系统架构。
在设计集成时,建议工程师重点关注:
实际回声路径延迟测量,确保在100ms范围内;
双麦克风的一致性筛选与摆放精度;
从功放输出取参考信号时的分压与滤波(尤其D类功放);
远场模式下的环境噪声本底,避免底噪过大影响体验。
通过合理的结构布局与信号连接,A-29能够在紧凑型免提通话产品中实现全双工流畅、回声干净、噪声可控的语音性能。