摘要
本发明涉及声音识别技术领域,尤其涉及基于多频带分析的声纹识别方法及装置,包括有数据准备与预处理、动态频带划分与特征提取、模型训练与优化、实时推理与部署以及评估与迭代;本发明相对于现有技术采用固定频带划分进行声纹特征提取,存在频带划分僵化、无法适应复杂噪声环境与跨设备频响差异的缺陷,本方案通过可学习滤波器组动态优化频带中心频率与带宽,在训练中结合损失函数反向传播自适应聚焦区分性强的频段(如基频谐波与共振峰区域),同时引入频带注意力机制抑制低信噪比子带干扰,此方案使声纹识别在噪声环境下的错误率降低,跨设备场景识别精度提升,显著增强了复杂场景的鲁棒性。