基于多频带分析的声纹识别方法及装置

申请号：CN202510877113

申请日期：2025-06-27

公开号：CN120932653A

公开日期：2025-11-11

类型：发明专利

摘要

本发明涉及声音识别技术领域，尤其涉及基于多频带分析的声纹识别方法及装置，包括有数据准备与预处理、动态频带划分与特征提取、模型训练与优化、实时推理与部署以及评估与迭代；本发明相对于现有技术采用固定频带划分进行声纹特征提取，存在频带划分僵化、无法适应复杂噪声环境与跨设备频响差异的缺陷，本方案通过可学习滤波器组动态优化频带中心频率与带宽，在训练中结合损失函数反向传播自适应聚焦区分性强的频段(如基频谐波与共振峰区域)，同时引入频带注意力机制抑制低信噪比子带干扰，此方案使声纹识别在噪声环境下的错误率降低，跨设备场景识别精度提升，显著增强了复杂场景的鲁棒性。

技术关键词

声纹识别方法滤波器多模态特征鲁棒模型低功耗策略动态语音全局平均池化跨设备低信噪比抑制低频噪声估计噪声功率声纹识别装置声音识别技术注意力机制时域特征提取频域特征提取

特高压换流变压器阀侧套管电容检测方法重构方法电流

一种基于广义最小二乘滤波器的GNSS数据处理方法

数据处理方法原始观测数据马尔可夫模型滤波器广义

基于参数优化特征模态分解的行星齿轮箱故障诊断方法

滤波器行星齿轮箱故障样本包络冲击故障

一种基于深度学习的高光谱数据处理方法

光谱数据处理方法深度学习模型随机森林模型像素光谱检测技术

一种应用于三屏笔记本电脑的智能问答与模型训练方法

模型训练方法笔记本电脑屏幕资源分配自动语音识别技术