一种基于子带损失函数的语音增强模型训练方法、系统、终端及介质

申请号：CN202511569249

申请日期：2025-10-30

公开号：CN121034333A

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了一种基于子带损失函数的语音增强模型训练方法、系统、终端及介质，涉及语音增强技术领域，方法包括：获取带噪语音和干净语音，并分别确定增强语音对数功率谱以及目标语音对数功率谱；基于梅尔尺度，分别对增强语音对数功率谱与目标语音对数功率谱进行分割，得到增强语音子带与目标语音子带；确定每个增强语音子带与对应的目标语音子带之间的子带损失值；为每个子带损失值分配感知权重，并确定总体损失值并值引导语音增强模型训练。本发明能引导语音增强模型针对不同频率展现差异化的学习行为，从而让语音增强模型输出更贴合人类听觉感知规律的语音，显著提升语音增强后的听感舒适度。

技术关键词

语音模型训练方法功率频率转换模型训练系统可读存储介质索引听觉终端程序计算机处理器人类模块存储器舒适度曲线误差