一种基于子带损失函数的语音增强模型训练方法、系统、终端及介质
申请号:CN202511569249
申请日期:2025-10-30
公开号:CN121034333A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种基于子带损失函数的语音增强模型训练方法、系统、终端及介质,涉及语音增强技术领域,方法包括:获取带噪语音和干净语音,并分别确定增强语音对数功率谱以及目标语音对数功率谱;基于梅尔尺度,分别对增强语音对数功率谱与目标语音对数功率谱进行分割,得到增强语音子带与目标语音子带;确定每个增强语音子带与对应的目标语音子带之间的子带损失值;为每个子带损失值分配感知权重,并确定总体损失值并值引导语音增强模型训练。本发明能引导语音增强模型针对不同频率展现差异化的学习行为,从而让语音增强模型输出更贴合人类听觉感知规律的语音,显著提升语音增强后的听感舒适度。
技术关键词
语音
模型训练方法
功率
频率转换
模型训练系统
可读存储介质
索引
听觉
终端
程序
计算机
处理器
人类
模块
存储器
舒适度
曲线
误差