一种基于子带损失函数的语音增强模型训练方法、系统、终端及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于子带损失函数的语音增强模型训练方法、系统、终端及介质
申请号:CN202511569249
申请日期:2025-10-30
公开号:CN121034333A
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开了一种基于子带损失函数的语音增强模型训练方法、系统、终端及介质,涉及语音增强技术领域,方法包括:获取带噪语音和干净语音,并分别确定增强语音对数功率谱以及目标语音对数功率谱;基于梅尔尺度,分别对增强语音对数功率谱与目标语音对数功率谱进行分割,得到增强语音子带与目标语音子带;确定每个增强语音子带与对应的目标语音子带之间的子带损失值;为每个子带损失值分配感知权重,并确定总体损失值并值引导语音增强模型训练。本发明能引导语音增强模型针对不同频率展现差异化的学习行为,从而让语音增强模型输出更贴合人类听觉感知规律的语音,显著提升语音增强后的听感舒适度。
技术关键词
语音 模型训练方法 功率 频率转换 模型训练系统 可读存储介质 索引 听觉 终端 程序 计算机 处理器 人类 模块 存储器 舒适度 曲线 误差