基于说话人感知的语音增强训练方法、装置、设备及介质

申请号：CN202510344834

申请日期：2025-03-24

公开号：CN119851671B

公开日期：2025-05-16

类型：发明专利

摘要

本申请公开了基于说话人感知的语音增强训练方法、装置、设备及介质，涉及人工智能技术领域，包括：将第一带噪语音样本输入至初始语音增强联合训练系统，以便预训练语音增强模块对第一带噪语音样本进行去噪处理，输出第一增强语音样本，确定语音增强损失；通过预训练共享编码器提取第一增强语音样本的第一说话人敏感特征，通过预训练说话人识别模块对第一说话人敏感特征进行说话人ID分类，得到说话人ID分类预测结果，计算说话人识别损失；通过对抗训练鉴别器判断第一说话人敏感特征是否存在噪音，根据噪音判断结果调整对抗损失，以基于各损失更新系统参数，得到训练后的目标语音增强联合训练系统。协调语音增强与说话人识别两个任务之间冲突。

技术关键词

说话人识别语音训练系统样本编码器训练鉴别器多任务损失函数标签优化器模型训练模块存储计算机程序参数人工智能技术更新系统网络训练装置误差可读存储介质处理器