基于说话人感知的语音增强训练方法、装置、设备及介质
申请号:CN202510344834
申请日期:2025-03-24
公开号:CN119851671B
公开日期:2025-05-16
类型:发明专利
摘要
本申请公开了基于说话人感知的语音增强训练方法、装置、设备及介质,涉及人工智能技术领域,包括:将第一带噪语音样本输入至初始语音增强联合训练系统,以便预训练语音增强模块对第一带噪语音样本进行去噪处理,输出第一增强语音样本,确定语音增强损失;通过预训练共享编码器提取第一增强语音样本的第一说话人敏感特征,通过预训练说话人识别模块对第一说话人敏感特征进行说话人ID分类,得到说话人ID分类预测结果,计算说话人识别损失;通过对抗训练鉴别器判断第一说话人敏感特征是否存在噪音,根据噪音判断结果调整对抗损失,以基于各损失更新系统参数,得到训练后的目标语音增强联合训练系统。协调语音增强与说话人识别两个任务之间冲突。
技术关键词
说话人识别
语音
训练系统
样本
编码器
训练鉴别器
多任务损失函数
标签
优化器
模型训练模块
存储计算机程序
参数
人工智能技术
更新系统
网络
训练装置
误差
可读存储介质
处理器