模型训练方法、语音识别方法、装置、设备及存储介质

申请号：CN202511346695

申请日期：2025-09-19

公开号：CN120895027A

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种模型训练方法、语音识别方法、装置、设备及存储介质，其中模型训练方法包括：获取合成语音数据集和真实语音数据集并构建语音识别模型，模型包括编码器、适配模块和解码器；利用合成语音数据集对编码器和解码器进行预训练；冻结预训练后的解码器参数，利用真实语音数据集对编码器参数和适配模块参数进行微调。本发明有效解决了合成语音与真实语音之间的域偏移问题，在少量真实语音数据情况下显著提升模型性能，同时通过冻结解码器防止灾难性遗忘，保持了模型的通用能力，模型泛化能力强，适用于低资源场景下的语音识别应用。

技术关键词

模型训练方法构建语音识别模型语音识别方法解码器语音识别文本数据适配器分类准确率模块样本语音识别装置编码器参数模型训练装置计算机设备处理器程序