摘要
本发明公开了一种模型训练方法、语音识别方法、装置、设备及存储介质,其中模型训练方法包括:获取合成语音数据集和真实语音数据集并构建语音识别模型,模型包括编码器、适配模块和解码器;利用合成语音数据集对编码器和解码器进行预训练;冻结预训练后的解码器参数,利用真实语音数据集对编码器参数和适配模块参数进行微调。本发明有效解决了合成语音与真实语音之间的域偏移问题,在少量真实语音数据情况下显著提升模型性能,同时通过冻结解码器防止灾难性遗忘,保持了模型的通用能力,模型泛化能力强,适用于低资源场景下的语音识别应用。