摘要
本申请公开了一种跨语种语音识别方法、系统、设备及存储介质,本方法通过将训练语音进行预处理,得到训练语音帧序列;从训练语音帧序列中提取内容表征、说话人表征以及音高表征;根据内容表征、说话人表征以及音高表征进行语音重构,得到目标语种语音;基于训练语音,根据目标语种语音构建得到目标语种语音识别模型;响应目标语种识别指令,获取目标语音;将目标语音输入至目标语种语音识别模型,得到目标语种语音识别模型输出的识别结果,能够通过跨语种特征解耦与自监督迁移机制,在极低标注数据条件下实现方言声学特性精准建模,显著提升桂柳话复杂声调与特色词汇的识别鲁棒性,实现方言场景下的高效泛化应用。