一种跨语种语音识别方法、系统、设备及存储介质

申请号：CN202511031151

申请日期：2025-07-25

公开号：CN120808756A

公开日期：2025-10-17

类型：发明专利

摘要

本申请公开了一种跨语种语音识别方法、系统、设备及存储介质，本方法通过将训练语音进行预处理，得到训练语音帧序列；从训练语音帧序列中提取内容表征、说话人表征以及音高表征；根据内容表征、说话人表征以及音高表征进行语音重构，得到目标语种语音；基于训练语音，根据目标语种语音构建得到目标语种语音识别模型；响应目标语种识别指令，获取目标语音；将目标语音输入至目标语种语音识别模型，得到目标语种语音识别模型输出的识别结果，能够通过跨语种特征解耦与自监督迁移机制，在极低标注数据条件下实现方言声学特性精准建模，显著提升桂柳话复杂声调与特色词汇的识别鲁棒性，实现方言场景下的高效泛化应用。

技术关键词

语音识别模型语音识别方法语种识别序列重构计算机可执行指令密集特征韵律特征调控策略解码器声学特征频谱特征损失函数优化语音识别系统编码器参数深度学习网络阶段可读存储介质

系统为您推荐了相关专利信息

基于大数据的学生异常行为检测方法

双向特征金字塔学生大数据课堂注意力数据标签

基于隐马尔科夫模型的锂电池健康状态预测方法、电子设备及介质

锂电池健康状态隐马尔科夫模型隐马尔可夫模型参数电子设备

基于多模态信息的人机协作搬运过程机械臂共享控制方法

共享控制方法人机协作多模态信息机械臂卡尔曼滤波器

一种基于大数据的家禽养殖监测管理系统

家禽监测管理系统监测管理方法智能视觉监控大数据

一种模拟游泳的肢体康复训练装置和控制方法

肢体康复训练装置生理反馈信息反馈控制模块力学传感器序列