模型训练方法、语音识别方法、装置及存储介质

申请号：CN202411720947

申请日期：2024-11-27

公开号：CN119920241A

公开日期：2025-05-02

类型：发明专利

摘要

本申请提供了一种模型训练方法、语音识别方法、装置及存储介质，包括：获取多个语音图像对数据，多个语音图像对数据中的目标语音图像对数据包括：对应内容一致的目标语音数据和目标图像数据；针对多个语音图像对数据中的任一目标语音图像对数据，通过语音特征提取模型对目标语音数据进行特征提取，得到目标语音数据的语音特征，语音特征包括：语音全局特征和/或语音局部特征；通过视觉特征提取模型对目标图像数据进行特征提取，得到目标图像数据的图像特征，图像特征包括：图像全局特征和/或图像局部特征；根据语音特征和图像特征，训练语音特征提取模型，提高语音特征的提取准确性和语音识别结果的准确性。

技术关键词

语音特征提取识别语音数据语音识别模型图像全局特征图像局部特征视觉特征提取语音识别方法模型训练方法特征提取模块噪声图像计算机程序产品语音识别装置模型训练装置样本电子设备处理器

系统为您推荐了相关专利信息

一种跨语种语音识别方法、系统、设备及存储介质

语音识别模型语音识别方法语种识别序列重构

基于情绪识别的交易风险智能防控方法及装置

智能防控方法识别策略风险视频语音特征提取

一种工业机器人连续语音识别方法与系统

连续语音识别方法语音识别模型连续语音识别系统隐马尔可夫模型递归最小二乘算法

一种基于图像全局信息查询解码的文本识别方法

图像全局信息文本识别方法图像全局特征字符文本图像识别

一种基于机器视觉的工件追剪优化控制方法及系统

优化控制方法数字孪生工业相机视觉图像局部特征