模型训练方法、语音识别方法、装置及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
模型训练方法、语音识别方法、装置及存储介质
申请号:CN202411720947
申请日期:2024-11-27
公开号:CN119920241A
公开日期:2025-05-02
类型:发明专利
摘要
本申请提供了一种模型训练方法、语音识别方法、装置及存储介质,包括:获取多个语音图像对数据,多个语音图像对数据中的目标语音图像对数据包括:对应内容一致的目标语音数据和目标图像数据;针对多个语音图像对数据中的任一目标语音图像对数据,通过语音特征提取模型对目标语音数据进行特征提取,得到目标语音数据的语音特征,语音特征包括:语音全局特征和/或语音局部特征;通过视觉特征提取模型对目标图像数据进行特征提取,得到目标图像数据的图像特征,图像特征包括:图像全局特征和/或图像局部特征;根据语音特征和图像特征,训练语音特征提取模型,提高语音特征的提取准确性和语音识别结果的准确性。
技术关键词
语音特征提取 识别语音数据 语音识别模型 图像全局特征 图像局部特征 视觉特征提取 语音识别方法 模型训练方法 特征提取模块 噪声图像 计算机程序产品 语音识别装置 模型训练装置 样本 电子设备 处理器
系统为您推荐了相关专利信息
语音识别模型 语音识别方法 语种识别 序列 重构
智能防控方法 识别策略 风险 视频 语音特征提取
连续语音识别方法 语音识别模型 连续语音识别系统 隐马尔可夫模型 递归最小二乘算法
图像全局信息 文本识别方法 图像全局特征 字符 文本图像识别
优化控制方法 数字孪生 工业相机 视觉 图像局部特征