一种基于大语言模型的语音识别方法、装置及设备
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于大语言模型的语音识别方法、装置及设备
申请号:
CN202510830908
申请日期:
2025-06-20
公开号:
CN120412560A
公开日期:
2025-08-01
类型:
发明专利
摘要
本说明书实施例提供一种基于大语言模型的语音识别方法。该方法包括:获取待输入语音;通过音频编码器从待输入语音中提取语音特征;利用连接时序分类预测层对所述语音特征进行解码,得到连接时序分类预测结果;将所述语音特征和连接时序分类预测结果作为提示内容输入至大语言模型,所述大语言模型根据所述提示内容生成语音识别结果。通过本发明提供的方法,可以缓解大语言模型的幻觉问题,能够提升语音识别的准确性。
技术关键词
大语言模型
语音特征
时序
语音识别方法
字符
生成语音
音频编码器
语音识别装置
语音识别模块
特征提取模块
序列
解码模块
处理器
矩阵
存储器
电子设备
文本
标记