问答信息的生成及多模态大模型训练方法和装置
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
问答信息的生成及多模态大模型训练方法和装置
申请号:
CN202410796817
申请日期:
2024-06-19
公开号:
CN118586502A
公开日期:
2024-09-03
类型:
发明专利
摘要
本公开提供了问答信息的生成及多模态大模型训练方法和装置,涉及计算机视觉、深度学习以及大模型等人工智能领域,可应用于光学字符识别等场景。其中的问答信息的生成方法可包括:获取待处理的目标图像,目标图像中包括待解答的问题内容以及问题内容对应的配图;分别获取问题内容对应的文本模态信息以及配图对应的图像模态信息;结合文本模态信息以及图像模态信息,利用多模态大模型确定出问题内容对应的解答信息。
技术关键词
前馈神经网络
多模态
图像编码器
转换文本
视觉特征
特征金字塔网络
解码器
深度残差网络
融合特征
光学字符识别
序列
模型训练方法
位置编码信息
图框
模型训练模块
图像获取模块
多层感知机
系统为您推荐了相关专利信息
1
一种用户情绪识别方法、装置、电子设备及存储介质
情绪识别方法
多模态特征
典型
场景
曲线
2
一种远程监测环网柜供电状态的系统及方法
环网柜供电
监测环网柜
故障预测模型
动态调整机制
校准
3
围术期个体化最佳心排量精准评估及术中管理优化方法
管理优化方法
多生理参数采集
皮尔逊相关系数
个性化阈值
血流动力学管理
4
一种基于三光融合的电力设备诊断方法
深度特征提取网络
诊断方法
可见光图像
多模态
融合特征
5
自动驾驶紧急响应方法、系统、电子设备和存储介质
语音指令识别
文本
样本
编码
策略标签