基于目标检测与规则增强图文问答方法、装置及电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于目标检测与规则增强图文问答方法、装置及电子设备
申请号:CN202511434622
申请日期:2025-10-09
公开号:CN120892590A
公开日期:2025-11-04
类型:发明专利
摘要
本发明涉及数据处理技术领域,公开了一种基于目标检测与规则增强图文问答方法、装置及电子设备,其中,方法包括:获取并存储目标对象的多个基础图像;将基础图像输入到预先构建的目标检测模型,提取基础图像的第一特征数据;将第一特征数据输入到预先构建的规则增强模型,提取基础图像的第二特征数据;将第二特征数据转换成文本描述语句;根据多个基础图像以及多个文本描述语句生成多个图文描述对;响应于接收到针对目标对象的提问信息,将提问信息转换为目标语义向量,基于目标语义向量从多个图文描述对中检索出目标图文描述对,根据目标图文描述对生成针对提问信息的答复信息。本发明的方法,能够实现图像内容的深度理解与语义级问答。
技术关键词
图文 问答方法 语义向量 对象 图像 基础 空间约束条件 语句 文本 前端采集设备 关系 典型 电子设备 可读存储介质 问答装置 数据处理技术 处理器 程序 模式