基于视觉特征的物体交互分析方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于视觉特征的物体交互分析方法、装置、设备及介质
申请号:CN202511492014
申请日期:2025-10-20
公开号:CN120997743A
公开日期:2025-11-21
类型:发明专利
摘要
本发明涉及人工智能技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于视觉特征的物体交互分析方法、装置、设备及介质,包括:获取预测帧的多尺度视觉特征,检测显著物体,结合历史视频帧生成动作描述对并构建动作上下文,提取语言特征序列与视觉特征序列,拼接并映射为统一维度,利用自注意力机制实现交互融合,重组为多尺度融合特征图,输出交互物体的空间位置分布、动作类别与时间接触特征。本发明通过历史视频帧的动作描述信息与显著物体列表联合生成文本化动作上下文,结合多尺度视觉特征与语言特征序列,通过统一映射、跨模态交互与特征融合,提升物体交互分析在多变环境中的准确性与稳定性。
技术关键词
视觉特征 融合特征 序列 接触特征 分析方法 交互物体 生成多尺度 视频帧 注意力机制 跨模态 时间偏移量 语义 列表 编码 分析装置 空间结构