基于伪标签的无监督视觉定位系统

申请号：CN202411019001

申请日期：2024-07-29

公开号：CN119006779A

公开日期：2024-11-22

类型：发明专利

摘要

本发明属于图像处理技术领域，具体为基于伪标签的无监督视觉定位系统。本发明包括区域提议生成模块、区域描述生成模块、查询构建模块;区域提议生成模块通过预训练的目标检测器识别图像中可能存在的实体区域、类别及其置信度，通过类别偏置消除器解决置信度在类别分布的不均匀问题;区域描述生成模块利用多模态大语言模型的跨模态知识生成区域提议的描述，通过描述矫正器修正错误描述;查询构建模块通过修饰树和提示语模板构建查询。本发明利用预训练的目标检测器和多模态大语言模型蕴含的跨模态知识，构建开放词汇的视觉定位伪标签，可显著提升视觉定位的准确率。

技术关键词

视觉定位系统实体大语言模型矫正器检测器多模态模块标签构建海量同义词结点图像处理技术模板代表定义互联网数据坐标

系统为您推荐了相关专利信息

基于自然语言处理的测试用例的生成方法以及装置

自然语言生成方法生成测试用例合规性模板

一种基于代理模型的动态仿真验证方法

仿真数据仿真验证方法动态径向基函数模型内部网络结构

适用于大语言模型的数据处理方法及装置

网络大语言模型数据处理方法处理单元信息处理

数据部署方法、系统、电子设备、存储介质及程序产品

数据部署方法语句指令生成标签数据部署系统

合同智能识别方法、装置、设备及存储介质

动态上下文文本智能识别方法上下文感知技术数据