基于大模型的目标定位方法、装置、电子设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于大模型的目标定位方法、装置、电子设备及存储介质
申请号:CN202411578022
申请日期:2024-11-06
公开号:CN119469150B
公开日期:2025-09-26
类型:发明专利
摘要
本申请公开了基于大模型的目标定位方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及大模型、语音技术、计算机视觉、深度学习等领域。方案为:接收目标终端发送的定位请求,定位请求包括目标图片及语音指令;从语音指令中提取待定位物体的第一物体信息,根据第一物体信息,对目标图片进行目标检测,获取检测结果;根据候选物体在目标图片中的位置信息,从目标图片中截取候选物体的物体图片;根据物体图片、候选物体在目标图片中的位置信息及第一物体信息,利用大模型,从候选物体中确定目标物体;向终端发送目标物体在目标图片中的位置信息,以使目标终端根据目标物体在目标图片中的位置信息,确定目标物体相对目标终端的位置信息。
技术关键词
物体 图片 终端 文本 定位方法 图像 机器人 电子设备 模块 语音技术 计算机程序产品 机械臂 计算机视觉 处理器通信 指令 可读存储介质 解码
系统为您推荐了相关专利信息
视觉特征 信息识别方法 预训练模型 文本编码器 融合特征
分块 数据获取请求 数据处理方法 通信覆盖范围 数据采集装置
异常信息 低代码平台 语义 排错方法 字段
矫正方法 文字区域识别 表格 无边框 理论
智能提示系统 多模态数据融合 图像数据处理单元 多模态数据采集 多尺度特征金字塔