基于大模型的目标定位方法、装置、电子设备及存储介质
申请号:CN202411578022
申请日期:2024-11-06
公开号:CN119469150B
公开日期:2025-09-26
类型:发明专利
摘要
本申请公开了基于大模型的目标定位方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及大模型、语音技术、计算机视觉、深度学习等领域。方案为:接收目标终端发送的定位请求,定位请求包括目标图片及语音指令;从语音指令中提取待定位物体的第一物体信息,根据第一物体信息,对目标图片进行目标检测,获取检测结果;根据候选物体在目标图片中的位置信息,从目标图片中截取候选物体的物体图片;根据物体图片、候选物体在目标图片中的位置信息及第一物体信息,利用大模型,从候选物体中确定目标物体;向终端发送目标物体在目标图片中的位置信息,以使目标终端根据目标物体在目标图片中的位置信息,确定目标物体相对目标终端的位置信息。
技术关键词
物体
图片
终端
文本
定位方法
图像
机器人
电子设备
模块
语音技术
计算机程序产品
机械臂
计算机视觉
处理器通信
指令
可读存储介质
解码