基于CoT的多源遥感图像船舰目标实时识别与检索方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于CoT的多源遥感图像船舰目标实时识别与检索方法
申请号:CN202510484044
申请日期:2025-04-17
公开号:CN120411772A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开基于CoT的多源遥感图像的船舰目标实时识别与检索方法,包括以下步骤:收集海洋领域的多源遥感图像数据并进行预处理;训练舰船目标检测模型,利用RT‑DETR模型进行目标的检测与标注,并分割舰船目标区域;通过大语言模型思维链生成舰船目标描述文本;基于分割后的舰船目标区域微调CLIP模型;完成依据文本检索图像的跨模态检索,在多源遥感图像中标注具体位置并进行实时定位。本发明通过微调后的CLIP模型,在图像与文本间建立精确的语义关联,提升跨模态检索的准确度,更好地适应海洋领域的特殊需求和数据分布,快速匹配相关图像块,在新遥感图像到达时,自动更新检测结果并进行实时定位与标注,实现对舰船目标实时监控。
技术关键词
检索方法 大语言模型 多源遥感图像数据 表达式 文本编码器 图像编码器 文本特征向量 跨模态 多模态特征 图像数据集合 滑动窗口技术 海洋 训练集 切块技术