基于CoT的多源遥感图像船舰目标实时识别与检索方法
申请号:CN202510484044
申请日期:2025-04-17
公开号:CN120411772A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开基于CoT的多源遥感图像的船舰目标实时识别与检索方法,包括以下步骤:收集海洋领域的多源遥感图像数据并进行预处理;训练舰船目标检测模型,利用RT‑DETR模型进行目标的检测与标注,并分割舰船目标区域;通过大语言模型思维链生成舰船目标描述文本;基于分割后的舰船目标区域微调CLIP模型;完成依据文本检索图像的跨模态检索,在多源遥感图像中标注具体位置并进行实时定位。本发明通过微调后的CLIP模型,在图像与文本间建立精确的语义关联,提升跨模态检索的准确度,更好地适应海洋领域的特殊需求和数据分布,快速匹配相关图像块,在新遥感图像到达时,自动更新检测结果并进行实时定位与标注,实现对舰船目标实时监控。
技术关键词
检索方法
大语言模型
多源遥感图像数据
表达式
文本编码器
图像编码器
文本特征向量
跨模态
多模态特征
图像数据集合
滑动窗口技术
海洋
训练集
切块技术