一种基于多模态大模型提示生成的遥感图像舰船检测方法
申请号:CN202510870465
申请日期:2025-06-26
公开号:CN120932087A
公开日期:2025-11-11
类型:发明专利
摘要
本发明提供了一种基于多模态大模型提示生成的遥感图像舰船检测方法,包括:步骤1,获得遥感舰船图像数据集;步骤2,将训练集数据输入至多模态大模型生成文本提示特征;步骤3,将训练集输入改进RT‑DETR模型得到多尺度融合图像特征;步骤4,设计跨模态融合网络,得到跨模态融合特征;步骤5,生成边界框和舰船类别;步骤6,对改进RT‑DETR模型进行训练,得到训练后的实时遥感图像舰船检测模型;步骤7,将测试集输入步骤6得到的实时遥感图像舰船检测模型,得到目标舰船的位置信息和类别。本发明能够实现图像和文本模态之间的有效融合,从而使有用的多模态信息得到充分的利用。
技术关键词
注意力
融合图像特征
跨模态融合特征
分支
金字塔网络
文本
标记
训练集数据
交互网络
矩阵
特征融合网络
解码器
编码块
多尺度
多模态
变换器