一种跨模态注意力融合机制的光学-红外目标检测方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种跨模态注意力融合机制的光学-红外目标检测方法
申请号:CN202511430366
申请日期:2025-10-09
公开号:CN120913023B
公开日期:2025-12-09
类型:发明专利
摘要
本发明属于图像处理技术领域,涉及一种跨模态注意力融合机制的光学‑红外目标检测方法,通过引入隐式神经表示,将多模态特征从传统的离散像素网格提升至一个连续的函数空间,学习并构建一个从空间坐标到特征向量的连续映射函数;旨在借助一种新颖的隐式注意力机制,支持在任意查询坐标点自适应地聚合目标模态的特征信息,突破了传统方法在感受野和对齐精度上的瓶颈;本方法通过基于隐式神经表示的连续性优势,实现了不同尺度特征的无损对齐,充分挖掘尺度间的互补信息以提升融合效果。本发明通过将隐式神经表示与Mamba架构相结合,将跨模态融合从离散空间拓展至连续函数空间,在提升检测鲁棒性与泛化能力的同时,保持了模型的计算效率。
技术关键词
离散特征 跨模态 连续特征 融合特征 注意力机制 感知特征 状态空间模型 查询机制 坐标点 双线性插值 多层感知器 可见光图像 图像处理技术 序列 模态特征 网格