一种基于结构引导项的TOF图像目标检测模型训练方法

申请号：CN202511509048

申请日期：2025-10-22

公开号：CN120997485A

公开日期：2025-11-21

类型：发明专利

摘要

本申请提供了一种基于结构引导项的TOF图像目标检测模型训练方法，包括：对红外图像和深度图像进行预处理以形成多通道输入张量；将输入张量输入至目标检测模型，并通过模型中的结构感知注意力模块融合红外图像与深度图像的特征，生成中间特征图；将中间特征图输入至目标检测模型的后续网络层进行处理得到输出特征图，构建结构引导损失；将结构引导损失作为正则项与基础检测损失组合为总损失函数，并通过优化总损失函数来更新目标检测模型的参数直至收敛。本申请解决的技术问题是现有方法未能有效利用深度图像所提供的空间结构信息，这导致模型在光照变化大、背景干扰强或物体遮挡等复杂场景下容易出现误识别和定位不准确的问题。

技术关键词

检测模型训练方法图像检测损失多尺度结构边缘结构信息输出特征注意力多尺度特征融合多通道空间结构信息纹理特征更新模型参数跨模态基础超参数查询特征中间层机制上采样