基于Swin-Transformer和YOLOv8融合检测算法的高空抛物检测方法
申请号:CN202511172971
申请日期:2025-08-21
公开号:CN120726453A
公开日期:2025-09-30
类型:发明专利
摘要
本发明涉及基于Swin‑Transformer和YOLOv8融合检测算法的高空抛物检测方法,首先将视频流并解码为RGB图像序列并预处理,将预处理后的图像分割为图像块,通过线性嵌入转化为初始特征序列;再利用Swin‑Transformer的Transformer Block分层提取特征,先以窗口自注意力捕捉底层局部特征,融合后下采样,再通过移动窗口注意力捕捉跨窗口特征得到高级特征;随后将高级特征输入YOLOv8检测网络,经多尺度特征融合、锚框匹配及预测解码,获取目标框及置信度;最后通过非极大值抑制优化检测结果并输出。通过Swin‑Transformer与YOLOv8的融合,兼顾全局上下文与局部细节特征,提升了多尺度抛物目标的识别精度,解决了传统方法漏检、误检及定位偏差问题,且能适配复杂场景,实现实时检测。
技术关键词
高空抛物检测方法
序列
图像块特征
局部细节特征
线性变换矩阵
注意力
算法
视频流
矩阵乘法运算
分支
尺寸
图像分割
空间位置关系
亮度直方图
坐标
像素
融合全局