基于分流分解注意力的视觉Transformer分类方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于分流分解注意力的视觉Transformer分类方法
申请号:CN202410900869
申请日期:2024-07-05
公开号:CN119027709A
公开日期:2024-11-26
类型:发明专利
摘要
本发明公开了基于分流分解注意力的视觉Transformer分类方法,本发明方法对PVT图像分类算法进行改进,在其基础上设计了更高效的分流分解注意力SDSA,提出将注意力分解为位置相关的局部注意力PWSA和稀疏全局的网格注意力GridSA,通过在局部注意力中加入位置信息,每个位置都能获得与自身依赖性最强的信息交互。将PWSA与GridSA进行串联,同时加入多分支的结构,能够在同一层中关注不同大小的感受野,更有利于对多尺度对象的识别,仅具有线性复杂度,能够同时建模局部细节和全局依赖关系。
技术关键词
分类方法 前馈神经网络 图像块 图像分类算法 网格 视觉 线性 注意力机制 多分支 标签 训练集 矩阵 复杂度 参数 支路 模块 对象