基于序贯三支掩码和注意力融合的Transformer解释方法

申请号：CN202411133754

申请日期：2024-08-19

公开号：CN119152253A

公开日期：2024-12-17

类型：发明专利

摘要

本发明提供了一种基于序贯三支掩码和注意力融合的Transformer解释方法，属于人工智能可解释性技术领域。解决了Transformer模型解释困难导致难以投入现实应用的技术问题，其技术方案为：首先将图像输入标准的Transformer模块，保存每一层编码器层的注意力矩阵，并聚合生成关系矩阵；接下来取出最终编码器层输出，重塑并上采样作为掩码放入掩码集；接着利用序贯三支决策选出积极掩码集，并获取初步解释结果；最后，将第一步聚合的生成关系矩阵与初步解释结果融合生成最终解释结果。本发明的有益效果为：解释效果好，对自然图像和医学图像均可得到较好的解释结果，帮助人类理解深度学习模型。

技术关键词

注意力编码器序贯三支决策图像块生成关系物体位置信息投影变换矩阵深度学习模型信息编码模块语义上采样线性尺寸医学网格