摘要
一种基于通用互动模式下的黑盒定向对抗攻击方法,属于对抗攻击领域。本发明在与提示无关的白盒情况下的定向对抗攻击中采用PGD的基于梯度方法来更新对抗样本,使对抗样本满足l∞范数限制,实现与提示无关的白盒情况下的定向对抗攻击PATA。通过构建PATA算法来针对通用互动模式下的被攻击模型,使被攻击模型生成目标掩码达成干扰,通过添加新的正则化损失函数实现对抗样本在不同模型间的可转移性,能够有针对性地提升防御和增强模型的鲁棒性。使用单个竞争样本,但在每次迭代中都更改该竞争样本,从而减少攻击方法的计算开销,进而能够实现高计算效率的黑盒定向对抗攻击方法,同时对样本具有更低的依赖性。