摘要
本发明属于人工智能安全的技术领域,具体涉及电力人工智能应用黑盒对抗攻击缺陷分析方法及装置。所述方法包括:构建局部和全局相结合的双层阈值机制;基于目标模型对于当前轮次下原始输入样本的近似梯度,计算当前轮次下的扰动,利用局部扰动阈值约束当前轮次下的扰动,并基于约束后的扰动更新对抗样本;利用全局扰动阈值对更新后的对抗样本的扰动幅度进行合理性判定,并对满足合理性判定条件的对抗样本进行攻击效果判定,将满足攻击效果判定条件的对抗样本作为目标对抗样本并输出。本发明揭示了电力系统在双层阈值扰动下的容忍范围,从而为防御机制设计提供参考。