一种基于随机博弈与Rainbow算法的网络攻防策略优化方法
申请号:CN202511009081
申请日期:2025-07-22
公开号:CN120896731A
公开日期:2025-11-04
类型:发明专利
摘要
本发明提供了一种基于随机博弈与Rainbow算法的网络攻防策略优化方法,包括:构建网络攻防随机博弈模型;利用Rainbow深度Q网络算法进行Q函数学习与策略优化;将当前状态特征输入到训练好的Rainbow深度Q网络中,计算所有防御动作对应的Q值,选择使Q值最大化的防御动作作为当前状态下的最优防御策略。本方法利用Rainbow算法对局中人的收益情况进行博弈分析,博弈双方通过不断的学习,然后调整策略来获得利益最大化。另外,Rainbow算法的加入使得防御策略可以进行自适应调整,无需预先设定网络系统状态转移概率即可获得博弈双方的纳什均衡。
技术关键词
攻防随机博弈模型
深度Q网络
网络系统
策略优化方法
深度神经网络结构
算法
参数
在线
噪声
特征工程
样本
代表
阶段
脚本
时序
线性
误差