一种基于随机博弈与Rainbow算法的网络攻防策略优化方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于随机博弈与Rainbow算法的网络攻防策略优化方法
申请号:CN202511009081
申请日期:2025-07-22
公开号:CN120896731A
公开日期:2025-11-04
类型:发明专利
摘要
本发明提供了一种基于随机博弈与Rainbow算法的网络攻防策略优化方法,包括:构建网络攻防随机博弈模型;利用Rainbow深度Q网络算法进行Q函数学习与策略优化;将当前状态特征输入到训练好的Rainbow深度Q网络中,计算所有防御动作对应的Q值,选择使Q值最大化的防御动作作为当前状态下的最优防御策略。本方法利用Rainbow算法对局中人的收益情况进行博弈分析,博弈双方通过不断的学习,然后调整策略来获得利益最大化。另外,Rainbow算法的加入使得防御策略可以进行自适应调整,无需预先设定网络系统状态转移概率即可获得博弈双方的纳什均衡。
技术关键词
攻防随机博弈模型 深度Q网络 网络系统 策略优化方法 深度神经网络结构 算法 参数 在线 噪声 特征工程 样本 代表 阶段 脚本 时序 线性 误差
系统为您推荐了相关专利信息
制动控制系统 冗余制动控制方法 智能驾驶车辆 电子制动控制装置 模式
节点识别方法 深度强化学习 主题 深度Q网络 多头注意力机制
深度Q网络 日志解析 序列预测模型 训练智能体 模板
建模系统 状态向量数据 动作指令数据 深度Q网络 空间模块
订单 多平台 深度Q网络 动态权益 整数规划模型