一种陆战无人装备的模拟训练方法、装置及设备

申请号：CN202510006743

申请日期：2025-01-03

公开号：CN119398130B

公开日期：2025-04-08

类型：发明专利

摘要

本发明公开了一种陆战无人装备的模拟训练方法、装置及设备，包括：创建多智能体无人装备的陆战对抗场景，定义陆战对抗场景中红方智能体和蓝方智能体的场景信息、观测空间、动作空间、胜负条件以及奖励函数；构建多智能体强化学习的网络训练框架，包括MAPPO网络以及QMIX网络，得到多智能体强化学习模型；其中，MAPPO网络用于提供即时反馈和策略调整的梯度信息；QMIX网络用于实现多智能体之间的协作和全局策略的评估；通过初始化和更新MAPPO网络以及QMIX网络的网络参数，对多智能体强化学习模型进行迭代训练，直到满足预设条件时停止训练，得到多智能体协作系统。

技术关键词

模拟训练方法多智能体强化学习混合网络多智能体协作超网络强化学习模型前馈神经网络装备策略场景参数多层感知机模拟训练设备模拟训练装置非线性记忆计算机程序产品框架处理器