基于强化学习的多无人机三维协同搜索动目标方法和装置
申请号:CN202410894317
申请日期:2024-07-04
公开号:CN118655915A
公开日期:2024-09-17
类型:发明专利
摘要
本申请涉及一种基于强化学习的多无人机三维协同搜索动目标方法和装置,该方法根据高空无人机探测范围广和低空无人机检测质量高的特点,构建多无人机高低空协同搜索架构;在该架构下以最大限度减少搜索区域的不确定性和最大化捕获动态目标数量为优化目标,建立多无人机协同搜索三维场景中动态目标的路径规划问题;采用改进的MAPPO算法求解该路径规划问题;在算法中引入基于视野编码的状态表示机制,解决了神经网络输入维度动态变化的问题;引入基于规则的目标捕获机制和基于动作掩码的碰撞避免机制,提高了改进的MAPPO算法的收敛速度。本方法在降低区域不确定性和增加捕获的动态目标数量方面具有显著优势,提高了目标捕获能力和安全性。
技术关键词
多无人机协同
高空无人机
栅格
捕获机制
低空无人机
策略
规划
视野
网络
动态
掩码规则
掩码技术
场景
Softmax函数
掩码矩阵
编码
算法