摘要
本发明公开了一种基于动态有向图通讯结构的多无人机协调控制方法,包括在分布式执行阶段,利用局部观测值与历史隐藏状态,并结合邻接轨迹矩阵,通过多钥匙门控通讯网络动态调整无人机间的通讯结构。基于更新后的邻接轨迹矩阵与预通讯信息,计算局部动作值函数并更新隐藏状态,最终生成控制决策并执行。集中式训练阶段则通过记录各时刻的邻接轨迹矩阵与局部观测值,生成全局状态并利用混合网络生成全局动作值函数,进而通过奖励更新网络参数。训练后的图坍缩网络与混合网络部署到各无人机中,实现分布式执行。该方法有效提高了无人机群体的通讯效率、决策精度与协同能力,适用于复杂任务场景,具有较高的适应性、稳定性和实时性。