摘要
本发明涉及一种基于场数据的无人机目标任务自主区域搜索与分配方法,属于无人机和人工智能领域。本发明根据任务飞行规划应用数据结构,设计深度神经网络模型感知深度场信息,通过将感知的信息通过长短期记忆人工网络层后结合深度对抗循环Q神经网络,建立智能体;设计智能体,建立无人机飞行仿真环境,设置奖励机制使智能体在与环境交互中获得实时反馈;利用强化学习思想开展模型训练,通过最大化价值函数使无人机与环境的交互中学习最优策略,对是否完成目标进行测试,对结果进行智能决策的性能评估。本发明节省无人机能源消耗,能快速抵达任务目标区域并高效驻留,支撑任务开展。