摘要
本发明涉及人工智能技术领域,具体为基于强化学习的AI智能体自适应优化系统及方法。系统包括:数据采集模块,用于采集多模态数据;处理模块,与所述数据采集模块通信连接,用于执行一个预先训练的深度强化学习策略;控制执行模块,接收来自所述处理模块的指令,并将这些指令转换为对系统飞行运动和数据采集模块功能的物理操作;飞行平台模块,作为承载上述数据采集模块、处理模块和控制执行模块的物理载体,并提供飞行所需的动力与机动能力。本发明的AI智能体通过强化学习,在与环境的反复交互中自主学习最优的巡检策略,通过最大化一个多目标奖励函数,能够发现并执行复杂、高效的行为序列,使得无人机能够执行更精细、更优化的任务。