摘要
本发明公开了基于时序同步脉冲记忆策略的智能体强化控制方法,用于解决部分可观测环境下的智能体决策问题:1、构建仿真环境,通过随机掩盖观测维度模拟信息缺失场景;2、搭建策略‑评判强化网络框架,其中脉冲记忆策略网络采用时序同步脉冲编码,通过当前分支处理实时观测、记忆分支整合历史信息,记忆评判网络则评估决策价值;3、采用和任务环境交互得到的数据联合训练强化网络框架;4、部署训练好的网络模型实现智能体控制,通过动作信号执行与奖励反馈评估任务效果。该框架融合脉冲神经元的生物特性与记忆模块的时序建模能力,在部分可观测条件下实现了决策精度提升,相较于传统方法展现出更强的环境适应性与决策鲁棒性。