基于时序同步脉冲记忆策略的智能体强化控制方法

申请号：CN202510184639

申请日期：2025-02-19

公开号：CN120046649A

公开日期：2025-05-27

类型：发明专利

摘要

本发明公开了基于时序同步脉冲记忆策略的智能体强化控制方法，用于解决部分可观测环境下的智能体决策问题：1、构建仿真环境，通过随机掩盖观测维度模拟信息缺失场景；2、搭建策略‑评判强化网络框架，其中脉冲记忆策略网络采用时序同步脉冲编码，通过当前分支处理实时观测、记忆分支整合历史信息，记忆评判网络则评估决策价值；3、采用和任务环境交互得到的数据联合训练强化网络框架；4、部署训练好的网络模型实现智能体控制，通过动作信号执行与奖励反馈评估任务效果。该框架融合脉冲神经元的生物特性与记忆模块的时序建模能力，在部分可观测条件下实现了决策精度提升，相较于传统方法展现出更强的环境适应性与决策鲁棒性。

技术关键词

强化控制方法记忆脉冲强化学习网络分支代表策略时序动态仿真环境场景解码框架参数移动机器人信息编码决策传播算法