复杂场景下基于AI强化学习的智能追踪系统、方法及机器人

申请号：CN202511160246

申请日期：2025-08-19

公开号：CN121008473A

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了复杂场景下基于AI强化学习的智能追踪系统、方法及机器人，系统包括：POMDP环境建模模块、递归策略网络模块、MDP决策执行模块；所述POMDP环境建模模块，用于预设目标的状态空间、动作空间及观测空间，输出状态转移概率及观测概率矩阵；所述递归策略网络模块，用于处理历史观测序列，输出多梯度策略；所述MDP决策执行模块，用于将POMDP的置信状态软映射为MDP状态，通过Boltzmann探索与双Q‑learning更新生成实时动作指令，实现目标的智能追踪。本发明通过协同优化环境建模与实时决策能力，显著提升目标追踪系统在动态复杂场景下的性能。

技术关键词

智能追踪系统智能追踪方法网络模块激光雷达点云时间卷积网络场景传感器融合分支策略更新追踪机器人时序特征决策编码模块离散化方法多尺度