复杂场景下基于AI强化学习的智能追踪系统、方法及机器人
申请号:CN202511160246
申请日期:2025-08-19
公开号:CN121008473A
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开了复杂场景下基于AI强化学习的智能追踪系统、方法及机器人,系统包括:POMDP环境建模模块、递归策略网络模块、MDP决策执行模块;所述POMDP环境建模模块,用于预设目标的状态空间、动作空间及观测空间,输出状态转移概率及观测概率矩阵;所述递归策略网络模块,用于处理历史观测序列,输出多梯度策略;所述MDP决策执行模块,用于将POMDP的置信状态软映射为MDP状态,通过Boltzmann探索与双Q‑learning更新生成实时动作指令,实现目标的智能追踪。本发明通过协同优化环境建模与实时决策能力,显著提升目标追踪系统在动态复杂场景下的性能。
技术关键词
智能追踪系统
智能追踪方法
网络模块
激光雷达点云
时间卷积网络
场景
传感器融合
分支
策略更新
追踪机器人
时序特征
决策
编码模块
离散化方法
多尺度