摘要
本发明公开了一种基于自适应分区与强化学习的清理机器人路径规划方法,属于机器人技术领域。该方法采用双层规划框架:在全局规划层,提出自适应树分区算法(ATPA),根据环境布局、废料分布和机器人负载能力动态划分工作区,并优化各分区出入口,为局部规划提供宏观指导;在局部规划层,提出一种基于优势演员‑评论家(A2C)的改进强化学习算法,通过设计“远离起点”和“直线运动”的双重奖励机制,引导机器人生成有序且平滑的精细化覆盖路径。本发明通过全局分区优化与局部策略学习的协同作用,显著降低了路径长度和转弯次数,将路径冗余率最小化,实现了多目标的协同优化,提高了清洁作业的整体效率和智能化水平。