摘要
本发明公开了一种基于动态加权机制的无人夹抱车路径优化方法,包括以下步骤:步骤1,使用图搜索算法生成一条粗略路径Psearch;步骤2,策略神经网络Actor根据实时障碍物信息、车辆状态基于当前策略优化后输出一条路径Pactor;步骤3,动态加权机制:将图搜索生成的粗略路径Psearch作为参考路径,计算其与路径Pactor的相似性损失Lsimilarity,强化学习模型的评价网络Critic对Actor生成的路径Pactor进行打分,生成路径质量损失Lcritic,将二者动态加权计算总损失Ltotal,根据累计回报Ireward、路径稳定性Istability和路径平滑性Ismoothness,动态调整动态权重因子α。本发明根据实时环境动态调整权重,动态适应不同训练阶段的需求,从而优化路径规划质量和效率。