基于H-PPO分层算法的多自动驾驶车辆的动态行为生成方法
申请号:CN202410720011
申请日期:2024-06-05
公开号:CN118709530B
公开日期:2025-10-14
类型:发明专利
摘要
本发明公开了一种基于H‑PPO分层算法的多自动驾驶车辆的动态行为生成方法,包括:1、模拟十字路口车辆交汇路况,构建仿真场景,并对自动驾驶车辆进行动力学建模;2、根据环境信息,构建状态量,混合动作空间;3、通过设置奖励函数鼓励驾驶车辆与被测车辆之间的交汇博弈;4、构建深度神经网络,初始化深度强化学习参数,训练深度神经网络,产生针对被测车辆十字路口左转工况下,使多辆直行的自动驾驶车辆的决策与动作由神经网络分层输出,使其具有博弈行为,以检验被测车辆针对小概率、高风险的边缘场景的应对能力。本发明使用深度强化学习与博弈性理论,生成被测车辆在十字路口遭遇博弈性交汇场景,以提供构建自动驾驶场景的新方式。
技术关键词
车辆
分层算法
生成方法
构建深度神经网络
参数
深度强化学习
定义策略
训练深度神经网络
加速度
决策
动态
坐标
换道模型
场景
可读存储介质
样本
车道