基于H-PPO分层算法的多自动驾驶车辆的动态行为生成方法

申请号：CN202410720011

申请日期：2024-06-05

公开号：CN118709530B

公开日期：2025-10-14

类型：发明专利

摘要

本发明公开了一种基于H‑PPO分层算法的多自动驾驶车辆的动态行为生成方法，包括：1、模拟十字路口车辆交汇路况，构建仿真场景，并对自动驾驶车辆进行动力学建模；2、根据环境信息，构建状态量，混合动作空间；3、通过设置奖励函数鼓励驾驶车辆与被测车辆之间的交汇博弈；4、构建深度神经网络，初始化深度强化学习参数，训练深度神经网络，产生针对被测车辆十字路口左转工况下，使多辆直行的自动驾驶车辆的决策与动作由神经网络分层输出，使其具有博弈行为，以检验被测车辆针对小概率、高风险的边缘场景的应对能力。本发明使用深度强化学习与博弈性理论，生成被测车辆在十字路口遭遇博弈性交汇场景，以提供构建自动驾驶场景的新方式。

技术关键词

车辆分层算法生成方法构建深度神经网络参数深度强化学习定义策略训练深度神经网络加速度决策动态坐标换道模型场景可读存储介质样本车道

系统为您推荐了相关专利信息

一种路径规划方法、装置、电子设备及存储介质

停车位路径规划方法局部路径规划车辆停车场环境

一种高光谱集成学习的葡萄地标识别方法及系统

地标葡萄集成学习模型高光谱成像设备识别方法

一种基于人工智能的桥梁荷载智能管理方法、系统及介质

智能管理方法控制策略人工智能算法模型桥梁结构桥梁健康状态

扩散参数的确定方法、装置、计算机设备、存储介质和程序产品

氧空位参数燃料电池构型计算机设备

一种基于数据增强和知识蒸馏的目标检测方法及系统

样本标签机器学习模型坐标检测数据输入