基于H-PPO分层算法的多自动驾驶车辆的动态行为生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于H-PPO分层算法的多自动驾驶车辆的动态行为生成方法
申请号:CN202410720011
申请日期:2024-06-05
公开号:CN118709530B
公开日期:2025-10-14
类型:发明专利
摘要
本发明公开了一种基于H‑PPO分层算法的多自动驾驶车辆的动态行为生成方法,包括:1、模拟十字路口车辆交汇路况,构建仿真场景,并对自动驾驶车辆进行动力学建模;2、根据环境信息,构建状态量,混合动作空间;3、通过设置奖励函数鼓励驾驶车辆与被测车辆之间的交汇博弈;4、构建深度神经网络,初始化深度强化学习参数,训练深度神经网络,产生针对被测车辆十字路口左转工况下,使多辆直行的自动驾驶车辆的决策与动作由神经网络分层输出,使其具有博弈行为,以检验被测车辆针对小概率、高风险的边缘场景的应对能力。本发明使用深度强化学习与博弈性理论,生成被测车辆在十字路口遭遇博弈性交汇场景,以提供构建自动驾驶场景的新方式。
技术关键词
车辆 分层算法 生成方法 构建深度神经网络 参数 深度强化学习 定义策略 训练深度神经网络 加速度 决策 动态 坐标 换道模型 场景 可读存储介质 样本 车道
系统为您推荐了相关专利信息
停车位 路径规划方法 局部路径规划 车辆 停车场环境
地标 葡萄 集成学习模型 高光谱成像设备 识别方法
智能管理方法 控制策略 人工智能算法模型 桥梁结构 桥梁健康状态
氧空位 参数 燃料电池 构型 计算机设备
样本 标签 机器学习模型 坐标 检测数据输入