一种基于奖励机制的安全自动驾驶方法

申请号：CN202511030519

申请日期：2025-07-25

公开号：CN120526407B

公开日期：2025-09-23

类型：发明专利

摘要

本发明公开了一种基于奖励机制的安全自动驾驶方法，包括：对多模态传感器数据进行语义校正，生成校正后的语义奖励；通过约束感知网络评估当前驾驶状态，生成安全评分与奖励修正值；将校正后的语义奖励、安全评分与奖励修正值进行融合，构建最终奖励信号来优化强化学习策略，依据优化后的强化学习策略及多模态状态向量生成驾驶控制动作。本发明通过引入因果校正与解耦的约束网络，提升了自动驾驶系统在复杂、非理想场景下的决策可靠性、安全性和智能化水平。

技术关键词

强化学习策略自动驾驶方法校正多模态传感器场景指纹图像自动驾驶系统文本编码器数据标识神经网络模型生成场景哈希算法语义特征物理