一种基于奖励机制的安全自动驾驶方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于奖励机制的安全自动驾驶方法
申请号:CN202511030519
申请日期:2025-07-25
公开号:CN120526407B
公开日期:2025-09-23
类型:发明专利
摘要
本发明公开了一种基于奖励机制的安全自动驾驶方法,包括:对多模态传感器数据进行语义校正,生成校正后的语义奖励;通过约束感知网络评估当前驾驶状态,生成安全评分与奖励修正值;将校正后的语义奖励、安全评分与奖励修正值进行融合,构建最终奖励信号来优化强化学习策略,依据优化后的强化学习策略及多模态状态向量生成驾驶控制动作。本发明通过引入因果校正与解耦的约束网络,提升了自动驾驶系统在复杂、非理想场景下的决策可靠性、安全性和智能化水平。
技术关键词
强化学习策略 自动驾驶方法 校正 多模态传感器 场景指纹 图像 自动驾驶系统 文本编码器 数据 标识 神经网络模型 生成场景 哈希算法 语义特征 物理