一种基于奖励机制的安全自动驾驶方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于奖励机制的安全自动驾驶方法
申请号:
CN202511030519
申请日期:
2025-07-25
公开号:
CN120526407B
公开日期:
2025-09-23
类型:
发明专利
摘要
本发明公开了一种基于奖励机制的安全自动驾驶方法,包括:对多模态传感器数据进行语义校正,生成校正后的语义奖励;通过约束感知网络评估当前驾驶状态,生成安全评分与奖励修正值;将校正后的语义奖励、安全评分与奖励修正值进行融合,构建最终奖励信号来优化强化学习策略,依据优化后的强化学习策略及多模态状态向量生成驾驶控制动作。本发明通过引入因果校正与解耦的约束网络,提升了自动驾驶系统在复杂、非理想场景下的决策可靠性、安全性和智能化水平。
技术关键词
强化学习策略
自动驾驶方法
校正
多模态传感器
场景指纹
图像
自动驾驶系统
文本编码器
数据
标识
神经网络模型
生成场景
哈希算法
语义特征
物理