一种基于强化学习的道口调度方法及系统

申请号：CN202511403122

申请日期：2025-09-29

公开号：CN120875492B

公开日期：2025-11-28

类型：发明专利

摘要

本发明涉及人工智能技术领域，公开了一种基于强化学习的道口调度方法及系统，其中，一种基于强化学习的道口调度方法包括：获取道口调度场景数据，生成场景复杂度评估结果；处理调度人员历史操作数据，生成人员能力与专长画像；获取强化学习决策过程数据，生成决策解释信息；基于场景复杂度和人员专长，生成人机任务分配方案；处理强化学习决策数据，量化决策不确定性指标；获取调度人员反馈数据，更新强化学习模型；处理人机协作过程数据，优化人机分工策略；本发明能够准确识别AI系统难以确定的决策情境，及时引入人类干预；通过持续整合人类专业知识，提升了系统在复杂场景下的决策质量和鲁棒性。

技术关键词

决策道口强化学习模型复杂度人机协同强化学习系统聚类分析算法人机协作生成场景人类数据强化学习策略权限管理模块调度员画像系统