摘要
本发明涉及人工智能技术领域,公开了一种基于强化学习的道口调度方法及系统,其中,一种基于强化学习的道口调度方法包括:获取道口调度场景数据,生成场景复杂度评估结果;处理调度人员历史操作数据,生成人员能力与专长画像;获取强化学习决策过程数据,生成决策解释信息;基于场景复杂度和人员专长,生成人机任务分配方案;处理强化学习决策数据,量化决策不确定性指标;获取调度人员反馈数据,更新强化学习模型;处理人机协作过程数据,优化人机分工策略;本发明能够准确识别AI系统难以确定的决策情境,及时引入人类干预;通过持续整合人类专业知识,提升了系统在复杂场景下的决策质量和鲁棒性。