摘要
本发明公开了一种考虑司机执行效能的公交动态驻站决策方法,包括以下步骤:S1、实时采集公交运行数据;S2、构建关于驻站时长的强化学习模型;S3、使用采集的运行数据训练公交智能体,通过深度强化学习算法求解生成驻站时长决策,将决策结果通过车载设备或移动终端通知司机执行;实时监控获得司机执行效能数据,通过反馈机制优化算法参数;S4、采用训练完成的公交智能体在公交线路中进行验证,达成动态驻站策略优化。还公开了一种考虑司机执行效能的公交动态驻站决策系统,采用了如前所述的公交动态驻站决策方法。本发明将司机执行效能考虑到强化学习方法中来优化驻站策略,提高了公交车的规律性和运营效率。