摘要
本申请公开了一种交通信号控制方法、电子设备及系统,控制方法包括:获取目标交叉口的历史交通数据,历史交通数据包括多个历史交通序列元素,任一历史交通序列元素包括回报、状态和信控周期;采用雷视设备获取目标决策周期的状态,并基于状态生成待决策交通序列元素;基于历史交通序列元素和待决策交通序列元素生成待决策序列;将待决策序列输入至预设的离线强化学习模型,离线强化学习模型基于历史交通序列元素中的回报、状态和信控周期进行推理,得到待决策交通序列元素的信控周期推理值;基于信控周期推理值进行不同相位的信号灯时长分配。根据本申请提供的方法,可以充分利用历史信息,从而能够更好的适应交通流的波动,有效减少车辆拥堵。