摘要
本发明提供一种自动驾驶路径规划方法、系统、电子设备及介质,该方法包括:电子设备获取特定区域的道路交通数据,基于道路交通数据利用时空耦合矩阵,得到最佳联合动作,利用最佳联合动作包括的最佳的信号相位切换时间和车辆驾驶路径,对特定区域内的交通信号灯和车辆进行控制,联合动作空间为通过笛卡尔积将信号控制智能体和路径规划智能体形成为混合动作空间,然后将混合动作空间结合Actor‑Critic框架构建得到的,这种方式不仅决策过程完全基于客观数据,不受天气等外部因素干扰,确保了控制的稳定性,还可以提升特定区域车辆的通行效率。