摘要
本发明涉及城市排水防涝技术领域,具体涉及一种基于深度强化学习的城市实时排水调度方法及系统。方法包括构建最小化地表积涝总量与合流制排口溢流频次的双目标奖励函数及约束条件,采用水动力机理模型结合目标区域的基础数据进行降雨径流模拟,建立基于深度强化学习的多智能体模型,构建其决策动作与模拟环境状态的交互耦合,通过该耦合获取更新的环境状态和排水调度奖励值,驱动多智能体模型生成策略网络,基于实时暴雨信息预测生成排水防涝工程动作,并利用周期性生成的策略网络对该动作进行动态更新。本发明确保在响应时间内快速实现多目标优化决策,达到内涝缓解的效果,增强城市雨洪韧性并满足实时需求。