摘要
本发明属于配电网技术领域,具体公开了一种基于深度强化学习的多时间尺度电压调节方法及系统。本发明提出了一种包含时间序列特性的拥有混合设备联合控制能力的有源配电网电压调节方法,即首先设置一个可以输出离散动作和连续动作的智能体,通过一个包含时间序列特征的网络,实现对有载调压器、电容器组、可再生能源逆变器的小时级和分钟级的双时间尺度调度。此外,本发明还设计了一种冗余的多智能体协同控制系统,通过横向相互作用的倍增机制对各个智能体的动作输出进行协调。另外,本发明还整合了优先经验回放技术、汤普森采样技术以及安全模块机制,用于提高智能体的学习效率和控制效果。