摘要
本申请提供了一种基于强化学习的空调节能方法、装置、设备和介质,空调节能方法包括:实时采集当前环境参数;将当前环境参数输入至全连接神经网络,生成频率调整策略;执行频率调整策略,并获取执行频率调整策略后的第二环境参数;根据当前环境参数、第二环境参数计算奖励值,并生成一组数据组保存至经验数据池中;基于经验数据池对全连接神经网络的权值进行调整;其中,全连接神经网络包括:第一价值神经网络和第二价值神经网络;当前环境参数为空调当前状态的环境参数,第二环境参数为空调下一状态的环境参数。本申请解决传统方案基于数学模型设计相关参数,导致控制精度受限且增加其能耗的技术问题。