摘要
本发明提供一种操作系统自适应任务调度方法及装置、计算机设备,属于计算机技术领域。该方法包括:在操作系统出厂设置阶段对嵌入到操作系统中的任务调度模型进行预先训练,得到任务调度模型的参数,任务调度模型的参数包括:电价成本奖励、资源利用率奖励、服务质量奖励以及奖励权重参数;将预先训练的任务调度模型的参数下发至用户侧操作系统中,对用户侧操作系统中的任务调度模型的参数进行优化,得到与当前用户偏好匹配的任务调度模型;在用户侧操作系统中,根据当前用户选择的任务调度模式,利用与当前用户偏好匹配的任务调度模型进行任务调度。本发明将深度强化学习的任务调度模型嵌入操作系统内核,实现动态资源分配的闭环优化。