一种针对GPU推理服务的空闲服务管理方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种针对GPU推理服务的空闲服务管理方法及装置
申请号:CN202510296264
申请日期:2025-03-12
公开号:CN120216131A
公开日期:2025-06-27
类型:发明专利
摘要
本申请公开了一种针对GPU推理服务的空闲服务管理方法及装置。该方案中,监测K8S集群中的各个节点上部署的GPU推理服务的调用状况;基于调用状况,统计第一预设时段内各个GPU推理服务的服务调用量;若基于服务调用量确定GPU推理服务为空闲服务,则将该GPU推理服务作为目标GPU推理服务;检测目标清单中是否存在目标GPU推理服务的标识信息;其中,目标清单中包括多个禁止停用的GPU推理服务各自对应的标识信息;若目标清单中未存在目标GPU推理服务的标识信息,则停用目标GPU推理服务。本申请技术方案以自动化的方式实现精准的空闲服务管理,提高了针对GPU推理服务的空闲服务管理的效率。
技术关键词
服务管理方法 历史运行状态 日志 标识 服务管理装置 集群 可读存储介质 机器学习模型 计算机 监测模块 网关 节点 处理器 通知