基于真实负载的GPU调度方法、系统、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于真实负载的GPU调度方法、系统、设备及存储介质
申请号:CN202511197096
申请日期:2025-08-26
公开号:CN120915781A
公开日期:2025-11-07
类型:发明专利
摘要
本申请涉及资源调度管理技术领域,尤其涉及一种基于真实负载的GPU调度方法、系统、设备及存储介质,方法包括获取GPU服务器上的设备总量信息并将其注册到Kubernetes集群;响应于业务容器的GPU资源调度请求,Kubernetes调度器获取每个节点的GPU服务器上的当前用量,选择实时余量最大的节点,将业务容器与所选中节点下的GPU服务器上的所有GPU设备进行绑定;启动业务容器,业务容器发出GPU设备调度请求,基于GPU设备调度请求的类型以及绑定的GPU设备的实时余量为业务容器分配GPU设备。本申请有效解决了现有GPU调度方式在面对资源需求动态变化时缺乏适应性的问题。
技术关键词
PCIE设备 GPU服务器 容器 调度器 节点 资源调度管理技术 物理拓扑结构 集群 总量 调度系统 拦截器 程序 处理器 操作系统 可读存储介质 存储器 电子设备 模块