一种虚拟机集群的监控方法及系统、电子设备、存储介质和计算机程序产品
申请号:CN202511446416
申请日期:2025-10-11
公开号:CN120929333A
公开日期:2025-11-11
类型:发明专利
摘要
本公开涉及计算机技术领域,尤其涉及一种虚拟机集群的监控方法及系统、电子设备、存储介质和计算机程序产品,所述方法包括:基于虚拟机集群中任意一个物理服务器中每个虚拟机内部署的GPU数据采集模块,对分配给该虚拟机的每个GPU进行数据采集,得到该虚拟机对应的GPU监控数据;基于该物理服务器中部署的数据采集代理模块,获取该物理服务器中每个虚拟机对应的GPU监控数据,得到并向虚拟机集群对应的监控服务器发送该物理服务器对应的GPU监控数据;基于监控服务器,对虚拟机集群中每个物理服务器对应的GPU监控数据进行数据处理,得到虚拟机集群对应的GPU监控数据。本公开实施例可以对虚拟机集群进行有效的GPU资源监控。
技术关键词
监控服务器
物理
集群
数据采集模块
资源监控
计算机程序产品
计算机程序指令
监控方法
虚拟机故障
日志
标签
电子设备
处理器
可读存储介质
故障检测
数据格式