摘要
本发明涉及GPU芯片测试领域,具体为一种面向大算力GPU芯片的并行测试任务调度方法。具体实现过程包括:构建测试任务‑资源需求矩阵,计算测试任务产生的瞬态热应力并校验测试安全裕度;根据测试安全裕度将多个测试任务聚合为并行测试执行簇,为并行测试执行簇规划包含空间映射与执行时窗的GPU测试调度图;设置故障因果溯源链,在测试失败时进行解析,输出故障源上下文并排查故障原因。本发明通过构建测试任务‑资源需求矩阵,采用先规划、后执行的精细化调度方式并引入主动安全校验,在保障GPU芯片安全性的同时实现了对大算力GPU芯片的高效并行测试,有效提升了测试任务的执行效率以及故障定位的精确程度。