摘要
本公开涉及计算机技术领域,涉及一种模型评测方法及系统、计算机程序产品和电子设备。该模型评测方法包括:根据待评测模型的属性类型,分配多种评测任务,其中,不同的评测任务具有各自对应的评测数据集;根据当前评测任务的评测数据集,对待评测模型执行当前评测任务,得到初始评测结果,初始评测结果包括多个评测维度;基于初始评测结果对待评测任务的评测内容进行调整,以根据调整后的待评测任务对待评测模型执行评测操作;根据多种评测任务的初始评测结果,生成待评测模型的综合评测结果。本公开能提升对大模型评测的效率和覆盖范围,提高模型评测的准确性。