摘要
本申请实施例提供了一种模型评测方法、装置、计算机设备及可读存储介质,属于数据处理技术领域。获取多个评测问题;针对每个评测问题,将评测问题输入至待评测模型得到第一评测答案,以及将评测问题分别输入多个参照模型中,得到多个第二评测答案;将第一评测答案分别与多个第二评测答案组合得到多个评测组合,并将多个评测组合输入至每个预设评估模型中,得到评测问题在每个预设评估模型下的第一评测得分;基于多个预设评估模型对应的多个第一评测得分,确定待评测模型在评测对应的评测问题时的目标得分;基于待评测模型在评测多个评测问题时的多个目标得分,确定待评测模型的评测得分。以此,能够提高对模型进行评测的准确性。