摘要
本发明提出的一种车端大模型评测方法、系统、电子设备及可读存储介质,方法包括步骤:获取实车场景数据,以及实车场景数据对应的评测数据;通过实车场景数据对目标测试模型进行场景模拟;获取评测数据中关联的场景问题与场景答案;将场景问题输入到目标测试模型得到推理答案;比较推理答案与场景答案得到目标测试模型的测试结果。通过场景问题与场景答案对目标测试模型进行测试,使得能够对目标测试模型对于具体场景的感知情况进行测试,而通过构建实车场景数据对应的评测数据则能够实现对于目标测试模型的具体推理过程的评测,实现了全面地、准确地对于车端大模型的评测。