摘要
本申请涉及人工智能技术领域,公开了一种基于认知心理学的多模态大模型评测系统及方法。该系统包括:评测执行模块,被配置为根据用户指定的至少一个评测指标,从评测题库中抽取对应的评测题目;所述评测指标是基于信息加工模型及认知心理学理论确定的,用于评测多模态大模型以下至少一个维度的性能:感知力、注意力、记忆力、推理力;分析模块,被配置为基于所述输出结果及所述评测题目的正确答案,计算所述多模态大模型的评测分数;基于所述评测分数生成所述多模态大模型的性能评测结果。本系统实现了对多模态大模型客观、全面的性能评测,能够准确反映模型的真实性能。