摘要
本发明涉及人工智能技术领域,提供了一种模型质量评测方法、装置、电子设备和存储介质,方法包括:基于待评测的语音交互大模型,确定对话数据的应答结果;基于应答结果,确定语音交互大模型在客观评测指标和主观评测指标下的指标评测结果;基于客观评测指标和主观评测指标下的指标评测结果,确定质量评测结果,克服了目前评测维度单一、评测结果不够客观、全面的缺陷,结合客观评测指标和主观评测指标进行质量评测,能够将评测过程从单一的、侧重于机器性能的维度扩展到兼顾客观事实和主观体验的综合维度,从而使得最终生成的质量评测结果更加全面、科学、客观,进而可为模型的后续迭代优化提供明确、可靠的依据,显著提升了最终产品的用户体验。