大模型权威测试被曝翻车!更偏袒GPT-4等闭源模型,连提示词都区别对待 关键词: 大模型,AI,GPT-4,MMLU-PRO 大模型权威测试,翻车了?! HuggingFace都在用的MMLU-PRO,被扒出评测方法更偏向闭源模型,被网友直接在GitHub Issue提出质疑。 来自主题: AI技术研报 6882 点击 2024-07-12 00:44