
ICML Spotlight | MCU:全球首个生成式开放世界基准,革新通用AI评测范式
ICML Spotlight | MCU:全球首个生成式开放世界基准,革新通用AI评测范式开发能在开放世界中完成多样任务的通用智能体,是AI领域的核心挑战。开放世界强调环境的动态性及任务的非预设性,智能体必须具备真正的泛化能力才能稳健应对。然而,现有评测体系多受限于任务多样化不足、任务数量有限以及环境单一等因素,难以准确衡量智能体是否真正「理解」任务,或仅是「记住」了特定解法。
来自主题: AI技术研报
5658 点击 2025-05-14 10:26