AI无法攻克的235道谜题!让o1、Gemini 2.0 Flash Thinking集体挂零 AI无法攻克的235道谜题!让o1、Gemini 2.0 Flash Thinking集体挂零 关键词: AI,ENIGMAEVAL,AI数学,HLE Scale AI 等提出的新基准再次暴露了大语言模型的弱点。 来自主题: AI技术研报 8855 点击 2025-02-17 14:49