6款小游戏难倒所有顶级VLM!愤怒的小鸟让它们全军覆没,性能不如随机猜测 6款小游戏难倒所有顶级VLM!愤怒的小鸟让它们全军覆没,性能不如随机猜测 关键词: AI,模型训练,DeepPHY,人工智能 首个系统性评估多模态大模型(VLM)交互式物理推理能力的综合基准来了。 来自主题: AI技术研报 7428 点击 2025-11-17 09:25