AI资讯新闻榜单内容搜索-BabyVision

顶尖AI竟输给三岁宝宝，BabyVision测试暴露多模态模型硬伤

过去一年，大模型在语言与文本推理上突飞猛进：论文能写、难题能解、甚至在顶级学术 / 竞赛类题目上屡屡刷新上限。但一个更关键的问题是：当问题不再能 “用语言说清楚” 时，模型还能不能 “看懂”？

来自主题: AI技术研报

10145 点击 2026-01-12 14:07

大模型能写代码、解奥数，却连幼儿园小班都考不过？简单的连线找垃圾桶、数积木，人类一眼即知，AI却因为无法用语言「描述」视觉信息而集体翻车。大模型到底「懂不懂」，这个评测基准给出答案。

来自主题: AI技术研报

9555 点击 2026-01-12 10:29