2025年了,AI还看不懂时钟!90%人都能答对,顶尖AI全军覆没
2025年了,AI还看不懂时钟!90%人都能答对,顶尖AI全军覆没一般人准确率89.1%,AI最好只有13.3%。在新视觉基准ClockBench上,读模拟时钟这道「小学题」,把11个大模型难住了。为什么AI还是读不准表?是测试有问题还是AI真不行?
一般人准确率89.1%,AI最好只有13.3%。在新视觉基准ClockBench上,读模拟时钟这道「小学题」,把11个大模型难住了。为什么AI还是读不准表?是测试有问题还是AI真不行?
你能想象吗?一段 25 年前的 Linux 内核驱动,在现代系统上几乎不可能运行——但一位工程师用了两个晚上借助 AI 助手 Claude Code,让它重获新生。这个驱动曾经服务于老旧磁带设备,如今经过现代化改造,不仅可以在最新 Linux 上编译,还能与真实硬件顺利通信。可谓 AI 立大功!
AI 数据行业,总有新人出头。
9 月 7 日,知情人士向路透社透露,先进芯片制造设备的重要供应商 ASML 将成为法国人工智能初创公司 Mistral AI 的最大股东,此举旨在加强欧洲的科技主权。
你有没有经历过这样的场景:公司高层突然宣布"我们现在是AI优先的公司",然后看着你说"去组建一个AI团队吧",但预算和人员编制却纹丝不动?如果你点头了,那你绝对不是一个人。从Shopify到Duolingo,再到Zapier,似乎每家科技公司都在宣布自己转型为"AI优先",仿佛这是一张通往未来的船票。但现实往往更加残酷:你被赋予了AI转型的重任,却没有额外的资源去实现它。
今天吃到一个科技圈的瓜,主角是 77 岁的 AI 教父 Geoffrey Hinton,诺贝尔奖图灵奖得主。
在大型语言模型(LLM)进行数学题、逻辑推理等复杂任务时,一个非常流行且有效的方法叫做 “自洽性”(Self-Consistency),通常也被称为“平行思考”。
继封禁中国公司后,Anthropic 刚刚宣布:支持SB 53 法案。继上周封禁中国公司 API 访问后,这家 AI 公司表示,该法案为监管前沿 AI 公司构建的强大 AI 系统提供了坚实基础,通过透明度而非技术微观管理来实现监管。
BVP最新报告中,AI原生企业成为最大驱动力,22家AI公司合计贡献4640亿美元市值,占比42%,较2024年翻倍。这份报告不仅揭示了AI如何重塑云计算版图,还为投资人和创始人提供了关于估值趋势、增长速度、IPO窗口和人才军备竞赛的第一手洞察。
自2014 年提出以来,Adam 及其改进版 AdamW 长期占据开放权重语言模型预训练的主导地位,帮助模型在海量数据下保持稳定并实现较快收敛。