
一道题烧几千美元,OpenAI新模型o3:这34道题我真不会
一道题烧几千美元,OpenAI新模型o3:这34道题我真不会前几天,OpenAI 已经完成了 12 连更的最后一更 —— 如外界所料,是新的推理系列模型 o3 和 o3-mini 。
前几天,OpenAI 已经完成了 12 连更的最后一更 —— 如外界所料,是新的推理系列模型 o3 和 o3-mini 。
o3在超难推理任务ARC-AGI上的成绩,属实给人类带来了不少震撼。 但有人专门研究了它不会做的题之后,有了更有趣的发现—— o3之所以不会做这些题,原因可能不是因为太难,而是题目的规模太大了。
OpenAI o3的智商,竟然已经高达157,碾压99%的人类?这张OpenAI模型智商图全网疯转。甚至有人大胆预测:达到陶哲轩智商(225-230)的大模型,应该会很快出现了。
从韦氏智商测试来看,如果 o3 的 IQ 真这么高,则称得上非常优秀。 OpenAI o3 的智商(IQ)竟然已经这么高了吗 今天,Reddit 上一则热帖宣称「OpenAI o3 的 IQ 估计为 157」,并放出了一张数据图。
目前o3放出的信息还不多,但还是有一些内容可以做技术分析的。以及o3的重要性值得做一个专篇讨论。
o1/o3带火的推理计算Scaling,原来谷歌早在今年8月就曾探讨过。
比o1 mini性能更强,价格更低,性价比新王o3-mini再次引爆AI圈热议。
OpenAI o3相对o1的递进是非常惊人的,尤其它编程能力的进展后面肯定会产生越来越多,越来越大的现实冲击。
我们或许可以称o3是「更高级的推理AI」,而远不是AGI。 昨天凌晨,OpenAI 连续 12 天发布会终于落下了帷幕,并甩出了最强大的推理模型 o3 系列!
OpenAI 最新的 o3 系统在 ARC-AGI-1 公共训练集上训练后,在公共排行榜规定的 10,000 美元算力限制内,于半私有评估集上实现了 75.7% 的突破性成绩。而在高算力配置(172 倍)下,o3 更是达到了 87.5% 的成绩。