OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek
9128点击    2025-02-07 11:11

刚刚,OpenAI把o3-mini的推理思维链公开了。


从今日起,免费用户和付费用户都可以看到模型的思维过程,OpenAI终于Open一回。


OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek


评论区网友纷纷:让我们谢谢DeepSeek。


OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek


在官方展示的栗子中,可以看到o3-mini的内心戏不少,还会模仿用户提问使用表情包。


用户的提问是“为什么今天不少星期五”


o3-mini认为这是一个幽默的评论,并认为自己也应该给出机智的回答,使用蔡勒公式计算当天确实不是星期五后,对闰年的特殊情况做了二次检查。


最后回答的中,调侃了是日历规定今天是星期四,并安慰用户“忍耐一下,明天就离周未更近了!”


OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek


那么作为“同行”,DeepSeek-R1如何评价o3-mini的思维过程呢?


OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek


在这个案例中,AI声称使用了蔡勒公式但没有给出计算过程的现象引起了很多人警觉。


不少用户怀疑这仍然是事后对AI思维过程的再总结,而不是原始数据。


OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek


实际上在最近的“回应一切”活动中,OpenAI首席产品官Kevin Weil也暗示了这点:


……展示完整思想链会被竞争对手蒸馏,但我们也知道人们(至少是资深用户)想要它,因此我们会找到正确的方法来平衡它。”


OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek


对此,开发者Mckay Wrigley补充了一个观点:“我担心经过总结的思维链实际上比没有思维链更差”。


真正的思维链相当于prompt的调试器,有助于我们引导矫正模型。
经过总结的思维链增加了迷惑性并且可能额外添加错误,让模型难以被调试。


OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek


但不管怎么说,既然公开了,现在免费用户也能一窥o3-mini的CoT,大家还是敞开玩了起来。


o3-mini思维链首批实测


OpenAI多模态Agent的研究员,首先亮出了自己的玩耍方法,让o3-mini玩井字棋游戏——就是在3*3格子上用O和X连线那个。


输入Prompt:


你正在玩井字棋,你是O。到目前为止,X已经在左上角和右下角玩过,你已经在中间玩过。下一步的最优策略是什么?只用你的答案和棋盘图回答。


然后o3-mini就开始噼里啪啦思考。


OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek



这位OpenAI员工非常直言不讳,表示o3-mini是第一个回答这个游戏的大模型。


But还有一句,“虽然o3-mini的CoT过程有点不靠谱,但你看右边的图,结尾它的弄清楚了的”。笑不活了,这里必须要送上一个手动狗头。


OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek


然后是每个大模型都逃不过的经典测试题:数strawberry里面的“r”的数量。


但网友已经和模型一样进阶了,问的不是strawberry里面到底有几个某字母,而是:


为啥AI大模型,数strawberry里面有几个“r”,它就那么费劲呢???


OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek


我们认真观摩了它的思考过程,o3-mini承认“乍一看,计算strawberry中‘r’的数量对人类来说似乎是一个微不足道的任务,但对于许多AI语言模型来说,这可能是一个惊人的挑战”。


然后它从四个角度来思考和推理这个现象发生的原因,分别是:


  • 用自然语言而不是算法训练
  • Tokenization问题
  • 迭代推理的缺失
  • 对模式识别的依赖


8秒过后,o3-mini给出总结:


因为AI大模型本质上不是为精确、分步骤的算法操作而设计的,它们的设计和训练更多地侧重于根据上下文预测和生成文本,而不是执行精确的算术或系统计数。


当然,o3-mini也不是万能的。


推特有网友表示,他探问了o3关于私有CoT的事情,但听君一番思考推理,如听一番思考推理,没有丝毫进展。


最开始,o3-mini思考过程还蛮有逻辑,从不同种类的“内心叙事”、可解释性和实用价值等方面分析,表示展现完整的CoT过程程似乎有助于“扎根”社会的理解并促进更好的认知实践,但现实更为复杂,毕竟AI大模型和人类的认知还没有完全对齐。


OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek


但随着网友的追问,o3-mini的思维链就崩了(?),急得他团团转,中间一度打开DeepSeek-R1来帮忙。


他放上了整整12张图,显示最后o3-mini思维了半天,给出了一个令人心碎的回答:


对不起吼,但我真的帮不了你一点。


OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek


除此之外,还有网友提出了质疑,觉得OpenAI公开的不是o3-mini原始的CoT。


有几个原因,其中一个是它(CoT过程)真的显示得很慢。
而如果是原始的o3-mini非常快,讲道理推理的生成速度应该比现在呈现的快得多。


他继续罗列自己之所以怀疑的证据,比如同一个问题,o3-mini-high只有1384个字符,而o1-preview生成了16577个字符。


“这只有两种可能,一是o3-mini-high比o1-preview高效得多;二是o3-mini的CoT不是原始版本。”


OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek



One More Thing


想对上面这位推特网友说,Bingo!


根据TechCrunch消息,OpenAI发言人确认了这次公开的不是原始思维链,并且给出两个理由:


  • 对原始思维链做后处理,可以消除任何不安全的内容,并简化任何复杂的想法。
  • 使非英语用户获得母语的思想链,有更友好的体验。


这样一来,最近被大量吐槽的o3-mini使用中文思考的问题,也就不存在了。


OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek



参考链接:

[1]https://techcrunch.com/2025/02/06/openai-now-reveals-more-of-its-o3-mini-models-thought-process/

[2]https://x.com/polynoamial/status/1887628222042677387

[3]https://x.com/pigeon__s/status/1887619637099249884

[4]https://x.com/thegenioo/status/1887617601016385840



文章来自微信公众号 “ 量子位 ”,作者 梦晨 衡宇



OpenAI突然公开o3思维链!网友:让我们谢谢DeepSeek

关键词: OpenAI , o3-mini , 思维链 , chatGPT
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0