DeepSeek V3“报错家门”：我是ChatGPT

6908点击 2024-12-29 17:47

要说这两天大模型圈的顶流话题，那绝对是非DeepSeek V3莫属了。

不过在网友们纷纷测试之际，有个bug也成了热议的焦点——

只是少了一个问号，DeepSeek V3竟然称自己是ChatGPT。

甚至让它讲个笑话，生成的结果也是跟ChatGPT一样：

DeepSeek V3“报错家门”：我是ChatGPT

加之DeepSeek V3这次爆火的一个亮点，就是训练只花了557.6万美元的成本。

于是乎，有人就开始怀疑了：它不会是在ChatGPT的输出基础上训练的吧？

好巧不巧，Altman也发了一个状态，似乎在暗讽着什么……

DeepSeek V3“报错家门”：我是ChatGPT

不过DeepSeek V3并非是第一个出现“报错家门”的大模型。

例如Gemini就曾说过自己是百度的文心一言……

DeepSeek V3“报错家门”：我是ChatGPT

那么这到底是怎么一回事？

为什么DeepSeek V3报错家门？

首先需要强调的一点是，从目前网友们整体讨论的观点来看，说DeepSeek V3是在ChatGPT输出上训练的可能性不大。

DeepSeek V3“报错家门”：我是ChatGPT

之所以这么说，正如网友Riley Goodside所总结的那样——因为ChatGPT的影子无处不在。

即便DeepSeek V3故意用ChatGPT的输出做了训练，但这并不重要。所有在ChatGPT之后出现的大模型，几乎都见过它。

例如ShareGPT，一个并不新鲜的ChatGPT对话数据集，许多人已经尝试在它和其它ChatGPT数据源上进行调整。但即便如此，也没能出现DeepSeek V3级别的大模型。

DeepSeek V3“报错家门”：我是ChatGPT

紧接着，Riley Goodside又拿出了DeepSeek V3报告中的一些证据：

而且要是用了ChatGPT数据的话，有些关于DeepSeek V3质量的问题是解释不通的。

例如Pile测试（基础模型压缩Pile的效果），DeepSeek V3得分几乎与Llama 3.1 405B相当，这跟它接没接触ChatGPT数据无关。

而且报告称95%的GPU-hours用于预训练基础模型，即便是跟ChatGPT数据有关，那这部分也会在post-training阶段发生（后5%）。

DeepSeek V3“报错家门”：我是ChatGPT

而比起用没用ChatGPT数据，或许我们应当更加关注的是为什么大模型会频繁出现“报错家门”的问题。

TechCrunch针对这个问题给出了一句犀利的点评：

因为AI公司们获取数据的地方——网络，正在充斥着AI垃圾。

毕竟欧盟的一份报告曾预测，到2026年，90%的在线内容可能是AI生成的。

这种“AI污染”就会让“训练数据彻底过滤AI的输出”变得困难。

DeepSeek V3“报错家门”：我是ChatGPT

AI Now Institute的首席科学家Heidy Khlaaf则表示：

尽管存在风险，开发者依然被从现有AI模型中“蒸馏”知识所带来的成本节约所吸引。

意外地在ChatGPT或GPT-4输出上进行训练的模型，也不一定会展示出让人想起OpenAI定制消息的输出。

那么现在对于网友们热议的问题，量子位进行了一波实测，DeepSeek V3目前还没有解决这个bug。

依旧是少了个问号，回答结果会不一样：

DeepSeek V3“报错家门”：我是ChatGPT

DeepSeek V3更多玩法

不过有一说一，绝大部分网友对于DeepSeek V3的能力是给予了大大的肯定。

从各路AI大佬们集体直呼“优雅”中就能印证这一点。

而就在这两天，网友们陆续晒出了更多DeepSeek V3加持的实用玩法。

例如有网友拿DeepSeek V3和Claude Sonnet 3.5一决高下，在Scroll Hub中分别用它俩创建网站：

DeepSeek V3“报错家门”：我是ChatGPT

博主在测试之后，认为DeepSeek V3完全胜出！

还有网友分享了用DeepSeek V3在AI视频编辑器中的体验。

他表示以后不用再在FFMPEG命令上浪费时间了，DeepSeek V3不仅免费，还能改变你的工作流程：

DeepSeek V3“报错家门”：我是ChatGPT

AI编程神器Cursor也能跟DeepSeek V3结合，来看一个做贪吃蛇的案例：

DeepSeek V3“报错家门”：我是ChatGPT

嗯，DeepSeek V3是有点好用在身上的。

One More Thing

对于此前公布的53页论文，也有网友关注到了一个非技术性的细节——

贡献列表中，不仅展示了技术人员，还有数据注释和商务等工作人员：

DeepSeek V3“报错家门”：我是ChatGPT

网友认为这种做法非常符合DeepSeek的调性：

DeepSeek V3“报错家门”：我是ChatGPT

参考链接：

[1]https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/

[2]https://x.com/victormustar/status/1872647314231398524

[3]https://x.com/breckyunits/status/1872422078592516295

[4]https://x.com/op7418/status/1872689338242482203

[5]https://x.com/goodside/status/1872911457857208596

[6]https://x.com/kevinsxu/status/1873146905846530472

文章来自于微信公众号“量子位”，作者“金磊”

DeepSeek V3“报错家门”：我是ChatGPT

关键词: AI , DeepSeek V3 , ChatGPT , 人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）