DeepSeek V3“报错家门”:我是ChatGPT

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
DeepSeek V3“报错家门”:我是ChatGPT
6638点击    2024-12-29 17:47

要说这两天大模型圈的顶流话题,那绝对是非DeepSeek V3莫属了。


不过在网友们纷纷测试之际,有个bug也成了热议的焦点——


只是少了一个问号,DeepSeek V3竟然称自己是ChatGPT。


DeepSeek V3“报错家门”:我是ChatGPT


甚至让它讲个笑话,生成的结果也是跟ChatGPT一样:


DeepSeek V3“报错家门”:我是ChatGPT


加之DeepSeek V3这次爆火的一个亮点,就是训练只花了557.6万美元的成本。


于是乎,有人就开始怀疑了:它不会是在ChatGPT的输出基础上训练的吧?


好巧不巧,Altman也发了一个状态,似乎在暗讽着什么……


DeepSeek V3“报错家门”:我是ChatGPT


不过DeepSeek V3并非是第一个出现“报错家门”的大模型。


例如Gemini就曾说过自己是百度的文心一言……


DeepSeek V3“报错家门”:我是ChatGPT


那么这到底是怎么一回事?


为什么DeepSeek V3报错家门?


首先需要强调的一点是,从目前网友们整体讨论的观点来看,说DeepSeek V3是在ChatGPT输出上训练的可能性不大


DeepSeek V3“报错家门”:我是ChatGPT


之所以这么说,正如网友Riley Goodside所总结的那样——因为ChatGPT的影子无处不在。


即便DeepSeek V3故意用ChatGPT的输出做了训练,但这并不重要。所有在ChatGPT之后出现的大模型,几乎都见过它。


例如ShareGPT,一个并不新鲜的ChatGPT对话数据集,许多人已经尝试在它和其它ChatGPT数据源上进行调整。但即便如此,也没能出现DeepSeek V3级别的大模型。


DeepSeek V3“报错家门”:我是ChatGPT


紧接着,Riley Goodside又拿出了DeepSeek V3报告中的一些证据:


而且要是用了ChatGPT数据的话,有些关于DeepSeek V3质量的问题是解释不通的。


例如Pile测试(基础模型压缩Pile的效果),DeepSeek V3得分几乎与Llama 3.1 405B相当,这跟它接没接触ChatGPT数据无关。


而且报告称95%的GPU-hours用于预训练基础模型,即便是跟ChatGPT数据有关,那这部分也会在post-training阶段发生(后5%)。


DeepSeek V3“报错家门”:我是ChatGPT


而比起用没用ChatGPT数据,或许我们应当更加关注的是为什么大模型会频繁出现“报错家门”的问题。


TechCrunch针对这个问题给出了一句犀利的点评:


因为AI公司们获取数据的地方——网络,正在充斥着AI垃圾。


毕竟欧盟的一份报告曾预测,到2026年,90%的在线内容可能是AI生成的。


这种“AI污染”就会让“训练数据彻底过滤AI的输出”变得困难。


DeepSeek V3“报错家门”:我是ChatGPT


AI Now Institute的首席科学家Heidy Khlaaf则表示:


尽管存在风险,开发者依然被从现有AI模型中“蒸馏”知识所带来的成本节约所吸引。


意外地在ChatGPT或GPT-4输出上进行训练的模型,也不一定会展示出让人想起OpenAI定制消息的输出。


那么现在对于网友们热议的问题,量子位进行了一波实测,DeepSeek V3目前还没有解决这个bug。


依旧是少了个问号,回答结果会不一样:


DeepSeek V3“报错家门”:我是ChatGPT


DeepSeek V3更多玩法


不过有一说一,绝大部分网友对于DeepSeek V3的能力是给予了大大的肯定。


从各路AI大佬们集体直呼“优雅”中就能印证这一点。


而就在这两天,网友们陆续晒出了更多DeepSeek V3加持的实用玩法。


例如有网友拿DeepSeek V3和Claude Sonnet 3.5一决高下,在Scroll Hub中分别用它俩创建网站:


DeepSeek V3“报错家门”:我是ChatGPT


博主在测试之后,认为DeepSeek V3完全胜出!


还有网友分享了用DeepSeek V3在AI视频编辑器中的体验。


他表示以后不用再在FFMPEG命令上浪费时间了,DeepSeek V3不仅免费,还能改变你的工作流程:


DeepSeek V3“报错家门”:我是ChatGPT


AI编程神器Cursor也能跟DeepSeek V3结合,来看一个做贪吃蛇的案例:


DeepSeek V3“报错家门”:我是ChatGPT


嗯,DeepSeek V3是有点好用在身上的。


One More Thing


对于此前公布的53页论文,也有网友关注到了一个非技术性的细节——


贡献列表中,不仅展示了技术人员,还有数据注释和商务等工作人员:


DeepSeek V3“报错家门”:我是ChatGPT


网友认为这种做法非常符合DeepSeek的调性:


DeepSeek V3“报错家门”:我是ChatGPT


参考链接:

[1]https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/

[2]https://x.com/victormustar/status/1872647314231398524

[3]https://x.com/breckyunits/status/1872422078592516295

[4]https://x.com/op7418/status/1872689338242482203

[5]https://x.com/goodside/status/1872911457857208596

[6]https://x.com/kevinsxu/status/1873146905846530472


文章来自于微信公众号“量子位”,作者“金磊”


DeepSeek V3“报错家门”:我是ChatGPT

关键词: AI , DeepSeek V3 , ChatGPT , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)