DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了
3526点击    2025-03-25 10:41

DeepSeek V3升级了,新版本V3-0324。


官方轻描淡写只说是“小版本升级”,但很多人实测下来可一点也不小。


DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了


把流行的小球弹跳测试,提升难度到4维空间超立方体也没问题。


DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了


天哪,如果这只是一个小更新,那我想象不出大更新会是什么样子。


DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了


编程这块,只需一句提示词开发一个完整产品着陆页,带自适应布局带动效,被评价为与Claude 3.7 Sonnet同一水平。


DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了


由于发布时间太短,还没有正式测评结果,不过在开发者Xeophon的个人Benchmark上所有指标都有大提升,成为该测试下最好的非推理模型。


DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了


不是推理模型也有“啊哈时刻”


DeepSeek-V3-0324并非推理模型,在回答之前不会给出思考过程,但依然遵循一定的思维方式分解问题。


走入死胡同的话,还表现出自主回到上一步重新思考的能力。


在“9.11和9.9那个大”、“Straberry有多少个r”已经不成问题的今天,最新折磨AI的难题是“让7米长的甘蔗通过2米高1米宽的门”。


在量子位的测试中,DeepSeek-V3-0324先是像它的前辈以及许多其他AI一样碰壁。


DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了


碰壁之后开始重新思考题目本身的含义,后面依旧陷入误区,但突然在中文解题过程中夹杂一句英语思考,类似DeepSeek-R1技术报告中的“啊哈时刻”


等等,这似乎与之前的对角线方法相似,也许我遗漏了什么。


DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了


顿悟之后,突然就走上了正确的道路,注意到了题目中没直接提到的隐藏条件。


DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了


虽然从计算过程看,还是没理解到问题的本质,但好歹得出了解决方案,还认识到了自己的误区。


DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了


依旧免费, 依旧开源


像这样的优秀模型依旧免费, 依旧开源,权重文件已火速上线HuggingFace,使用最宽松的MIT协议。


DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了


所有权重文件加起来占硬盘空间约688GB,与初代v3保持一致,说明依然是671B参数的MoE模型,目前没有更多技术细节,还需等待官方进一步发布公告。


目前在官网和官方APP(关闭深度思考即可)、HuggingFace等渠道都能体验到v3-0324。


DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了


也可以到大模型竞技场去与其他模型pk,不过投票结果还要等一段时间才能出来。


DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了


当然最让大家期待的还是,v3更新了,r2还会远吗?


DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了


官网试玩:

https://chat.deepseek.com/


HuggingFace:

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324/blob/main/README.md


参考链接:

[1]https://x.com/TheXeophon/status/1904225899957936314

[2]https://x.com/Yuchenj_UW/status/1904223627509465116

[3]https://x.com/risphereeditor/status/1904194061780590773


文章来自于“量子位”,作者“梦晨”。


DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了

关键词: AI , DeepSeek V3 , DeepSeek , AI编程
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0