DeepSeek下一步,被曝剑指智能体。
知情人士透露,DeepSeek正在开发具有更强大AI Agent能力的新模型,预计在今年年底就会推出。
△图片由AI生成
官方尚无回应,但这一爆料并非无迹可寻。
在DeepSeek 8月的最近一次更新中,DeepSeek-V3.1上线。官方发布的升级公告中就提到:
DeepSeek-V3.1具备更强的Agent能力,通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。
迈向Agent时代的第一步
彭博社援引知情人士消息,爆料DeepSeek的下一个模型,仅需少量提示,就能帮用户执行复杂操作,并且还能根据历史操作自我进化和学习。
这一模型将在今年最后一个季度面世。
此前,业内普遍推测,按照DeepSeek V3和DeepSeek R1的发布节奏,在被期待已久的“R2”之前,DeepSeek应该会先一步推出新一代V系列的基础模型。
而从去年12月到今年8月的近9个月时间里,DeepSeek V系列的版本号只从V3来到了V3.1。
看上去仅仅是小版本的改进,但从DeepSeek官方后来公布的测试结果来看,似乎又暗藏玄机。
DeepSeek-V3.1的主要升级包括3点:
具体来看提升效果。
编程智能体方面,在代码修复测评SWE和命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相较V3和R1有明显提高。
而在搜索智能体测评中,相较于DeepSeek-R1-0528,DeepSeek-V3.1也展现出了全面的性能提升。
DeepSeek R1将推理模型推向发展新高潮,成了搅动全球大模型行业格局的一尾鲶鱼。
Manus让智能体的概念火爆出圈,被称为“第二个DeepSeek时刻”——
来到2025年的下半年,几乎没有大模型产品不谈智能体。吴恩达也在最新Andrew’s Letters中提到:并行智能体正在成为提升AI能力的新方向。
早早预定2025年年度热词的DeepSeek和智能体一叠加,立刻又触动了人们兴奋的神经。
已经有人开始期待:如果是DeepSeek来做这件事,那智能体的价格门槛,真的要被打下来了。
但也有人保持怀疑:这个时候入局智能体,还算好时机吗?
不管怎么说,可以确定的是,在2025年余下的最后1/3时间里,大模型领域的热闹依然将每天持续。
最后的最后,小小One More Thing一下,信源来自官方,妥妥靠谱:
Qwen 3 max也要来了吗?
欢迎一起,见证下一个历史时刻。
文章来自于微信公众号“量子位”,作者是“鱼羊”。
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md