汤道生姚顺雨对谈:腾讯AI的下半场

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
汤道生姚顺雨对谈:腾讯AI的下半场
7950点击    2026-06-05 13:47

汤道生姚顺雨对谈:腾讯AI的下半场


6月5日,腾讯云AI产业应用大会上,腾讯集团高级执行副总裁汤道生和首席AI科学家姚顺雨同台对谈。这是姚顺雨加入腾讯后第一次在公司活动中公开亮相。


这场对谈的主题叫《腾讯AI的下半场》。2025年4月,姚顺雨曾在个人博客发表《The Second Half》一文,在技术社区广泛传播。文章的核心判断是:AI正站在中场分界线上,上半场的核心在于训练方法和模型的突破,下半场的重心将从“解决问题”转向“定义问题”,评估体系的重要性将超过训练本身。他提出,未来的赢家不再只是造出更强的模型,而是能定义什么问题值得解决、如何衡量真实进展。


八个月后,2025年12月17日,腾讯内部公告正式任命姚顺雨为“首席AI科学家”,直接向总裁刘炽平汇报,同时兼任新设立的AI Infra部和大语言模型部负责人。他是ReAct智能体范式的提出者,也是OpenAI旗下Operator和Deep Research两个Agent产品的核心贡献者。


姚顺雨到任后,混元团队从2026年2月起重建预训练和强化学习基础设施,4月发布Hy3 preview——一款总参数295B、激活参数21B的混合专家模型,这个版本明确以“实用性”为导向。据腾讯披露,Hy3 preview在内部产品CodeBuddy和WorkBuddy上首token延迟降低54%,已能稳定驱动最长495步的复杂Agent工作流。上线OpenRouter后,该模型一度拿下周榜调用量与市场份额双第一。


刘炽平在最近的财报电话会上表示,混元团队已完成组织方式和工作流程的重构,重点在数据质量和模型与产品的协同上。腾讯云则在去年首次实现规模化盈利,企业AI需求是主要驱动力。


在这场约45分钟的对谈中,姚顺雨提出了他加入腾讯的核心逻辑:AI方法论已趋成熟,难的不再是怎么训练模型,而是找到好的问题去解决,腾讯拥有丰富的产品场景和高质量的上下文数据(context),这在Agent时代将成为关键壁垒。


他同时给出了对“腾讯慢了”这一问题的直接回应:如果AI是长期游戏,下半场才刚刚开始,那现在并非晚了;ChatGPT和Claude不会是唯一的超级应用,coding agent之外还有大量新的产品范式等待探索。


汤道生以“产品老兵”的视角,谈到AI时代做产品与PC互联网、移动互联网时代的本质不同:过去的产品像预制菜,通过功能菜单满足需求;AI产品则面对开放式的用户输入,产品方甚至不知道用户会问什么,必须依赖模型能力来理解和响应。这种变化倒逼组织形态走向小团队化、实验驱动,工程师更像“驱动多个coding agent的产品leader”。


对谈最后,汤道生宣布腾讯将发布一套“效率智能体工具集”,背后是场景连接、Harness工程体系和混元模型Co-Design三重能力的整合。


汤道生姚顺雨对谈:腾讯AI的下半场


以下为对谈实录的关键内容梳理:


01


为什么选择腾讯?Context、文化与AGI组织


姚顺雨:过去AI的核心是寻找好的方法,但最近很明显,方法论已经变得非常成熟,寻找问题反而变得更加困难。举个例子,过去我们做下围棋,会发明像AlphaGo这样的方法,但它可能只适合下围棋或者下各种棋类。你会为了翻译做一个特别的模型,但它只能用来做翻译,不能做其他事情。


但是有了预训练和后训练之后,我们发现我们像有了一个万能的锤子,它可以去砸任何钉子,是一个通用的方法论,可以去解决各种各样的问题。那么反而更困难的是怎么去寻找好的问题去解决。


所以我觉得加入腾讯很重要的一点就是这里有很多好的问题,有很多很多产品,我觉得这一点会在接下来变得越来越重要。一方面好的产品能够解决第一个问题:我们做了预训练和后训练之后,到底要把它应用在什么地方产生价值?第二就是环境非常重要。如果没有好的环境,Agent就没有办法去做各种各样的事情。比如你没有一个点外卖的tool,你就没有办法去点外卖,很多事情做不到。但我觉得可能最重要的是context。


无论是企业还是个人,我觉得越来越重要的事情是context,因为模型越来越擅长把一个非常复杂的输入变成一个输出。那很多时候你的竞争壁垒就来自于你有没有最原始的输入——你知不知道这个人他到底在干什么?你知不知道这个企业的各种各样的信息?这一点腾讯有非常强的优势。


但其实这只是第二大的原因,我觉得最重要的原因是文化。我还记得第一次跟你聊天的时候,包括和很多其他总办的老板们聊天的时候,我的第一印象就是大家都非常诚实。哪里做得好,哪里做得不好,都非常直白,不会去掩盖。我觉得这种坦诚是我的第一印象。


第二,我觉得腾讯总体是一个基于trust(信任),而不是基于metric(指标)去运转的公司。我觉得这一点对于做AI是非常重要的。包括我们的文化其实有非常low ego(低调)、非常solid(扎实)的一面。我觉得这些文化对于长期建设一个AI组织是非常重要的,包括我们对长期主义的坚持。


所以AI下半场最重要的是什么?我个人的目标是,我觉得我们应该在中国建立一个长期的、基于AGI的组织。我觉得今天的AI主要有三个部分:首先是Foundation(基础模型)的部分,我们怎么把预训练和后训练最基础的东西做得非常扎实;第二部分是产品,我们怎么把这样的技术真的为人和社会产生价值;第三就是Frontier,我们怎么去探索新的研究范式,探索新的机会。我觉得最重要的就是我们要构建一个非常均衡的、三角形一样的组织。


对于Foundation(基础模型)来说,最重要的第一是充足的资源,第二是正确的做事方式,这跟我刚说的文化也是吻合的。对于产品来说,有好的产品感、有做产品的基因至关重要。第三,我觉得在中国,我们今天做的探索可能还不够多,所以我也希望能把这种前沿探索的精神更多地注入到我们的组织中。


汤道生:你提到的跟总办聊天过程中感受到的真诚和务实,其实也是我经常跟客户交流时得到的反馈。我觉得我们做事的方式、做产品的理念比较实事求是。毕竟AI赛道还是一个长跑。有时候认知也很重要,哪些做得好的,哪些做得不好的也得认。但关键这是一个多维度的竞赛。我们看到现在模型有很多进步,做产品也有越来越多的形态,不同场景有不同的需求,我觉得未来还是非常可期的。


02


Co-Design:模型与产品如何深度协同


汤道生:你刚提到模型跟产品,产品可以说提供了一个环境,里面要给模型提供context、上下文。我想问你一个问题,我们平时开会比较多提到的一个词是Co-Design,怎么把产品跟模型能够比较紧密地结合起来?尤其今天有这么多丰富的产品,从我们合作非常紧密的像元宝这样的聊天机器人,包括AI搜索,企业里面也有部署一些智能客服、智能营销,另外最近非常火的类龙虾的产品,像CodeBuddy、WorkBuddy,对模型的能力依赖很深。你怎么去思考Co-Design这个方式?


姚顺雨:我觉得有三点。首先Co-Design的前提是模型本身要做得很solid,有很多foundational work(基础工作)要做好。预训练是一个相对产品agnostic(不绑定具体产品)的事情,它做得非常扎实可以给各种产品提供一个非常强的基础,而且预训练最大的特点是它是一个可泛化的学习过程,它的进步可以带给各种各样下游的任务持续的价值。


后训练的话,我觉得最重要的一点是要设立好正确的eval。中国可能大家有个不好的倾向,就是比较喜欢刷榜。但如何实事求是地基于产品、基于真正的应用去构造更加真实的eval,这首先要有好的产品出口,第二要意识到实用性的价值是大于刷榜的价值的。这一点我们做了大量的工作,跟各种各样的产品进行了深度的Co-Design。Co-Design很关键的一点就是要产生相互的信任,我们也做了大量工作去取得互信。怎么把产品的数据用好?怎么做好回流?怎么把eval做好?有很多细节我就不赘述。


第三点我想说的是,LLM时代和过去的AI最本质的区别就是泛化性。在LLM之前,你做一个翻译的产品,只要把翻译的数据做特别好就行了;你做一个围棋的程序,只要把围棋的数据准备特别好就行了。但是今天,即使你只想做一个Coding Agent,你发现需要的也不仅仅是Coding Agent数据,你需要非常好的聊天能力、非常强的搜索能力、非常强的指令遵循能力、非常强的推理能力,它其实是一个非常复合的data taxonomy(数据构建)。


我觉得这个事情的一个推论就是,有很多产品形成体系化的地方,会有比较大的优势。比如我们和元宝的Co-Design可以使模型产生很强的聊天和搜索能力,但这样的能力可能又可以被迁移到ima或WorkBuddy这样的其他产品。所以这些产品能够提供不同的数据,但这些数据之间又可以相互泛化,形成一个像网络一样的体系。这一点的价值会越来越重要。


汤道生:其实外部的刷榜也属于eval的一种。那我们内部做eval跟外部的benchmark有什么区别?


姚顺雨:我觉得这些benchmark还是有它的价值,不是说完全没有价值,只是现在这些榜非常容易saturate。基于真实世界的数据有几个帮助:首先你能发现模型的很多底线问题。实际上我们想发一个preview模型,最重要的目的之一就是希望能获得真实世界的反馈,来修复各种各样榜单中没法发现的底线问题。我觉得这一点会在正式版上有一个非常大的改进。


第二点,你对真实的prompt distribution有一个更深的了解。比如benchmark上的题目可能都非常精确,有很长的具体描述,一般是单轮的问题。但在现实场景中,大家问的问题都是比较模糊的,可能就一两句话,然后不停追问。这些setup上的差异可以启发我们怎么去更好地做训练。


第三,我们甚至可以在这些产品上面获得一些灵感,去推进现在可能还没有的榜单或领域。比如元宝给我们的启发就很有帮助。产品和模型的Co-Design是越来越重要的一个AI话题。


汤道生:我记得我们在早期做元宝的时候,还碰到指令不能遵循的问题。真正在产品里面大家使用所需要的能力,跟benchmark确实有蛮大的差异的。


姚顺雨:你问了我这么多问题,我也问一点你。我记得第一次跟你聊的时候,你给我讲了很多——从QQ空间、QQ秀的时代,到QQ音乐,到云,到现在的元宝、ima。跟你聊天很有意思,因为你做过各种各样的产品,to C的也有,to B的也有,远古时代的也有,最新的AI时代的产品也有。你觉得你做产品的第一性原理是什么?哪些经验或价值是不变的?哪些东西变了?


汤道生:我觉得最终做产品还是奔着——用户到底有什么需求?我怎么去解决他的痛点?怎么给用户或客户创造价值?在不同的时代,甚至不同的行业,做一个产品还是需要能够给用户带来价值,他才会买单、才会使用。


从PC互联网时代做空间,移动时代做各种各样的内容产品,到产业互联网做云,我们也要花好多时间精力去听客户的声音,尝试去帮助他们解决问题。底层的逻辑其实没有这么大的变化。


但确实,在PC互联网、移动互联网时代做产品跟今天在AI时代做产品还是有蛮多不一样的地方。首先从范式的角度来看,在AI时代以前,我们做产品很多时候想的是通过功能来满足用户的需求。你作为产品提供方、服务提供方,想清楚提供怎样的一个能力,让用户通过界面、通过某些菜单去选,好像是一些预制菜,你只能在里面去点。


但在AI时代做产品,它的开放式的服务形态就会带来很不一样的要求跟挑战。用简单的交互方式,可能是自然语言,可能是语音。作为产品方,你也不知道用户会问什么,所以要充分利用模型能力去理解用户的需求。通过大模型的逻辑推理、调用工具的能力,产品给模型提供各种各样可用的工具,来应对开放式的需求。这是跟过去做产品很不一样的地方。


包括eval也是,以前做产品,我们有很清晰的specification,有很清晰的产品功能的描述,怎么设计、怎么研发、怎么测试,瀑布式的流程也比较清晰。但在做AI产品,我发现最大的变化是整个流程可能都要重新设计。尤其今年大部分的代码都由AI生成,工程师可能会花更多时间去做架构设计,把写代码的工作交给AI了,定期去指导、修正。测试也要左移,更前置地想清楚,针对各种case、eval,还有对齐用户所需要的风格。我感觉今天AI时代做产品,要求的能力更全面,也更难了。


汤道生:那我又问你一下,Hy3 preview是你的腾讯首秀,具体做了什么改变?你能给大家介绍一下吗?


姚顺雨:其实我觉得没有什么秘密。今天做大模型,从某种程度没什么秘密:我们应该把infrastructure做好,我们应该把数据做好,算法的部分其实反而是比较简单的。主要有几个点:第一,我们把infrastructure进行了重建,无论是预训练还是强化学习。第二,我们把数据和eval做了很多大的改变——如何去定义更真实的问题,如何去丰富data的taxonomy(数据构成),如何去提高数据的质量,这是一个永无止境的追求。第三,很多重要的决策,包括怎么去招人,怎么设立模型的节奏,每天有很多决策要做,要考虑很多trade-off。我觉得可能没有一个很清晰的公式,是一个很case driven的事情。


姚顺雨:所以我也很好奇,你对Co-Design这件事情是怎么想的?你觉得哪些事情应该是模型应该做的?哪些东西应该是产品应该做的?


汤道生:我觉得Co-Design在不同阶段,过去这两年一直在变化。这个变化某种程度是随着模型能力的升级而变化的。当然整个行业市场用户的需求,也需要模型跟产品两边更好地去满足。给我一个比较深的感受是怎么去对齐。因为在我们一起去做产品、做alignment对齐会的时候,有很多不同的角色。产品可能要针对某个方向去解决一些问题,模型到底怎么去满足这个需求?但同时,你要回到模型需要数据——数据应该怎么标注?到什么颗粒度?到底什么是好的标注?什么是不好的标注?因为有些地方要奖励,有些地方要惩罚。


还有评测。如果产品认为好的体验,但评测不认同的话,大家做出来的产品就会不一致。所以Co-Design给我的感觉更多的是在项目组里面,不同角色参与到产品设计,定了产品的目标方向后,怎么让多个角色能够对一些开放式问题有比较好的对齐。如果没有做到这样的对齐,你会发现产品的行为会不可预测,甚至有时候会有一些随机性,因为模型在训练过程中可能也被混淆了。这是我这两年跟模型团队做Co-Design的一个比较深的感受。


姚顺雨:对,我觉得最难的一点就是要建立trust(信任),并且同理心很重要。说到底,做模型的目标和做产品的目标有很多align(对齐)的部分,也有很多不align的部分。模型的人会希望能力越强越好,但产品的人可能希望用户的需求满足得越好就越好,所以天然有很多不align的部分。我觉得很重要的一点就是要有换位思考的能力。


其实你刚刚问我元宝,我们是怎么一步一步Co-Design的?一个很重要的细节是,当时我们派了后训练最强的骨干力量去帮助元宝先把DeepSeek的后训练做好,因为那个时候我们自己的预训练还没有ready,但是我们知道维护这个产品以及它的DAU,对于我们接下来做模型也会变得非常重要,而且对长期的合作非常重要。当时其实很多算法同学不理解,我需要去很努力地解释。但现在看起来这些努力都pay off了——这样的动作让产品团队意识到模型同学是真的在为产品着想,对我们之后的合作,包括混元Hy3 preview在元宝上成功上线,起到了非常重要的作用。当然有很多技术的部分可以探讨,但可能最难的部分,其实反而是怎么样去建立信任、怎么样换位思考。


汤道生:非常认同。


03


从ReAct到Coding Agent:智能体技术的演进与性价比


汤道生:那我换一个话题,你是ReAct架构的提出者,博士研究也是围绕语言智能体展开的,你几年前的一些观点到今天兑现了吗?


姚顺雨:那天我还挺感慨的,因为我重新读了自己的博士论文,感觉又回到了一个很远古的时代。我的博士论文的标题叫做“Language Agent: From Next Token Prediction to Digital Automation”。


汤道生:那是哪一年?


姚顺雨:2019年。那个时候是GPT-2的时代,它当时只能做next token prediction(预测下一个token),产生的一段话可能还不太连续,还有很多毛刺,所以我觉得当时人们很难想象它有一天会成为改变世界的力量。当时大家做的研究,稍微有想象力一些的,比如说“中国的首都是”,如果做next token prediction,它会回答“北京”——它是一个有knowledge的事情,如果做到这一点,大家当时就非常开心了。


那当时我的想象力可能比较狂野吧,我觉得GPT是个非常优美的东西,吐出下一个token是一个非常极简且非常通用的事情。我觉得它有一天潜力不仅仅在于吐出下一个token,而是在于把这个世界上所有的事情全部automate。当然当时我想的是Digital Automation,但现在看起来也有可能是Digital and Physical Automation。


我博士期间主要做两部分,第一部分是如何建立一个Agent的方法论,如何把一个next token prediction的机器变成一个Agent、一个自动化的机器。最重要的一篇工作可能就是ReAct。我还记得2022年7月份的时候,某一天晚上,当我第一次把PaLM 2的API和自己手写的一个Wikipedia的API连在一起,它第一次可以基于网页回答问题并且多轮交互的时候,我当时感觉就像微弱的电灯丝突然亮了的感觉一样。


据我所知,这可能是第一次人类把LLM和真正的互联网连在一起,并且去做这种多轮的交互。我当时的感觉就是,这个东西可能在5年或者10年会改变世界,但可能比我想象中还要更快。


包括我记得当时第一次提出SWE-bench的idea时,我就觉得如果这个事情能做到,那很显然会带来巨大的价值——当时可能觉得是几百亿、上千亿,但现在可能是数万亿、数十万亿,可能我想的还是太小了。


另一部分我做的工作就是怎么去定义Digital Automation的任务。比如Webshop是第一个基于互联网的Web Agent的task,包括Intercode和SWE-bench是最早的Coding Agent的任务。现在看起来Agent技术最重要的两个部分可能确实是Web Agent和Coding Agent。


最后我还在群里面跟大家聊天说,我看我那个博士论文的结尾,2024年写的future work(未来研究方向):第一个是train models for agent(为智能体训练模型),第二个是safe and robust deployment(安全且稳健的部署),第三个是scientific discovery(科学发现),第四个是怎样去help human(帮助人类)。我很感慨——我现在很幸运,确实在做我当时列的future direction(未来方向)。


汤道生:预判太厉害了,整个行业都在针对这些方向推进。


姚顺雨:可能想的还是不够大。我当时已经觉得自己想得够大了,但可能还是不够大。


汤道生:技术的发展往往超乎我们的预期。我再转一个话题,智能体今天大家都说需要消耗很多Tokens。这对于混元做下一代模型的研发,你觉得你的侧重是什么?有哪些地方是比较重要的?


姚顺雨:毫无疑问,今天Agent或者说Coding Agent有点像预训练一样,是一个不得不做的事情,是最基础的能力。我个人觉得Coding Agent非常本质,其中一个很重要的原因是它有点像图灵完备的事情——当你有能力去控制自己的file system,当你有一个container的时候,其实你就是一个complete的system。今天Agent毫无疑问是每一家模型厂商发力的重点。我们会有几个区别:


第一,即使今天Coding Agent是最重要的事情,我们还是会强调体系的全面化。我始终认为,真的要把Coding Agent做好,需要的远远不止Coding Agent数据,你也需要聊天、instruction following、推理等各种各样不同的东西,因为大模型最重要的点是泛化性。


第二,产品的作用越来越重要,如何利用好线上的回流,是每一个模型厂商都在应对和思考的问题。我们积累的很多Co-Design经验会变得非常重要。第三,我觉得还是需要更多想象力,无论是技术的演进、产品的演进,还是下一个范式的演进,我们还是需要做一些探索性的、甚至不确定性的工作。


汤道生:从产品侧来说,大家越来越有Token焦虑,成本持续爆发式增长。我也听到很多客户、甚至身边的同事们,都在紧盯着Token的消耗。怎么可以让模型在解决某个问题或完成某一个任务时Token效率最高?因为我之前做过一些任务,模型可能会试不同的方向,有些方向你也知道肯定走不下去的,但模型还会试完,发现走不下去再试下一个。这里面有什么可以optimize的地方?


姚顺雨:现在中国大家讨论性价比,可能更多讨论的是模型架构。但其实它是个很复杂的体系。我觉得可能最重要的事情首先是你的performance(性能)。很多人跟我说,他最后发现用Opus这样的模型,比用一个更差的模型其实更省钱,因为你更快地把事情做对了,也省了人的精力。


其实最重要的是performance,如果你的性能好了,才是真正提升性价比最关键的事情。尤其今年,我觉得很多简单任务的robustness(鲁棒性)会变得更加重要——如何一次把很多相对简单的任务做对,这可能是性价比更关键的部分,而不仅仅是模型架构。


第二部分是成本。性价比嘛,第一是“性能”,如果性能不好,性价比就无从谈起。第二是成本,中国在这方面其实是领先世界的,我们做了大量工作去优化成本。但成本最重要的事情可能还是怎么用一个更小的模型把更高价值的任务做好。在这个基础上,架构的创新、长文的管理、脚手架,有很多需要做的事情。


但我个人的看法是,如果我们能做一个相对较小的模型,但它又能比肩大模型的性能,而且能在大部分任务上做到很强的robustness,这可能比在很多非常长程的fancy的task上实现一两个点的提升,在今天的中国更有价值。


姚顺雨:我也挺好奇,Dowson,你觉得Agent,你是什么时候意识到它是一个新的产品机会?以及你现在的认知是什么?你觉得我们离一个好用的Agent的瓶颈在哪里?


汤道生:因为我们做的Agent针对不同场景有不同的产品形态。在Agent的设计上,很大程度是在尽量发挥好模型的能力。当然模型在迭代,它能力越强,Agent需要做的工作可能越来越少。


我看我们好几个产品在过去这段时间,随着模型能力加强,可以把Agent做得更简化,更多的是给模型提供更多不同的工具、创造更多的skills来让模型更高效地完成任务,给模型提供更多的记忆——用户过去使用的一些习惯,提取出来的用户preference信息,作为上下文feed过去。


在Coding的环境有相关的context给到模型,在WorkBuddy里面做办公协作、做PPT,大家关注的内容或者该给到模型的context也会不一样。所以在做不同的Agent,我觉得更重要的还是了解场景下什么内容、什么信息是重要的、比较relevant的,能够跟模型配合好,让模型有它需要的信息,同时也发挥它的能力。


姚顺雨:最近我们确实推出了像WorkBuddy这样口碑很不错的产品,背后我观察到很多小团队在快速迭代。我挺好奇,相对于传统的产品研发,你觉得在Agent时代,研发和组织管理上产品团队发生了什么变化?


汤道生:我前一阵子在帮WorkBuddy做组织发文,我看了一下他们非常扁平化的组织,跟我们过去的产品组织架构有很大的差异——更多的小团队,3个人、5个人一个,可能就围绕着某一个领域来做。


而且有很多实验在里面,所以我们还要支持好AI Infra去做实验,让不同的小分队可以去探索、再验证。因为实验大部分可能拿不到正向的反馈,我们也要包容团队去试错。通过大量实验去提炼出对用户留存、对我们想要的结果有正向帮助的东西——这是我觉得今天做Agent、做AI原生产品,组织形态要能比较好地去支撑的。


另外,原来工程师有很多时间花在写代码上,但今天毫无疑问这些工作可以交给AI了。所以我们会看到更多角色的融合,可能大家都是产品经理,都要了解透彻用户的需求,设计出我们想要的产品形态。每一个工程师可能就更像一个有想法的leader,驱动着多个Coding Agent来做研发开发。同时也要把评测测试前置,用好AI的能力,把质量保证的工作、alignment对齐的工作做到前面来。


04


AI下半场:腾讯慢了吗?


汤道生:我也想再问一个大家比较多讨论的问题。其实很多自媒体都会提到,腾讯慢了,在AI上面没有及时抓住一些机会。你觉得我们真的慢了吗?到底下半场是什么?


姚顺雨:感觉这应该是我问你的问题。


我觉得今天有两个重要的判断。第一个是我们认为AI是一个短期的游戏,还是个长期的游戏?因为在硅谷大家弥漫着很多情绪——两年后所有人都要失业了,AI就要取代所有人工作,应该赶快赚两轮钱就退休。


但很显然我们的判断是,这会是个长期游戏。AI才刚开始,从某种程度来说,下半场才刚开始。我不认为ChatGPT和Claude会是唯一的Super App,我觉得那会是个非常灰暗的世界。我觉得肯定会有源源不断的新的机会诞生,可能今天就像是七十年代PC刚刚产生的时候,还有很多很多事情需要做。


第二个判断是,未来会是更线性还是更多元的游戏?确实过去几年大家能看到的是pre-training、post-training、RL、Agent、Coding Agent,似乎有一个非常清晰的主线,这个主线就是所有人都在copy,坦白说就是所有人都在做一样的事情,这也是个非常灰暗的事情。那到底未来会变得更单一还是更多元?我个人看法是会变得更多元。


毫无疑问Coding Agent和生产力会变得更加重要,它是一个刚刚开始的事情,这个世界还有trillions of dollars的市场还没有被填满。但是多模态、具身智能,很多很多新的事情都在发生,或者刚刚发生。


所以从这个角度来说,如果我们认为下半场才刚开始,那可能确实不是晚。当然过去模型、产品做了很多探索,走了很多弯路,我觉得这是正常的——你如果没有做过一个事情,第一次做肯定还是会有曲折。


但我觉得可能更重要的事情是,能不能诚实地面对自己?能不能看到反馈就去改变?能不能保持耐心?我觉得这些事情可能是在下半场更加重要的事情。


汤道生:大家对腾讯经常喜欢挑某一个点来批评,当然我觉得我们也很欢迎大家给我们提更高的要求。我们还是一个非常多业态、很多产品在很多赛道的公司,同时也有很多团队在推进不同的项目。所以毫无疑问在这样一个复杂的组织里面,有些地方可能做得快了,有些地方做得慢了,有些地方可能会做失败、在探索。我觉得这些提醒都非常好,确实有些地方我们是可以做得更好。


但就像你说的,这是一个长跑,是一个马拉松。腾讯还是有非常丰富的场景,就像你一开始提到选择腾讯,因为AI需要context,模型需要很多上下文。腾讯在过去多年不同产品、不同赛道的积累,都可以针对每一个场景为模型提供有用的信息和context来发挥价值。


在这样一个长跑中,我相信模型会不断迭代,用户的需求也在不断变化,也会有新的产品形态出现。比如今年年初对龙虾这一波热潮,我们反应也比较快。


同时也有像WorkBuddy这样的智能体产品,其实也是几年前已经开始做的产品,沿着原来做CodeBuddy的路线,慢慢看到非程序员也有很强的需求,我们也能比较快地应对。


今天也听到很多客户对于我们不同产品怎么组合起来有非常高的期待。所以我们正在长跑中,也请各位多给我们提醒、多给我们建议,也多用我们的产品来给我们正向的、constructive的反馈。


汤道生:感谢顺雨今天的分享。我们刚才围绕做模型、做产品,谈到了Co-Design,谈到了Agent的演进,也提到了组织变革和行业机会。在过去一年,我们看到非常多企业有共同的困惑——产品如果用不好,企业不能持续投入,或者ROI不够,这都会影响AI在企业里面普及的进度。为此我们今天会发布一套效率智能体的工具集,帮助企业更安心、更高效地部署应用智能体。


这背后有腾讯三个核心能力:第一是场景连接的能力,把AI嵌入真实的业务流,跟用户、数据、生态深度连接。第二是工程的驾驭能力,通过完整的Harness体系让Agent稳定、可信、可持续运行,具备强大的AI Infra,包括高速网络、高吞吐存储和高性能Agent Runtime,保证GPU的高利用率。


第三是模型的驱动力,依托混元大模型和模型产品的Co-Design,兼顾实用性、性价比和ROI。同时我们也将启动腾讯AI共创营第二期,携手ISV、MSP伙伴,一起共创行业解决方案,打造更多标杆案例。


接下来我的同事将围绕这些内容做进一步分享。今天下午我们也将围绕个人提效、办公提效、企业提效等多个场景,设置产品技术、行业场景与生态共创的多个平行论坛,以及AI产品发布专场,把20多个新产品、新能力介绍给大家。


今天的对谈就到这里,谢谢顺雨,感谢大家。



文章来自于微信公众号 "腾讯科技",作者 "腾讯科技"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0