对腾讯汤道生时隔一年的独家专访:元宝重兵投入这半年

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
对腾讯汤道生时隔一年的独家专访:元宝重兵投入这半年
6244点击    2025-09-29 13:28


对腾讯汤道生时隔一年的独家专访:元宝重兵投入这半年


对腾讯汤道生时隔一年的独家专访:元宝重兵投入这半年


2024年12月底,正在休假的汤道生,在腾讯集团总办层提出了一个建议。


过去一年,他一直在思考一个问题:AI Chatbot市场正从技术底层研究,转向前线产品用户的争夺,腾讯元宝该如何拿下这场战役?


他了解到,马化腾和刘炽平正在为元宝物色合适的领军人。汤道生开始考虑,是否可以让CSIG(云与智慧产业事业群)来领衔这场战斗?


很快,这个想法得到其他总办成员的支持。


于是,在2025年春节前夕,腾讯最高层在人工智能战略上,做了两个极为关键的决策:


  • 第一,腾讯将旗下聊天机器人产品元宝从TEG(技术工程事业群)划归CSIG,由汤道生率领,这释放了一个信号:元宝将从技术驱动转向产品驱动;


  • 第二,就在DeepSeek声名大噪之际,元宝宣布接入满血版DeepSeek,从原本只依赖自研模型的产品策略,转向支持多模型的产品策略。


过去两年,腾讯高层鲜少对外分享人工智能战略。去年我曾访谈汤道生4小时,那时他还未执掌元宝,我发表文章《对话腾讯汤道生:AI不止于大模型》。时隔一年,汤道生完成从接手到整合,我们再次对话。


汤道生(Dowson Tong)是腾讯集团高级执行副总裁、CSIG总裁,总办成员之一。2005年从美回国加入腾讯,过去20年,他亲历了腾讯在社交、音乐、云服务等关键战场的多场战役。如今,他是腾讯在AI战场上的重要一员。


本次访谈中,汤道生详细复盘了过去半年围绕元宝的变阵、产品抉择和资源调配,To C和To B的协作,以及腾讯这家公司在人工智能变革中的一系列决策与思考。


对于腾讯,外界常说,它的稳固优势来自于独特的场景和丰富的生态。那么,面对全新的AI技术革命,这家曾凭借互联网、移动互联网两波技术浪潮跃升至5.9万亿港币市值的科技巨头,如今,是否有一丝危机感?


“当然有了!——很强的危机感。否则怎么会这么大的动作、投入这么多资源来发展元宝。”汤道生说,“危机来自于未知——你也不知道这一波会怎么改变用户的习惯,对于我们已有的业务有什么冲击。最好的应对方式就是:积极拥抱。”


他称:“我们要想办法,要不抓住新产品形态的机会,要不让已有产品能够演化成新的形态。”


以下是对汤道生的访谈全文。(作者做了语言优化。)


对腾讯汤道生时隔一年的独家专访:元宝重兵投入这半年


第一章 


调组织、接DeepSeek、资源整合,


腾讯元宝这半年


01 举手


张小珺:Dowson,过去一年从我们上次访谈到现在,在你眼中,整个AI市场有哪些是最重要的变量?腾讯在AI的动作上有哪些是最重要的变化?


汤道生:最大变化是国内大模型市场更集中了,开源成为国内各大模型的重要战略,比如DeepSeek横空出世。


对腾讯非常重要的变化是,很多产品服务从原来只基于混元,到变成开放整合多家大模型。


去年我们看到AI产品赛道起来了。年底我举手,跟TEG(腾讯技术工程事业群)再度搭配起来——他们更专注做混元大模型,CSIG(云与智慧产业事业群)承担前端产品责任,一起打仗。


这比较像我们做云服务,TEG和CSIG紧密合作,也是类似模式——我们在前端服务客户,他们在后端提供底层技术支持。


CSIG接了元宝后不久,马上遇到DeepSeek R1发布,当时大家对于DeepSeek App有强烈需求。但DeepSeek自己的App限制比较多。


我们借着这个机会,优先从用户需求出发,走出第一步,把Deepseek接入元宝——可能也是国内同类产品中,第一个全面拥抱第三方模型的案例。


张小珺:这里面谈到两个重要决策:第一个是你举手做元宝;第二个是元宝接入DeepSeek。这两个动作能不能详细复盘一下?


首先你为什么会举手?是在什么场景下举手?举手是一个什么机制?


汤道生:也不是什么机制。当时就是觉得市场在迅速变化,对CSIG也是难得的新赛道机会。


最早我们做混元大模型主要是技术上的探索,元宝是从技术团队孵化出来的,一开始没有把它当成一个产品业务来看待。有点像我们当年TEG做围棋AI绝艺,也是一个比较纯粹的技术项目,由TEG领衔比较合适。


但后来我们发现,AI Chatbot已经变成一个用户越来越依赖、越来越频繁使用的一个产品。因此,把元宝放在一个产品业务部门,由一个做产品的领军人带领,会更合适。


我知道,当时Pony(马化腾,腾讯集团执行董事、董事会主席兼CEO)、Martin(刘炽平,腾讯集团总裁)与卢山(腾讯集团高级执行副总裁、TEG总裁)正在公司内外物色合适的人带领元宝这个产品。


刚好CSIG有做To C产品的资源与经验,在一些关键技术上也有积累,是一个很好的机会,于是就去问问Pony、Martin与卢山的意见,结果他们听到也觉得是很好的建议。


CSIG与TEG本来在云的合作就很深,两边很有默契,在AIGC赛道再度联手也非常合适。


模型侧竞争压力越来越大,AI产品侧的投入也需要升级,我们在To B产品合作基础上再加To C产品,一起把这事儿往前推进,顺理成章。


我们选了原来负责腾讯会议的Lori Wu(吴祖榕)带领元宝,大家对他从0到1做产品比较有信心。


张小珺:这是几月份发生的事情?


汤道生:去年12月,当时我在休假,突然有这样一个念头。(笑)


前面一直有参与大模型的讨论,所以了解公司的一些思考。只是一开始,我没想会走到这么前,去做To C的AI产品矩阵。


混元大模型的To B落地,我们本来跟混元团队已有紧密合作,一起服务企业客户的需求。既然前后搭配的模式在To B可行,To C也可以啊——CSIG的定位也不是只做To B,我们也有很多拥有To C产品经验的同学。Lori最早就是做QQ的。


提出这个想法,听上去有点偶然(笑),实际上前期思考也不少。


张小珺:去年我们访谈的时候,你提到对于Chatbot产品有可能会演变为一个新的C端入口的一些思考。现在,你怎么看待元宝这场战役?


汤道生:我们强烈意识到这场AI Chatbot战役的重要性,希望元宝将会成为C端搜索信息的新入口。


但原来用户发起搜索的场景还蛮多的,我们还要想想如何让用户从原来的搜索场景过渡到元宝来。所以后来公司也把其他工具类产品,如浏览器、搜狗与输入法等转到CSIG来。


我们仍然相信场景的重要性,很多AI能力也会内嵌在原有的产品与用户场景中,比如微信与腾讯会议等。


张小珺:你怎么看待大模型和搜索的关系?


汤道生:在新一代的搜索服务,搜索跟大模型之间的联动非常重要——原来更多是你先搜到信息,再喂(feed)到模型去理解解读;现在大家更倾向由大模型理解意图,再针对性到网上找你需要的、最新与最权威可信的内容,然后再重新整理最终答案,这更像由智能体驱动(Agent-driven)的方式。


年初在DeepSeek R1发布的同时,大家也说2025年是Agent元年或Agent爆发之年。大家越来越意识到,模型的逻辑推理能力只是整个AI产品体系的一部分——当然是非常非常重要的一部分,而且你要让它能调用很多不同能力。


要在某个场景满足用户需求,有很多周边能力需要搭配,包括搜索能力、语音理解与生成、专业数据、服务生态等——腾讯本身在各种内容与服务生态有比较强的积累,对我们是一个有利的地方。


除了获得准确信息外,我们也发现针对不同场景,一句话怎么说出来也很有讲究——到底什么场景你希望一个EQ(情商)高的模型跟你聊天,什么时候需要犀利的观点,什么场景你需要一个IQ(智商)高的模型帮你解题?可能在不同场景、不同需求下,你都需要在产品与模型调优上有不同侧重。


我过去半年,对于AI产品、AI Chatbot的理解,比一年前深很多。


张小珺:听起来把这些AI产品划到CSIG,是一个还挺简单的过程。


汤道生:决策看起来简单,但也是深思熟虑的,另外执行起来不容易啊(笑):元宝要重新建立团队,引入很多大模型人才,Lori与Louis每周都在不停地面试;转过来CSIG的其他产品也需要转型,团队加班加点都是十分辛苦。


也不仅仅是To C的AI产品团队在忙活,还有混元、AI Infra、Agent平台与模型推理加速等团队,从春节到现在一直是频繁加班,高强度投入。


为了让更多用户能使用元宝,我们要持续提升大模型推理的性能,需要跟不同芯片厂商一起做深度优化。


产品与模型还有很多要补的短板。


02 Pony


张小珺:今年春节前的第二个决定是接入DeepSeek,这个决定在腾讯总办层面是怎么达成的?有犹豫吗?


汤道生:其实挺快的。一位朋友给Pony建议:元宝应该考虑接入DeepSeek。Pony就把这个想法扔进小群里讨论——用户对DeepSeek兴趣很高,如果元宝接入,应该对产品有很大拉动。


从产品发展角度,卢山很爽快就表达支持了。


一开始Lori还是反对的。毕竟他才接手元宝没多久,跟混元兄弟要长期合作,怕他们感受不太好。


但最终老板定了,大家就义无反顾地全力推进。


其实大家都能理解,只要元宝做大了,混元机会也更多。总办这么多年的合作,价值观非常一致,“以用户需求为本”,把产品做好最重要,没有什么争议。


张小珺:当时讨论的时间有多长?


汤道生:就两三天。


DeepSeek R1一发布,媒体很快就热起来,总办们各自看了很多分析报告,学习R1如何做到CoT长思维,如何只用数学题答案做强化学习等。我们在小群里一直有讨论,团队也第一时间就研究它。


大家都看得到,DeepSeek在全球带来很大的震撼,在1月底的一个周末持续发酵;到了周一,美国股市也有很大反应。这一切都让我们觉得风向要变,必须当机立断。


腾讯应该是国内最快动手的大厂——To B、To C多个产品接入DeepSeek,结果企业客户与用户侧反馈都很正面。


张小珺:接入之前,腾讯和DeepSeek高层之间有见面吗?


汤道生:有接触,但我不能说太多细节。


DeepSeek当时表示,他们最关注的是大模型的智能上限。他们的研究成果都是通过开源公布出来,所有人都能看见。


张小珺:有人说,腾讯这次接入DeepSeek真的是“毫无包袱”,其他公司可能还是有一点包袱的。


汤道生:包袱肯定也有(笑)。只是推动我们很快下这个结论,是用户有没有这个需求?——还是要结果导向,只要对产品的价值大于包袱的成本,就应该抛开包袱来做对的事儿。


张小珺:总结一下,这个决策的关键点来自于Pony发了一条群聊。


汤道生:可以这么说。


在海外,很多App比如Perplexity也是类似形态——支持多个模型。你给用户提供不同选择,让他们可以体验不同模型也挺好。


其实,大部分用户不关心模型是谁做的。


03 大整合


张小珺:把元宝从技术部门整合进业务部门,基于DeepSeek,你们随后做了哪些拓展?


汤道生:首先要感谢微信与PCG(平台与内容事业群)的支持。


大家也都看到,微信支持元宝的力度是前所未有的大,包括早期的广告位、新闻插件,还有视频号与公众号也可以被@元宝做点评。


当然不止微信,包括腾讯新闻、QQ、游戏、浏览器,还有输入法,都逐步在找一些合适的场景来跟元宝联动,代表了腾讯对于AI赛道的决心。我们会想出更多产品场景,让元宝来服务大家。


张小珺:让微信支持难吗?


汤道生:不难,微信多个团队都相当给力,一起探讨各种可能性。


张小珺:在微信里植入元宝这个决定是怎么做的?


汤道生:最早是元宝还没转到CSIG之前,我们已经有一个项目是在微信里面做元宝红包助手,这是春节前一个已经在筹备的项目。


但当时准备度不高,没能提供完整的问答,也不能逐字输出,所以最早的元宝红包助手,能力非常局限,只能给它发张图,让它生成个红包封面。不过,起码元宝作为一个类似微信用户的形态,在那时已经出来了。


后来微信团队也给了很多建议,开发了很多能力来支持元宝。比如,你在微信里转发一个文件去元宝账号,让它帮你总结;转发一些聊天消息,它帮你做一些分析。


社交与大模型的结合应该有很大想象空间,我们会持续探索与验证,有节奏地一步一步落实。


当然,我们落实微信新功能会非常谨慎,毕竟服务的用户群体很大,每个功能都是先灰度发布,测试用户喜欢才开放,不少功能因为灰度效果不好也会推翻重来。


张小珺:除了接入微信,回望2025年2月到现在,你们还做了哪些动作?


汤道生:在我们接元宝的时候,第一件事是搭建团队,因为原来TEG投入到元宝的人数很少,技能也不匹配。一开始,Lori转了好多腾讯会议的开发人员、产品同学去做元宝,加速了多个客户端的迭代。


更重要是招聘更多懂大模型的产品经理、搜索专家,还有模型后训练的研究人员,所以大家到现在还是每周不停面试,并借此了解行业情况。


在产品层面,我们一直在补能力,比如改善搜索服务的准确性与时效性,支持更多方言的语音识别,支持更精准的图片修改,改善性能加速吐字等。


CSIG内各团队都投入了很多资源来支持元宝,比如多个产品团队借调人力来加速功能研发,多个行业团队也引入行业伙伴资源,丰富了元宝的行业数据。


张小珺:听起来做了好多资源整合的事,其中最大挑战是什么?


汤道生:最挑战是当前要做的事太多了。


虽然今天元宝的状态跟半年前比,已经有很大进步,但仍然有很多改善的空间。


张小珺:你提到,搜索和大模型的联动非常重要——到底是先搜再交给模型做解读,还是模型先理解意图再去搜——这两种路径是分别适合不同场景,还是要做一个融合?


汤道生:非常好的问题。肯定是两种都有,需要大模型去判断。


毕竟大模型需要较长时间才能训出一个版本,所以模型自己回答不了近期的信息。对于有明确数据来源的实时查询,Agent可以通过MCP(模型上下文协议)来调用服务,包括一些财经、天气或者地图数据,外面都有很多已经MCP化的服务。


今天最广泛的公开信息来源是网页,加上微信的公众号与视频号,一些长尾的问题,肯定还需要结合搜索才能回答好。


我们还要持续花时间去提升搜索能力,包括哪些网站或数据来源更权威,怎么去平衡时效性、权威性,图片与视频的搜索如何更精准。


这实际上是一个挺复杂的话题。今天做搜索和十几年前做搜索完全不一样了,我们会充分利用AI、大模型的能力来帮我们挑选最可能的信息来源、最权威的网站内容,然后再用这些信息加入到排序逻辑里。


现在初步来看,这种AI原生(AI-native)的搜索引擎能力要比传统先爬回数据,基于某些方式粗排再精排的效果更好。


张小珺:大家一聊到腾讯会说,微信的数据是非常好的数据,元宝能用到微信的数据吗?这对训练模型或者做产品来说,能带来哪些帮助?


汤道生:元宝可以用到微信公众号、视频号这些公开的内容,这些都是能被搜索召回,然后通过模型理解再输出答案,也就是RAG(检索增强生成)。


但微信个人信息是不会被用在大语言模型训练的,对训练出更高智商也没有帮助。


大模型训练是一个把数据转化成智能的复杂过程,需要很多高质量、干净的知识内容,针对每个垂直领域做整理,解决版权问题,获得内容授权。后训练的强化学习需要有明确答案的高难度题目,往往需要针对性去设计与采购,这些肯定都没法从微信获得。


张小珺:你接手元宝的时间点,是外界普遍不太看好元宝的时候,你是出于什么考量决定主动请缨?——有的人会担心,搞砸了容易“背锅”。


汤道生:这事儿对于公司重要啊。


对,我们担心,我们也怕。(笑)——既担心背锅,也怕辜负了信任。


这很正常,但不代表不去尝试。起码我是这么想的。


第二章


这是集全集团、


继移动互联网后的关键战役


04 军令状透传


张小珺:你接过元宝,有给Pony、Martin立过什么军令状吗?


汤道生:就要做好啊!


张小珺:有非常严肃的谈话没有?


汤道生:有。他们期望还挺高的。所以压力也很大。


这个我就不说得这么具体了,免得给团队太大压力。(笑)


但起码,未来两年,大众会越来越多拥抱AI Chatbot这个工具,满足他们日常生活各种各样的需求——有些可能以前是通过搜索引擎满足,有些可能是一些新需求,突然发现AI工具也能帮它解答。


在这么关键的窗口期,友商在不断推进,在增长;我们也在推进,也在增长。我觉得能够在这个时间窗里,建立起用户心智,找到符合腾讯生态的一些场景,来打造比较有腾讯特色的产品——这是未来两年关键任务,必须要做到。


张小珺:你不想说Pony、Martin给你下过什么军令状,那你对团队呢?


汤道生:Pony、Martin 的要求都是透传好几层的(笑)。所以,我也不需要再去加码。


不过,更重要是他们提了很多拉动元宝的想法,给了很多资源,推动了很多跨产品的合作。


我更多是和Lori一起想想:这场仗怎么打?产品要怎么做?要建设什么能力?


我平时跟Lori的沟通,很少去强调要达成什么KPI,不是只提要求。我更希望站在一起,看产品哪些地方可以改进?需要什么资源?如何调动BG(事业群)内不同团队的资源给元宝做支持?团队间如何分工?


做产品的思路离不开聪明的选择。在一大堆需求里,到底该选择优先做什么?如何发挥腾讯独特优势?有什么不该去做?


张小珺:元宝在产品层面的决策是通过什么机制发生的,比如例会制?


汤道生:我没有特别跟团队开例会。他们已经有太多、太多需求要去接,要去实现,做不同尝试。我不想过于机械化用例会来检查工作,更不想占用他们过多时间去准备汇报材料。


其实,产品随时都能体验,信息可以在微信随时同步。日报数据我肯定会看,看到异常也会在微信里问个究竟。


大家基本有些共识,如果有设计稿或新思路,就发到群里看一看,如果没有太大问题,团队就按计划执行了。起码在元宝项目上,我尽量给团队更多自由度,不想有太多形式化的内耗。


张小珺:为什么元宝特殊?


汤道生:也不是对元宝特殊。To C产品的决策与执行就比较闭环,产品怎么做,团队基本说得算。


新版本出来,有新功能,我去用就好了——通过用起来,感受有没有进步,有哪些盲点,有哪些问题要解决?我及时反馈就好了。


当我们明确了产品的方向,接着就是持续打磨和优化。元宝要做的事也挺清楚,有很多短板要补,要时间一步步迭代。


比如,语音交互是产品的基础,必须做好。当我们发现粤语夹杂英文的识别不准确,有用户反馈方言的理解不好,团队就会排查问题,解决了我们就再去测试。


对比来说,To B业务需要很多团队协作,才能把产品卖到客户去,而且需要许多管理规则引导团队做什么、不能做什么,销售团队间还有很多协调与分工。这些都不需要在元宝管理上体现。


张小珺:元宝是你目前管的所有业务里,唯一一个不用和你开例会的业务线吗?


汤道生:也不仅仅是元宝,我好像比较少定期开产品例会。To C与To B的产品都没有。虽然每天都蛮多会议,但基本都是由事情驱动,而不是定期要汇报工作那种。


估计团队自己都有例会吧,只是我较少用例会方式去了解产品业务。每个负责人有自己的管理风格,会选择自己认为最高效的方式。


对我来说,要了解产品运营情况,最好直接看报表。C端产品,就直接使用找感觉。B端产品,就多听客户反馈。最重要是保证有多个反馈问题的机制,需要讨论就拉群讨论,需要决策就开会决策。


张小珺:骂人吗?


汤道生:还没骂过元宝团队,哈哈哈,云产品被骂的多一些。


张小珺:现在AI公司(如OpenAI)的管理,更强调自下而上、扁平化管理。在一个大型组织里做AI产品,是否需要为它专门设计组织架构,甚至调整考核方式?——比如元宝这个产品该怎么考核,还是用DAU(日活)吗?


汤道生:不仅仅是DAU,要细化到每个功能有多少人使用。还有主观可以感受到的产品体验,比如答案准不准确,大家觉得好不好用。


我对组织架构设计与人员安排,一向比较重视效率,专业的事给专业的人做,决策能闭环就尽量闭环。如果两个团队做着差不多的事,那就一个经理两边管,自然就会拉通资源,避免重复建设。


我们也发现,行业里做AI产品的,很多都是毕业3-5年的年轻人,他们敢想、敢拼、敢试错。现在元宝团队也有特别多这类年轻人,他们正在主导元宝未来的发展。


今天AI产品可以尝试的方向比较多——虽然我很关注模型技术与AI产品的最新发展,但也时刻提醒自己不要装懂扮专家,必须给团队多一点空间与信任。希望组织更扁平,有更多从下而上的创新。


张小珺:对了,元宝为什么叫元宝?


汤道生:我们做的模型叫“混元”,就选择了“元”的命名体系,后来基于大模型的产品都有“元”字——“元宝”、“元器”,都是这样来的。


张小珺:混元为什么叫混元?


汤道生:当时负责模型的团队,觉得这个名字比较酷——开天辟地的一个状态。


05 元宝的人格


张小珺:现在的Chatbot产品虽然都是类似的对话形态,但不同的Chatbot产品承载了不一样的“人格”或者“模格”,元宝的“模格”是怎样的?


汤道生:我们觉得元宝在不同场景,可以有不同"模格"。就像人们在办公环境下说话会更正经,在生活环境下说话可以更放松。


有一个朋友曾经在你的播客中说过,她觉得微信里的元宝更人性化,语气相对更调皮一些,包括视频号评论里的元宝也比较有态度。我们的确对微信里的元宝做过不同微调实验。


昨天晚上,跟一个行业朋友聊起,他的感受是:Deepseek R1逻辑性很强,元宝接入DeepSeek,呈现一种专业的助手定位。他会觉得对于一些要求比较高,比如解读体检报告,就会找元宝解读。但有一些更生活、随意轻松的场景,他会选择友商的产品。


当然我不太认同他后面那半句,腾讯是国内内容生态最丰富的互联网企业,包括各种娱乐内容都很多的,公众号上有各种生活知识。大家想要什么游戏攻略,或者想了解最近周末的电影票房,我相信元宝都能给你满意的答案。


不过,相对来说,元宝好像有较多高知用户。


张小珺:这不是主动选的对吗?


汤道生:也不能说是主动选的。我们希望最终所有人都能用上AI,做到智能平权。


今天对于各类AI产品,拥抱最积极或体验意愿最高的,可能是年轻一代。他们每天都有各种学习任务,AI能耐心解惑,并随时陪伴。


从我们启动项目的第一天,Martin就明确说:元宝要服务好年轻用户。


张小珺:哪个年龄层的用户?


汤道生:都要服务。总之,积极去使用AI产品的人群,不限年龄。


我身边就有不少行业朋友与专业人士每天都在用,我岳母也经常用元宝来解答各种生活所需,元宝也成为了她的健康咨询师。毫无疑问,学生人群对于用AI工具去解题与学习都有很强的需求。我们也得把这些需求作为重点去满足。


张小珺:微信里的元宝和作为App的元宝,他们的“模格”有所不同吗?


汤道生:可能会不一样。我们也在尝试,到底要保持一致,还是有意区分,还没有定论。


今天大家如果用微信上的元宝,感觉回答更风趣一点,或者更轻松一点。在App,元宝的定位是解答用户疑问,回答会更正式一些。它被训练出来的说话风格、语气,是更针对性去解决问题的口吻。大家也可以下载体验一下不同的AI交互风格。


张小珺:总办其他人有对于元宝的“模格”有提过什么想法没有?——因为现在这些大模型产品都是“造人”,你们想造一个什么样的人?呈现怎样的产品观?


汤道生:我知道Lori与产品团队有更多这方面的思考与讨论,在不同场景会试一下不同模型风格。比如,在微信里的元宝应该更拟人,也许更符合微信用户对于元宝的期望。


张小珺:你给微信元宝发消息,它会显示:正在输入中。


汤道生:哦,这个是一个体验设计的话题。因为原来微信聊天窗口,不是为LLM(大语言模型)设计的,所以不支持流式输出,不能一个字一个字显示出来,所以每次回复要等待LLM输出完整信息后,才能一次性发出来。


对缺乏耐心的互联网用户,这样等待的确体验不太友好。为了让用户起码知道AI在整理答复中,所以会显示“正在输入中”,消解一下用户等待的焦虑。


当然这还不是最理想的体验,希望在后面能找到一个更好的解决方案。


张小珺:理想的交互体验应该是什么样?比如说,当Chatbot在微信里面?


汤道生:如果回答是一个字、一个字吐出来,像在App那样,用户能边读边感觉它在“动”,不需要一直等它一下发很长的一大段话。


这种Predict the Next Word(预测下一个词元)的服务模式,天然需要较长处理时间才能完整输出,所以需要像流媒体一样的交互体验,逐字显示给用户才能减少用户等待的不耐烦,或者把它转成语音——语音本身也是一个字、一个字说,有时间延长的感觉。


对于缺乏耐心的互联网用户,等待是很要命。最近也发现,误打开深度思考的新用户往往留存率会偏低一点。我自己平时用元宝搜索也不打开深度思考,觉得有点浪费了tokens,也耽误时间。


但到底微信里的元宝该有什么体验?什么叫更拟人?可能也要看场景。


如果场景的定位是工具,比如在搜一搜,那应该用事实认真解答你的问题;但如果是聊天对象的定位,也许你想这个元宝更有趣一点——比如有时你问它问题,它可能不直接回答,甚至反问你,或者开玩笑“我就不回答,今天心情不好”。


今天到底微信元宝该用什么方式来跟用户互动?还没有结论,我们还在尝试不同方式。不管怎样,肯定有些用户会喜欢,有些会不满意,每个人的期望不一样。


张小珺:有没有觉得微信里的元宝比较“舔狗”?


汤道生:哈哈哈哈哈哈,这是梦秋(清流资本创始合伙人)说的,我好像也听到了。


有一个阶段我们在尝试这种表达方式、语气,但后来我们听到一些反馈,把那种风格调低了一点。


现在我们还没有足够积累,去把个性化做到位。模型本身现在没有个性化,要在模型之外搭建Agent,支持记忆、个性化能力,这些我们在建设中。所以不是这么容易让用户自己选择风格——更调侃,还是更“舔狗”一点。


张小珺:未来应该是个性化的?


汤道生:我们肯定希望走向个性化。


张小珺:针对不同风格,会做实验吗?


汤道生:用AB test(AB测试)做实验——基于不同测试用户组合,给予不同体验,然后看各测试用户组的数据表现,比如留存率、转化率等。


今天很多互联网产品都会对新功能的不同表现做实验,用数据来辅助决策,AI驱动的交互方式灵活性更高,有更多实验空间。


我们都在鼓励不同产品多用AI探索新体验,也要用AI提升工作效率。多实验,多验证。


06 Chatbot也许不是大一统的


张小珺:Chatbot产品的终局,会成为微信那样的形态吗?只留下一家。


汤道生:应该不会。


张小珺:现在Chatbot都会逐渐Agent化。这场仗的终局会是怎样的?


汤道生:肯定是不断Agent化。模型以外,还需要集成各种不同的服务。


我不认为会像微信一样的格局,微信建立在社交基础上,具有很强的网络效应。


但AI Chatbot仍然以服务个人为主,对于这类型的产品,每个人都可以有不同选择:有些人可能喜欢用元宝,有些人可能喜欢在微信用元宝。不同AI Chatbot可以选择不同的产品定位,在市场中找到目标用户。


张小珺:所以它还是会是一个更分散的市场。


汤道生:我猜是吧。


张小珺:那这个生意没有微信好啊。


汤道生:即时通讯的商业模式比较独特,全球市场也没有像微信一样的可以参考,你在互联网也不好找到第二个。(笑)


张小珺:元宝基于现在的产品形态,未来会怎么演变?有哪些是已经可以看见的?


汤道生:目前海外AI聊天机器人产品的迭代速度挺快,不仅模型能力在提升,在模型以外怎么去构建把不同能力整合到一起,很多时候也走在前面。


当然,国内发展并不是简单照搬,更多是围绕用户的需求迭代,会长出一些不一样的能力。毕竟,国内用户的使用习惯和西方用户还是有很大差异。


今天这个产品形态在过去两年,变化并不大,基本框架以对话为主。目前我还没有看到对话以外,非常不一样的交互方式——至少在这个赛道内,对话依然是核心。


但这并不意味着没有其他产品形态或新App的机会。比如,ima并不完全依赖对话,更强调知识库管理,侧重文档整理与总结这类工作。


我相信,基于大模型的应用,未来会涌现不同产品形态,不同玩家也会有自己的侧重选择。


张小珺:现在争夺AI Chatbot这个产品,在争夺的是什么?有观点说,是新时代的操作系统?


汤道生:取决于你怎么定义操作系统。如果你把操作系统定义成,你访问所有系统资源的入口,比如你要读写硬盘、连接网络,需要通过它与硬件打交道。这个定义下,AI可以看作“生活上的操作系统”。无论是查询不同类型的信息、语音互动,还是订机票,你都可以通过它接入各种生活服务和资源——它充当帮你获取服务或资源的媒介,是“泛义的操作系统”。


但你也可以说,它是一种新物种,因为它的能力比传统操作系统更全面。比如,传统操作系统,你要写一个文件,它就只写一个文件;但AI Chatbot可以接受一个目标,自主分解任务,并通过协调不同服务和资源来完成它。


所以,AI比我们通常理解的操作系统更智能、更强大。


张小珺:在你看来,AI时代的产品范式发生变化没有?——互联网和移动互联网的核心在于“连接”,构建“平台”,AI呢?


汤道生:我当前感受到的变化:更多是在已有场景已有需求上,用效率更高、更少费力的方式去满足,但它好像还没有创造出新的连接。


这一点和移动、PC互联网带来的变化不太一样。移动互联网,因为智能手机与随身摄像头的普及,出现了移动支付、实时定位、线上打车等全新的服务场景——这些在PC时代根本不存在、手机时代才存在的新的需求或新的服务场景。


我今天看到的,更多是在已有的场景,通过AI让你使用的一些服务,没这么费力,或者更高效帮你完成复杂任务。但那些任务本来也存在,本来你也可以多花点时间用不同App手动去完成。


张小珺:提高了效率,但没有创造新的连接。


汤道生:可能在系统与系统之间——比如Agent与Agent、模型与服务之间——有新的连接方式。


人和人的连接已经有了,人与服务的连接也存在。它没有创造新的人与人的连接或者新的服务。它是在已有服务里,把它做得更智能或连接得更好。


张小珺:如果往后推演一步,创造了这种“非人与人之间”的连接,会带来什么?


汤道生:大家都说,以后互联网不是为人来打造,是为Agent打造。我觉得也成立。


对比互联网,很多内容是为Web Browser(网页浏览器)打造——可以简单认为,协议是HTTP和HTML。但浏览器把网页图文与视频渲染在屏幕上,还是给人的眼睛去阅读。


在AI时代,浏览器也许变成了Chatbot,鼠标交互也变成文字交流或语音互动,人们只管提出想法,Agent就通过另外一套协议(比如MCP)来访问多个服务,所以有些专家说,未来互联网内容也许都是给Agent看的,不是被用户直接去消费的。


如果有一天,你只向Agent提需求,只通过它去了解世界,它自然知道怎么规划,如果做什么无法想象的范式——说实话,大家挺害怕。


今天很多AI大咖,比如Hinton(辛顿)等,也很担心:如果有一天某些程序生成自己的欲望和需求,那将会非常可怕。大家都不太愿意朝那个方向发展。


张小珺:需要防止、抑制?


汤道生:现在应该没有谁,不是基于人的需求来做AI研发。如果没有人做这个,专门让它无端去生成需求、按照自己的欲望行动,根本就没有这个起点。


计算也要成本。


如果不是为人去服务,为人去满足某些需求,谁对这个成本买单?


07 解耦


张小珺:在争夺人工智能的人才上,Meta正在以高签约费挖人,腾讯会跟进吗?


汤道生:大模型的竞争,就是人才的竞争,必须积极争取。


张小珺:我自己感觉在国内,前两年字节、阿里挖AI人才更激进一点,为什么腾讯挖人不激进?


汤道生:之前投入的确不够,今年也意识到问题。


在AI人才吸引上,尤其在大模型研究领域,加大了招聘力度,总办们也亲自下场,吸引最顶尖的AI人才;我们也做了一些组织变革,推动更扁平化的管理,给有想法的年轻人有更大的发挥空间。


张小珺:一个大模型公司的人说,他们是研究员和产品经理一起工作,一起在定义产品走向,所以他们很疑惑:腾讯把大模型的产品和技术研发放在两个大部门,会不会影响智能驱动产品?


从底层逻辑看,他们认为在AI时代,产品开发方式更偏向智能驱动,而不是传统的产品驱动。


汤道生:产品与研究还是有不同侧重。


AI产品肯定强依赖模型能力,所以两边仍然在紧密合作,产品功能完善与模型能力提升还是可以并行推进。但模型研究又不该局限在产品需求上。因此,对模型团队要求会更高一些,一方面要支持产品迭代,另一方面要推动模型创新的研究。


另外,产品侧也需要做蛮多模型后训练的工作,针对产品需求微调模型,做系统提词工程,这些最好能独立进行——如果产品与模型间能建立比较清晰的边界,节奏上可以有一定解耦,双方都可以跑得更快一些。


张小珺:解耦?


汤道生:就是指元宝和混元的合作方式。混元可以持续按自己的节奏迭代模型版本,每个模型版本也会实现一些元宝需要的能力;元宝可以基于混元的稳定版本做产品的工作,定期升级混元的新模型版本。


我相信行业都在探索不同的组织方式,当前还没有绝对的答案。


张小珺:在bet(下赌注)智能还是bet产品上,腾讯是bet产品?


汤道生:两个都重要,我们两个团队都在加大投入,努力提升。


元宝做大,有利于混元找到深入发挥的场景;混元实力不断增强,是元宝提升产品体验的基础。


张小珺:你认可大模型公司关于“模型即产品”的产品观吗?你看,DeepSeek的出圈是因为模型能力的质的飞跃,而不是产品功能上的优化。


汤道生:是也不是(Yes and No)。


模型肯定是AI Chatbot里最重要的能力,但要App提供完整体验,仍然需要友好的用户交互界面,在模型与用户之间交换信息,包括收发图文、语音或者视频。


随着产品越来越Agent化,需要整合多个模型,满足不同需求,需要能调用不同工具,执行不同任务——这些工具可能是搜索服务,可能是用来执行临时生成代码的沙箱,也可能是通过MCP协议调用的地图数据服务。


所以我仍然觉得,模型是产品的“脑袋”,但它仍然需要有“身体”和“四肢”,去做一些有用的事情,或者去改变模型外的真实世界。


张小珺:优秀的AI产品经理会是怎样的?


汤道生:元宝要招聘的产品经理,和以前确实不太一样——Lori比较喜欢用“AI策略产品经理”这个词。


他们要懂得模型能力的边界,懂得如何引导模型给出产品想要的结果。模型产品与传统应用还是有很多不同之处,如何进行需求设计,如何评测效果,如何平衡不同目标之间相互影响,需要新思维方式,积累一些新技能。


这些和我们以前做的社交类、工具类产品差异比较大,但可能比较像做搜索服务。因为搜索也涉及很多垂直领域的信息整理,对内容理解与排序,它只有一个输入框——你可以随便问,但结果却可以千差万别,没有绝对标准,质量难以评测。


所以,我们也在积极引进懂搜索的人才。


张小珺:对于腾讯来说,Chatbot之战是一场什么样的仗?


汤道生:这是集全集团的、继移动互联网后,一场非常关键的战役。


张小珺:这场战役可以堪比历史上的哪一场战役?


汤道生:移动互联网。


当年Pony不是说,希望能拿到移动互联网的船票?——我们也希望拿到AI时代的船票。


张小珺:元宝要去拿AI的船票,现在拿到了吗?什么是拿到的标准?


汤道生:这是一场长跑,比赛才刚刚开始。大家在身位上还没有拉开差距,未来还有很多可能性。


当大家每天都在用,你就知道我们拿到船票了。


张小珺:你怎么看待,你在这场战役中的位置?


汤道生:在AI赛道中有很多的赛手,我们就是其中一个。


第三章


大家不要只关注元宝,


AI在To B也是一个激烈战场


08 聚焦做好平台


张小珺:你现在花在To B(面向企业)和To C(面向消费者)上的时间分别是多少?


汤道生:一半一半。


主观意愿上,我希望更多投入到To C产品,尤其元宝;但CSIG的主营业务是云,我肯定也要保证这To B业务抓住AI浪潮带来的增长机会。


如果业务在顺利发展,我就不需要投入太多精力;但一旦在某些环节卡住,需要我去协调,我就必须及时介入,确保业务顺利推进。


张小珺:你怎么看黄仁勋说:软件正在吞噬世界,AI正在吞噬软件。


汤道生:就一个说法吧,AI也是软件的一种。很多应用软件会被AI改造,AI也在生成更多软件。


张小珺:在你看来,AI如何改变了To B市场?


汤道生:AI在To B也是个激烈战场。国内头部云厂商基本都是大模型的头部玩家,就算大模型服务不赚钱,也可以靠配套的云服务来赚钱。To B的AI市场基本上就是云市场的一部分了。


广泛的AI算力需求带动了各家云厂商的收入增长提速,这趋势也在国内外云厂商最新财报中体现。GPU算力准备充足的云厂商,在这轮AI浪潮中获得了更多市场份额。除了GPU算力外,AI应用也同时推动了存储与通用计算消耗的增长,对云厂商是多重利好。


在企业侧,大家普遍更关注模型应用的落地,如何实现业务降本增效。企业大多会结合具体业务场景打造智能体,要不提升用户体验,要不提升员工的生产力。


国内的开源大模型,选择多,能力强,更新迭代快,已经成为许多企业搭建智能体的首选。搭建智能体的工具选择也很多,有开源的,也有成熟的商业版,因为竞争极度激烈,很多项目都是亏损与补贴来做——有点像当年各大厂商抢大集成项目的状况。


张小珺:面向C端和面向B端做智能体,做法有什么不一样吗?


汤道生:首先有很多相似之处,需要的技术能力都差不多。本质都是用大模型去做规划,通过Agent调用不同工具去执行计划。在执行过程中,Agent通过访问数据库,或者访问网页,基于获得的信息,继续执行下一步,直到达成目标。


当然也有差异的地方:在To C侧做智能体,产品团队要自己设计好场景,打造应用产品服务用户,所有人都能使用,产品可以持续迭代,体验好坏用户用脚投票。


但在To B端,我们提供智能体开发平台等工具,客户需要选择场景,导入企业的数据与文档,由客户来打造的智能体,要不服务员工,要不服务客户。对我们来说,最重要是交付成功,客户付款。


不过,C和B的边界有时候也不太清楚。比如AI Coding(编程)是一个面向程序员的应用场景。虽然程序员是个体,但他们工作是为了企业。你说程序员提效工具是属于To B还是To C呢?——表面上服务个人开发者,但最终很多时候是由企业来买单。


张小珺:在To B的场景里,有没有一些比较看好的场景?有一些客户案例可以分享?


汤道生:很多企业最愿意花钱在营销。


腾讯云的营销自动化产品“企点营销云”已服务很多零售客户,以前基于通用大数据模式,结合线上线下用户行为,建立用户画像,从新用户到首次购买、复购,再到会员的整个流程优化。我相信随着更多企业用智能体给营销加持,这类营销场景有大的提升空间。


最近我们帮一个连锁零售客户——绝味食品——做了一个营销增收项目。项目中,我们用了多个Agent来提升营销管线的不同环境,最终结果让所有人都很惊讶。对比专家组,效果达到了3倍的提升。


张小珺:像这样的场景,容易标准化或泛化到其他客户或行业吗?


汤道生:我相信是可以泛化的。不同行业的在线营销流程与目标,其实差异不大,基本上还是要积累用户数据,对用户浏览与购买商品行为建模。目标是提升交易转化率,提高用户的购买频率。


当然,一般营销场景也会随着时间出现效果递减,这很正常。如果把当次活动的转化率从1%提升到3%,下一次触达同样用户时,潜在需求可能已被上次活动所满足了。所以对营销效果的衡量,每次都需要有对照组,设定实验的基线。


在最近腾讯财报中,我们可以看到广告收入增长明显,这也是得益于LLM带来的匹配能力提升。


张小珺:你既管To C也管To B,你觉得Agent落地是C端快还是B端快?


汤道生:对一般新技术来说,C端的接受程度与普及会更快;To B产品涉及审批环节多,决策逻辑复杂,企业内要分析清楚需求,对齐目标,留下预算,就需要更长时间。


过去两年,我们有很多To B智能体项目的实践经验,比如用RAG模式搭建客服系统,过程中往往发现很多企业内部数据混乱,需要企业先投入做数据治理。如果内部文档有矛盾,就必须梳理清楚,定义好不同信息来源的权威性;如果文档有新、老版本,召回逻辑必须考虑时效性。在企业场景下,数据治理是比较耗时的工作。


也有一些To B项目目标太激进,原以为可以用万能的AI立即替代人。后来才发现AI还不能100%达到要求,最终还是把人和机器结合起来,才能得到最佳效果。


张小珺:今年你们也把大模型知识引擎升级成了腾讯智能体开发平台(ADP),这个决策是基于怎样的业务逻辑?


汤道生:两年前大家做大模型应用,很多时候是基于大模型+RAG框架,搭配上大量承载着企业知识的文档,把文档切片存到向量数据库,然后基于用户提的prompt召回相关文档片段,最终给到大模型去输出答案。因为这模式基本是挖掘业务文档中的知识,所以当时我们把产品定位在知识引擎。


这种简单地提取文档片段回答问题的模式,短板也比较明显,不能完全满足客户的需求。


因此,客户需要大模型与智能体都进一步升级,包括大模型要有更强的规划复杂任务与调用服务的能力,还有智能体也要能更好遵循业务流程,并结合知识图谱扩展相关的信息与context。


随着今年许多大模型对智能体的支持不断增强,我们也把知识引擎升级成智能体开发平台,加强了工作流编排、行业知识图谱的支持,让新一代的企业智能体更好满足业务的流程与合规要求,进一步减少幻觉的出现。


最近发布的腾讯云智能体开发平台3.0,支持超过140个MCP插件服务,大大扩展了智能体能调用的工具能力,并支持多智能体并行协作,让智能体搭建可以更简单、更模块化。


张小珺:腾讯和其他公司推出的产品有什么差异化,包括字节、百度、阿里?


汤道生:大家都在迭代智能应用与开发工具,估计表面功能上差异不会太大。


从客户反馈中,他们比较看重腾讯云智能产品的实用性,较多考虑到项目执行中要解决的实际问题。


举一个例子,某客户有很多文档要入库,文档格式各种各样,整理起来特别麻烦。客户在实战过程中发现,腾讯云智能的文档内容理解能力强,支持格式多,优势特别明显;比如一个跨好几页的表格,怎么理解成一个表而不是多个表;或者两三行文字里夹杂插图,怎么准确识别文字编排的格式,并把相关片段和图关联起来。这都是我们过去为大量客户项目落地所积累的技术与经验。


客户还要把海量的内部资料有条理地管理起来,包括文档、音视频、各类报表等内容都可以一键上传。准确的OCR识别和内容理解,更是后续文档片段准确召回的关键。


很多时候,智能体回答问题不准确,或者出现幻觉,归根究底是因为前期的文档切片与理解做得不到位。


张小珺:Agent有很多长尾场景,也需要多轮的工具调用,哪些是腾讯一定要抓在手里自己做的,哪些是可以交给生态伙伴的?


汤道生:首先,在To B侧,我们做的是开发工具:智能体开发平台(ADP),与广泛的生态伙伴都有蛮多合作。最近我们跟很多渠道伙伴进行ADP的培训,不久后已经有好几个伙伴找到可落地的客户。


有些客户想法很多,需要专业团队做定制开发,我们会拉上合作伙伴如集成商、服务商给客户做POC,一起打单。我们聚焦做好平台,不断完善平台能力,让交付变得更简单,支持生态伙伴做好最后一公里服务。


至于To C产品的Agents,我觉得很多会出现在已有产品中,针对具体场景来服务用户。比如QQ浏览器就把原来已有的文档处理能力,通过文档智能体让用户更容易使用,降低各种文档格式转换的门槛。比如腾讯会议的AI纪要,或者元宝托管开会,都是结合会议场景的智能体。


同时,外面也有很多通用Agent的企业,和我们聚焦的场景并不重合,大家都有很大发展空间发展。我们很多业务的MCP服务,比如地图与支付,都是对外开放的,欢迎外部的智能体调用。


元宝的架构也在迭代,越来越多通过Agent能力来处理复杂问题,长期跟通用Agent的边界会越来越清晰。


张小珺:这可能是创业公司的机会?


汤道生:很多做通用Agent的创业公司,当前都在做海外市场,这是很好的机会,海外用户付费意愿更高。


不过,当前元宝没有计划出海,我们还是先聚焦服务好国内用户。


张小珺:能不能站在巨头的角度给创业者一些建议——他们大概率在什么赛道、什么行业不会被巨头围剿?怎么避开跟巨头的竞争?


汤道生:创业公司很难避开巨头。


大厂一般会盯着大赛道,不能放过大机会。有些创业公司也想做大赛道,成为下一代的平台公司;有些创业公司想在大厂周边找机会,成为大厂生态的一部分。我觉得两种逻辑都没问题,这是创业者的一个选择。


当然,大机会往往需要资本较多,跟大厂拼资本确实挺难的,尤其很多大厂都喜欢补贴、不惜成本去抢市场,创业公司却要不断融资来竞争,很难坚持。


相对来说,在大厂生态找机会可能是更好走的路。比如,在To B领域,腾讯云聚焦做平台产品,把耗人力的服务交给合作伙伴,让他们更贴近客户、长期服务共同客户。腾讯云持续扩大伙伴生态,受惠的伙伴很多都是创业公司。这些创业公司,经历5-10年的积累,不少年收入已经过10亿,每年伴随平台稳健增长。


To C市场也一样。在短视频赛道上,虽然抖音选择做平台,但有更多创业者选择在短视频平台上当大V主播,有很多成功案例。


还有前面提到的,有不少创业团队都在做海外市场,这里也有很多大厂顾不上的机会。


张小珺:针对企业客户,你目前看到还有哪些趋势值得关注?


汤道生:大数据市场仍然高速增长,值得关注。


大数据增长有三个驱动因素:


首先是湖仓一体:随着数据不断增加,原来数据湖沉淀各种数据,加数仓满足日常分析报表需求,管理成本太高。今天更多客户采用云原生的湖仓一体,数据处理更灵活,性价比与效率更高。


第二是大数据+ML(Machine Learning,机器学习)融合:越来越多客户要求在大数据平台上做更多ML的操作,比如做自动化的特征提取、模型训练与部署等,减少人工数据治理的工作。


第三个趋势是大数据+LLM/Agent:BI Agent(商业智能智能体)能主动为业务做数据分析,实现流程自动化与智能洞察,以此提升问数与决策效率,降低做数据科学的门槛。


09 危机来自于未知


张小珺:Dowson,你现在的驱动力是什么?——你也可以退休,为什么还要给自己揽一个这么大的活?


汤道生:那是很难得的机会。我的驱动是,想做有意义的事情(do something that matters)。


我本身热爱科技,喜欢学习。过去在互联网发展中收获了很多,也很享受把一件事做到从零到一,一到十,十到一百的过程。所以,我希望在新机遇到来的时候,能与身边小伙伴一起努力去抓住它——如果能做出市场认可的成绩,肯定会很有成就感,也挺有意义。


在我们今天身处的时代,我相信中国的科技企业在全球市场会迎来了黄金期,腾讯到底可以扮演什么角色?——我们心里有一些目标。


期待在未来10年,我们能把这些目标一一实现,并见证腾讯在全球市场也成为受尊敬与有影响力的科技企业。


张小珺:AI时代会有一个新的腾讯吗?


汤道生:每天都有一个新的腾讯。


张小珺:在你看来,AI时代的机会,会比互联网和移动互联网大还是小?


汤道生:毫无疑问,AI是大家共同看好的方向和赛道,但这个比赛才刚刚开始,腾讯有非常好的积累能够在这场比赛中发挥优势,但影响因素也很多。


比如,如果用户都不愿意付费或行业竞争太激烈,企业与厂商投入的的AI服务短期没法盈利,它的商业价值就不如移动互联网。反之,如果在某个时间点我们找到好的商业模式,能够可持续做投入跟产出的话,市场机会也许更大——这类预测意义不大,只能走一步看一步。


因为即便说“机会很大”,也不代表这就是你的。有这么多细分市场,产业链里有这么多玩家,到底谁分多一点,谁分少一点,都是动态影响、动态变化的。


今天你如果看上下游,海外芯片厂商的利润最多,云厂商利润也不错,国内就没这么好。同样的角色在不同市场,能抓住的商业价值也不一定等同。


张小珺:现在腾讯总办开会,百分之多少是在聊AI?


汤道生:非常多AI相关的议题,超过50%。


张小珺:最近你们讨论了哪些关于AI的重要话题?


汤道生:什么都会谈,行业动态、人才、算力、数据,甚至算法。


有太多要学习,比如大模型训练、强化学习、推理加速、智能体、多模态、行业数据等。


我们关注海外AI技术发展的动态,也关注AIGC在各团队的使用情况,以及带来的效益。


张小珺:微信是人和人连接,有可能在人工智能时代人和人的连接切入一个全新的系统里吗?有这种可能性吗?


汤道生:我们要想办法,要不抓住新产品形态的机会,要不让已有产品能够演化成新的形态。


张小珺:所以是有这种可能性的是吗?


汤道生:0.1也是可能性。


我不知道终极的形态会怎么样,没法评估概率有多大。但这种可能性肯定存在。


张小珺:AI时代,腾讯有一丝的危机感吗?


汤道生:当然有了!——很强的危机感。否则怎么会这么大的动作、投入这么多资源来搞元宝。


张小珺:危机来自于什么?


汤道生:危机来自于未知。


你也不知道这一波会怎么改变用户习惯,对于我们已有业务有什么冲击。


最好的应对方式就是:积极拥抱。



文章来自于微信公众号 “语言即世界language is world”,作者 “ 张小珺

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

4
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

5
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

6
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

7
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

8
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

9
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0