深度|吴恩达:中国在开源权重模型的发布方面已经远远领先于美国;很多人用Agentic AI的方式是错的

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
深度|吴恩达:中国在开源权重模型的发布方面已经远远领先于美国;很多人用Agentic AI的方式是错的
9930点击    2025-12-29 15:04

深度|吴恩达:中国在开源权重模型的发布方面已经远远领先于美国;很多人用Agentic AI的方式是错的

图片来源:Masters of Scale


Z Highlights


  • 如果一项任务主要涉及文本处理,并且你拥有完善的数据渠道,能够获取完成该任务所需的全部文本信息,那么人工智能完成这项任务的难度就会较低。


  • 未来最重要的技能之一,是能够准确地告诉计算机你想要什么,这样它才能为你完成相应的工作。在可预见的未来,懂得计算机语言、理解编程的人,在这方面的效率会比不懂的人高得多。


  • 过去一两年发生的情况是,中国在开源权重模型的发布方面已经远远领先于美国。这些模型任何人都可以在全球范围内免费下载和使用。


Andrew Ng是Coursera和Deep Learning AI的联合创始人,同时也是AI Fund的管理合伙人——这是一家培育新兴人工智能公司的工作室。DJ Patil曾担任奥巴马政府的首席数据科学家,现任Great Point Ventures的普通合伙人。这场对话围绕人工智能的现状、下一代人应如何应对这项技术,以及美国如何在全球人工智能竞赛中保持竞争力展开。


Andrew Ng其人


DJ Patil:我认识Andrew很久了。在人工智能还未风靡之时,他就已经在从事相关研究和推广工作。我记得有一次,我们一起探讨数据科学相关理念时,他提到人工智能说“人工智能还处在寒冬之中”。但他已经在这条道路上走过了一段非凡的旅程。简单介绍一下Andrew的亮点成就:他是最早倡导将GPU用于深度学习的人之一。他当初真该买英伟达的股票。我正想说呢,黄仁勋该欠你多少架私人飞机啊?


Andrew Ng:我不知道。我是说,得看飞机多大尺寸吧?


DJ Patil:真为他们高兴。他有没有给过你什么东西?


Andrew Ng:我记得他送了我几块GPU。挺不错的。


DJ Patil:几块GPU啊,你还真拿到了些东西。你编写了第一门大型机器学习与人工智能在线课程,这门课程后来催生了Coursera。在当时,在线授课是一种非常激进的想法,而这门课程已经帮助了超过1000万人对吗?


Andrew Ng:是的,谢谢。


DJ Patil:这真是一项了不起的成就。你还与Jeff Dean、Greg Corrado以及Rajat Monga共同发起了谷歌的——不是DeepMind,而是Google Brain项目。


Andrew Ng:谢谢,是Google Brain项目。


DJ Patil:成就远不止这些。你目前正在做的事情包括运营一只基金和一个工作室,专注于人工智能领域的投资与建设,同时你还发表了多篇人工智能领域引用量极高的开创性论文。


Andrew Ng:是这样。我得承认,我的论文引用量确实不低,但我现在已经不常关注引用次数了。


DJ Patil:确实。你把这些事留给别人或人工智能系统去关注了,但还有一件事你们可能不知道。现在有多少人听说过Agentic系统?或许我应该换个方式问,好让大家重点关注一下。猜猜Agentic这个概念是谁提出来的?就是这位先生。一个鲜为人知的事实是,Andrew正是真正提出Agentic概念的人。那我们就从这里开始吧。Agentic背后有什么故事?


Andrew Ng:大约两年前,我注意到人工智能领域出现了一个很多人都为之兴奋的新兴趋势,但科技圈内却存在大量争议。有些人开发了软件,就称其为“agent”;另一些人则反驳“这不是agent”,双方各执一词。我觉得这纯粹是浪费时间。与其在“是智能体”还是“不是智能体”这种二元对立的问题上争论不休,不如直接将这类系统都称为“Agentic”,然后停止争论,专心投入工作。


所以我其实发起了一场没有公开宣传的推广活动,想让更多人接受“Agentic”这个词。但我没想到的是,几个月后,很多营销人员抓住了这个词,把它当作标签贴在所有能想到的事物上,这反而让这个概念迅速传播开来。尽管如今热度已经消退,但我认为它的实际价值仍在快速增长。这一点非常令人振奋。


很多人用Agentic AI的方式是错的


DJ Patil:好的,我想分四个部分来聊。首先,我们结合这位行业元老的视角,谈谈当下人工智能的现状。你对人工智能的能力边界有何真实看法,尤其是从Agentic的角度来看?因为我觉得我们都在被各种营销宣传和炒作所困扰,难以分辨真假。未来还有很多工作要做,比如将Agentic AI令人惊叹的能力与实际的业务流程相结合。我们一直在推进这项工作。那到底什么是Agentic?让我们先把概念理清。


Andrew Ng:现在很多人使用人工智能大语言模型的方式是通过提示词让模型生成输出内容。这有点像对一个人或者说对人工智能说“请一口气写完一篇文章,从第一个字到最后一个字,中途不停顿,也不能删改”。但人类不会用这种方式写出最好的文章,人工智能也一样。而Agentic工作流的核心思路是,让人工智能采用更具迭代性的方式完成任务。比如先写大纲,再做一些研究,然后撰写初稿,最后进行修改完善。这种迭代式工作流耗时更长,但对于很多任务来说,比如提供医疗建议、法律建议、关税合规相关工作,或者编写各类代码等,Agentic工作流的效果要好得多。不过,我们面前还有很多工作要做。我知道有些人会说“别担心,等着AGI出现就好,它会解决所有问题”。


但我不认同这种“等待AGI”的想法,这在我看来太炒作了。如今真正有价值的工作,是利用现有技术以及未来6到12个月内可能实现的技术,去做一些有实际价值的事情。有时候我会这样类比:我使用这些系统是为了开发相关应用,比如将人工智能应用于老年人的医疗健康服务等领域。但有时我会疑惑,我对这些系统的能力边界的把握,到底是稳妥可靠,还是岌岌可危?我猜想很多人也会有同样的疑问:人工智能是否适用于解决某个特定问题?它的稳定性如何?有时候我们只能得到一个80分的解决方案,有时候它的表现会非常出色,还有些时候则会让我们大失所望。


DJ Patil:作为一名创业者,同时也为很多人提供咨询,你是如何看待这个问题的?


Andrew Ng:确实,这是一个难题。我认为,如果一项任务主要涉及文本处理,并且你拥有完善的数据渠道,能够获取完成该任务所需的全部文本信息,那么人工智能完成这项任务的难度就会较低。如果需要输入图像、语音对话等内容,也不是完全不可能,但难度会大大增加。


另外一个我经常会问的问题是:人类掌握了大量知识,拥有丰富的上下文信息,那么我们是否具备相应的数据渠道,能够让人工智能系统获得完成任务所需的、与人类相当的上下文信息?还有,对于许多多步骤流程,如果能够制定出SOP,并且明确相关职责,那么将这些SOP转化为多步骤的Agentic工作流是值得尝试的。所以,虽然很难直接判定某项任务能否通过人工智能完成,但这些或许可以作为判断其成功可能性高低的参考依据。


人工智能时代,我们还应该学习编程吗?


DJ Patil:好的,让我们换个话题,聊聊教育以及我们对教育的态度。因为你通过Coursera真正改变并重塑了学术界。你目前的在线课程,我都数不清有多少浏览量,有多少人在学习。我相信每个家长都会问你,他们的孩子应该做些什么来为人工智能时代做好准备。孩子们还应该学习编程吗?计算机科学还有价值吗?数据科学还有前景吗?或者说学习这些已经不是一个好主意了?


Andrew Ng:是的。未来最重要的技能之一,是能够准确地告诉计算机你想要什么,这样它才能为你完成相应的工作。在可预见的未来,懂得计算机语言、理解编程的人,在这方面的效率会比不懂的人高得多。我知道,今年早些时候,有一些行业领袖建议其他人不要学习编程,理由是人工智能会实现编程自动化。但我认为,回顾过去,这可能是有史以来最糟糕的职业建议之一。


我已经在我的团队中,以及很多硅谷的团队中看到,不仅是软件工程师,还有营销人员、人力资源专员、分析师、财务专业人士等,那些懂编程的人,正逐渐超越那些不懂编程的人。所以,如果你的孩子打算成为一名软件工程师,那就让他们借助人工智能学习编程。即便他们不打算从事软件工程师职业,未来的趋势也很明显:我们需要的不仅仅是软件的使用者,更是软件的创造者。


我希望孩子们长大后,不会问“有没有对应的应用程序”,而是会说“我为这个需求开发了一个应用程序”。而且在人工智能的辅助下,编程已经比以前容易多了。所以不必手动编写所有代码,让人工智能来协助你完成,这样的人会比不这么做的人更有能力,效率也更高。


这也是我们当前教育体系需要应对的一个挑战。这是一项新的技能,就像如今,如果一个人大学毕业却不知道如何使用网络搜索,那会很奇怪,这会限制他们的就业前景。未来,如果一个人大学毕业却不知道如何创建软件,我们也会觉得“这很奇怪”,这同样会限制他们未来的发展空间。


孩子应该什么时候接触科技?


DJ Patil:当我们考虑孩子应该在什么时候接触这项技术时,合理的方式是什么样的?尤其是结合我们在社交媒体方面已经遇到的一些问题。前公共卫生部长Vivek Murthy就曾强调过社交媒体带来的相关挑战。在你看来,什么时候接触科技太早了?什么时候是让孩子开始接触人工智能的合适时机,才能确保他们真正成为人工智能原住民,并最大限度地从这项技术中获益?


Andrew Ng:我认为这是一个很复杂的问题。就像我之前提到的,孩子们很小的时候就可以接触书籍,但有些书显然不适合两岁的孩子阅读。我认为科技带来的挑战也类似:有些应用程序非常适合幼儿使用,但也有很多内容是我们不会让小孩子接触的。我的孩子一个四岁,一个六岁,他们偶尔会使用平板电脑,但我都会在旁边陪着他们。


我不会把平板电脑当作保姆,而是让他们用它来做一些教育相关的事情,或者玩一些有趣的内容,之后我们还会一起讨论。所以我认为,媒介虽然从书籍等变成了科技产品,但核心挑战并没有改变:企业是否有动力为孩子打造合适的体验?作为家长,我们又该如何设定界限,或者筛选合适的内容?就像我不会让我的孩子阅读那些非常不适合他们年龄的书籍一样,我也不会让他们接触那些非常不适合他们年龄的科技内容。但考虑到某些公司的激励机制,它们可能会推出一些我们家长不希望孩子接触的内容,这确实是一个难题。


DJ Patil:你有没有和这些公司或相关机构谈过,对他们说“别这么做了,这没有好处”?或者这类对话通常是怎样的?因为很多采取这些我们家长认为有问题的行为的人,其实都上过你的课程。


Andrew Ng:你知道硅谷99%的工程师和商界人士都想做正确的事情,对吧?那些做出这些有问题行为的人,说实话,可能是我们的朋友,甚至可能就在这个房间里。我认为每个人本质上都想做正确的事。但我希望我们能找到一种方式,即使涉及数十亿美元的利益,依然能始终坚持做正确的事。这确实是一个现实问题,我们发现,当经济激励或其他激励足够大时,总会有一小部分人做出不太正确的选择。我真希望我知道如何解决人类激励机制这个问题。


DJ Patil:好的。我们换个相对简单的话题吧——美国政策。正如我们之前提到的,你很早就倡导GPU的应用,同时你也是我最早看到的、与国际科技公司展开深度合作的人之一。基于你所处的位置,以及你对整个行业格局的了解,我们看到联邦政府在GPU相关政策上摇摆不定;我们看到行政命令中提到了他们所谓的“觉醒系统”;同时也有一些行政命令和政策旨在加速人工智能的应用。如果你有五分钟时间和总统对话,你会给他们什么建议,既能负责任地释放人工智能的力量,让所有美国人受益,又能确保国家的竞争力?你会怎么说?


Andrew Ng给总统的建议


Andrew Ng:是的,我非常担心美国在人工智能领域的国家竞争力。我认为现任政府在某些方面做得不错。而前任政府的一些所谓“人工智能安全”理念,其实更多是游说团体推动的“安全噱头”,通过制造恐慌来实现监管俘获,制定反开源的法规。


没错,如果你不想与开源竞争,就编造一堆关于人工智能危险的谎言,试图通过限制性的许可制度来阻碍开源发展。所以现任政府对这类做法似乎没什么耐心,这一点很好。但也有一些事情让我感到担忧。我们俩都是移民,我们的很多学生也都是移民。如果我们加大学生移民的难度,我真的很担心这会影响美国的竞争力。


坦率地说,不仅仅是学生移民。我17岁的时候以本科生的身份来到美国,当时的我说实话非常懵懂,美国接纳我的时候,我根本算不上什么高价值移民。所以,让学生来到美国,让他们在这里成长,有望成为高技能人才,这一点至关重要,我真的很担心这方面会出现问题。


我还担心科学领域的资金削减,以及对科学和人工智能领域投资的减少。大学确实存在一些问题,有很多地方可以改进,但我认为,削弱这个国家的科学执行能力,是一个非常值得担忧的事情。


我认为半导体是一个瓶颈。另一个正如新闻中所报道的、确实存在的重大瓶颈是能源。数据中心本质上就是一台将电能转化为智能,或者说将电能转化为token的机器。而目前面临的限制是,我有很多朋友都在为审批流程所困扰——我们能在这里建发电厂吗?你以为已经拿到了审批,但之后可能会遇到当地居民的反对等问题,这些反对或许有其合理性,但我认为能源容量确实是另一个我非常担心的瓶颈。


Andrew看全球人工智能竞赛


DJ Patil:具体来说,中国和欧洲在人工智能监管以及技术主导权方面采取了截然不同的方式。我们看到美国正在努力在竞争力方面寻找平衡点。我很好奇,从你的角度来看,开源模型的发展趋势是怎样的?人们是会基于目前主要由美国主导的人工智能核心体系进行拓展,还是会形成一个由多种不同模型、方法和技术组成的“联盟”,就像森林中多棵独立的树木一样?


哪种策略才是正确的?哪种策略对全球人工智能的发展最有利?是构建一个有核心主干、再向外延伸分支的人工智能体系,还是让多种不同的模型、方法和技术共同发展,形成一个“联盟”式的生态,就像森林里多棵独立生长的树木?


Andrew Ng:我认为我们需要多个分支。否则,就像移动手机行业一样——移动生态系统之所以缺乏活力,就是因为存在两个守门人:Android和iOS,除非它们允许,否则你无法进行任何创新尝试。所以我希望人工智能行业不会最终只剩下少数几个守门人,从而限制创新。过去一两年发生的情况是,中国在开源权重模型的发布方面已经远远领先于美国。这些模型任何人都可以在全球范围内免费下载和使用。我看到有数据显示,中国开源权重模型的累计采用量即将超过,或者可能已经超过了美国开源权重模型的累计采用量。美国的闭源模型仍然更出色,但开源权重模型是人工智能供应链的关键组成部分,并且已经得到了广泛应用。我认为,作为一个国家,我们在这方面的投资还不够。


至于你提到的欧洲——说实话,我喜欢欧洲,但我希望欧洲能尽快醒悟,加快发展步伐。过去几年,我在与欧洲监管机构接触时,经常听到他们说“我们想成为人工智能监管领域的领导者”。但我认为,这并不是获得竞争优势的方式。要赢得竞赛,应该多踩油门、少踩刹车。


下一代人将用人工智能解决什么问题?


DJ Patil:在剩下的几分钟里,让我们把话题转向未来,聊聊人工智能的未来发展。但我想从你所接触到的、最前沿的下一代学生和创业者的视角来探讨这个问题。你看到他们正专注于解决哪些问题?他们的希望和梦想是什么?具体来说,这让你对未来24个月的发展有何预判?


Andrew Ng:我们身处硅谷,这里的大多数人都热爱人工智能。我也热爱人工智能,热爱我所做的工作。我认为它能让世界变得更美好。但我觉得我们很多人可能低估了全国范围内很多人对人工智能的不信任感,我迫切地希望我们能团结起来,清晰地传达一个有说服力的理念,让人们明白人工智能实际上对世界大有裨益。


我们都对生产力的提升感到兴奋,但当一名呼叫中心员工担心自己会失业,或者一名快餐从业者听到政客说“没错,你猜怎么着?这些搞人工智能的人会让你的工作消失”时,这会引发人们对人工智能的极大恐惧和不信任,而这种情绪在硅谷是很难感受到的。


所以我认为,要赢得人们的信任,我们需要确保这项技术能真正广泛地惠及每一个人。我相信这是可以实现的——人工智能能让每个人变得更高效、更有能力。但要实现这一目标,我们需要让每个人都能使用这些工具,教会每个人如何使用它们,开展技能提升培训,不断改进工具。我觉得,就像“10倍工程师”的概念一样,借助人工智能,我们也能拥有10倍效率的营销人员、10倍效率的分析师、10倍效率的财务专业人士。但要真正实现这一点,我们还有很多工作要做,而且我担心,我们还没有赢得这个国家很多人的信任。


DJ Patil:你现在最喜欢用人工智能做什么?


Andrew Ng:天啊。或许我可以分享一个不太为人知的用途。我把人工智能当作头脑风暴的伙伴,而且使用频率比我的朋友们想象的要高得多。


DJ Patil:那有什么技巧吗?你是用一个模型,还是多个模型?


Andrew Ng:多个模型。


DJ Patil:替朋友问的。


Andrew Ng:我懂。编程方面,我喜欢用Claude,也越来越多地使用OpenAI的CodeLens。头脑风暴时,我会用多个模型。关键在于,人工智能非常智能,但要让它理解上下文信息并不容易。所以在头脑风暴时,我发现有效的方式不是“我说一些想法,然后让它给出建议”,而是进行深入的对话——比如让它给出三个想法,或者让它对我的想法提供反馈。


两种方式都可以。开车的时候,我会用语音交互;坐着的时候,我会用文字输入。我发现开车时,我经常和人工智能交流,之后让它“总结一下”,然后把总结结果发给我的团队,这样就能在开车时也完成一些工作。


DJ Patil:在最后10秒钟,你希望人们更多地利用人工智能解决什么问题?


Andrew Ng:其实很简单,就是去创造东西。我认为在座的每一个人,现在都是创造的黄金时期。所以如果说有什么是我希望大家记住的,那就是去创造东西。现在有很多很酷的东西,都是以前不可能实现的,而现在你都可以借助人工智能去创造。所以,去创造吧,去创造吧,去创造吧。


DJ Patil:我觉得以“创造、创造”收尾再完美不过了。女士们,先生们,感谢Andrew Ng的精彩分享。Andrew,感谢你的研究成果,感谢你的到来。


Andrew Ng:谢谢大家。


Nara el Kaliouby:Andrew和DJ的对话告诉我们,人工智能是一个完整的生态系统。美国要想在人工智能竞赛中获胜,需要采取多方面的综合策略。这不仅需要芯片和人工智能基础设施,还需要人才。我们必须继续吸引全球顶尖人才,为来自世界各地的学者和创新者提供机会,让他们在这里开启成功的人生和职业生涯。


原文:Andrew Ng on America's standing in the AI race (with DJ Patil) | Masters of Scale Summit 2025

https://www.youtube.com/watch?v=XeUAu65unu8

编译:Mel Chou


文章来自于“Z Potentials”,作者“MoS”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0