大模型之间的差距会越来越大!
李彦宏最新内部讲话曝光,一时间引发行业热议。
毕竟在当前各种大模型横扫榜单测试集、多项得分超过GPT-4o的现象中,很容易给人一种假象:下一个GPT-4o、下一个OpenAI就要诞生了。
为什么会这么说?李彦宏进一步解释道,大模型的天花板很高,现在距离理想情况还相差非常远,所以模型要不断快速迭代、更新和升级。
这背后需要能几年、十几年如一日地投入,不断满足用户需求,降本增效。
除此之外,他还表示开源模型效率不高,解决不了算力问题,而智能体是大模型最重要的发展方向。
百度一直以来作为大模型应用的先行者,掌舵人李彦宏此次谈话无疑也是给行业带来一份实际意义上的参考。
一起来看看他到底说了什么。
内部谈话中李彦宏提出了三点思考,正好回应了当前正受关注的认知误区:大模型之间的差距在缩小吗?大模型技术已经接近天花板了吗?为什么说商业化模型更有性价比?
首先,大模型差距不是越来越小,而是越来越大。
一上来,李彦宏就反对了外界对大模型能力差距缩小的看法,认为模型之间的差距仍然显著,并且会越来越多。他指出,尽管新发布的模型在测试集上表现良好,但这并不能证明它们与最先进的模型如GPT-4o之间的差距已经缩小。
他解释说,很多模型在发布后,通过打榜、猜测试题目、答题技巧,从榜单上看 ,也许模型的能力已经很接近了,“但到实际应用中,实力还是有明显差距的。”
一方面,模型之间的差距是多维的。模型能力的评估除了包括理解、生成和逻辑推理等多维度,以及相应的成本和推理速度。此外,对测试集的过度拟合可能导致对模型能力的误解。
如今大模型已经来应用阶段,他认为,真正的衡量标准应是模型在实际应用中能否满足用户需求和产生价值。因此在百度实际使用过程中,他不允许技术人员去打榜。
另一方面,模型天花板很高。今天能做到的,距离想要实现的效果还很远,所以模型还需要不断去迭代更新。只有持续几年甚至十几年地投入,才能让模型满足用户需求、满足场景、满足提升效率或降低成本等需求。这也是保持竞争力的关键
由此李彦宏认为,所谓的领先12个月或者落后18个月没有那么重要。哪怕你能保证永远领先竞争对手6个月,那就赢了。
其次,开源模型解决不了商业应用中的效率问题。
在讲话中,李彦宏强调,开源模型需要用户自行部署和维护,这导致其GPU使用率低,无法有效分担推理成本。而闭源模型通过用户共享资源和分摊研发成本,实现了更高的效率与效果。
目前文心大模型3.5、4.0,GPU使用率都能达到90%多。
正如前面所言,评价一个模型,维度是多方面的,不仅是看到榜单上的多项能力,也要看效果看效率。当大模型加速驶入商业应用之后,在追求高效率和低成本的情况下,开源模型并没有优势。
李彦宏明确表示,在大模型时代,算力的高效利用是决定模型成败的关键,而开源模型无法解决这一问题。
最后,智能体是大模型最重要的发展方向,低门槛让应用转化变得更加直接和高效。
大模型发展过程主要会经历哪几个阶段?在内部讲话中, 李彦宏给出了明确的答案。
首先是的Copilot阶段,辅助人类进行操作;接着是Agent智能体阶段,具备自主使用工具和自我进化能力;最后是AI Worker阶段,能够独立完成多种工作。
其中智能体作为大模型最重要的发展方向,相比于大家都在关注的多模态,尚未形成行业共识。但在百度的产品中,比如文心智能体平台AgentBuilder已经让智能体的潜力已经开始被认可。
而其中低门槛这一特性,让从模型到应用的转化变得简单,促使大量新智能体在百度平台上被创造。
李彦宏强调,借助百度的用户基础和需求,智能体可以更好地满足市场需求,推动其进一步发展。
总结下来,李彦宏谈到的这几点思考,如果说前两点,还说的是现在,说的是当下,那么智能体就代表着未来。而这一切的背景前提,正好同当前大模型发展驶入深水区阶段不无关系。
如今随着基础模型更新速度放缓,大模型应用逐渐深入产业,企业面临着更复杂的市场环境和技术挑战。简单的技术迭代已不足以满足市场的多样化需求。
人们对大模型的期待与看法也随之改变,模型的参数量以及榜单分数不再作为模型能力的核心指标,开源不开源其实也并不重要。
产业界对AI的需求,已经不仅仅是单纯的技术追求,解决实际问题才是衡量大模型的唯一标准。在这一过程中,更多问题和挑战不容忽视,比如推理与算力的成本问题,以及处理业务效率等。
那么本身在行业长期且持续投入的百度,面对当前这一命题,自然是给中国众多大模型提供了一份发展参考。
答案就是智能体。
所以这次李彦宏内部谈话,其实也不仅仅是关于行业认知,还有来自百度智能体实践的有力验证和体现。
在此之前,李彦宏在多次讲话中强调,智能体代表了AI时代的未来趋势。
作为一个几乎“放之四海而皆准”的大模型应用,智能体不仅门槛低,甚至不需要编程技能,就能让用户轻松开发出功能强大的应用。李彦宏形象地将智能体比作“AI时代的网站”,预示着它将形成一个数百万量级的庞大生态。这种广泛的应用潜力使得智能体成为各行各业的“Super APP”,推动了AI技术的普及和应用。
与之相应的,是百度在智能体领域的布局显著。
通过文心智能体平台AgentBuilder,百度已经吸引了20万开发者和6.3万企业入驻,并在2023年7月免费开放文心大模型4.0。这一举措使得开发者在构建智能体时可以灵活选择适合的模型版本,大大降低了开发的门槛。
并且在短短时间内,百度智能体展现出大模型应用强大的潜力。据百度2024年Q2季度财报,智能体在百度生态的分发量正在快速上升,7月日均分发次数超800万,较5月翻倍。
热门智能体包括内容创作、性格测试和日程规划等,涵盖教育、法律及B2B等多个行业。百度的智能体生态吸引了1.6万家商户参与,形成了用户、开发者和服务商共赢的局面。
李彦宏强调,智能体的发展不仅依赖于技术创新,更需紧密结合用户需求。随着用户对智能体的需求不断上升,使得这些智能体能够快速迭代。而只有智能体生态持续扩展,才能推动AI技术在各个领域的深入应用。
在大模型应用逐渐深入的当下,百度的智能体实践无疑为行业提供了重要的借鉴和启示。
今年以来已经明显感知到的是,随着大模型技术的不断发展和应用的深入,行业正在进入一个新的阶段。这个阶段的特点是,大模型玩家格局已基本形成:有自研和可持续研发大模型能力的玩家开始向头部聚集。
与此同时,大模型应用和落地开始进入生态建设期。
越来越多看好大模型前景的创业者,不再会纠结是不是要自研或者自建大模型的问题,而是更加关注如何利用现有的大模型解决实际的痛点需求和问题。
在这个过程中,智能体作为最小的AI应用实现方式,展现出了巨大的潜力。它低门槛轻量化,能够快速在行业中铺开并实现覆盖,满足效率和成本两大需求。随着基础模型的不断增强,智能体应用可以变得更加简单和广泛。
这也是李彦宏看好智能体的核心原因所在。
通过李彦宏讲话,我们可以看出百度的战略重点正在发生转向。卷基础模型的阶段已经过去,现在更加重要的是如何通过智能体构建起丰富多彩的应用生态,让生态成为百度大模型、文心的护城河。
这意味着,百度将更加重视智能体在应用生态中的价值和意义,通过不断完善智能体平台和工具,吸引更多开发者和企业加入,共同打造一个繁荣的AI应用生态。
未来,智能体将不仅限于内容创作和日程规划等基本功能,会拓展到更多专业领域,如医疗、金融和法律服务等,为用户提供个性化和高效的解决方案。
为了实现这一愿景,企业需要持续投入资源进行技术创新与迭代,不断优化算法和提升用户体验。
当然,在这个过程中也会面临一些重要的课题,比如数据隐私与安全性,智能体的管理和维护等。但是,任何一项技术应用驶入深水区都会面临这样那样的挑战。
随着智能体生态的不断壮大,百度正引领行业走向一个更加智能化和高效的未来,为各行业带来新的机遇与挑战。
文章来自于微信公众号“量子位”,作者“白小交”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/