百度阮瑜：大模型应用落地正从简单高容错向复杂低容错场景延伸

百度阮瑜：大模型应用落地正从简单高容错向复杂低容错场景延伸｜中国AIGC产业峰会

8383点击 2025-04-24 16:39

现在，不论你是去吃火锅，亦或是去趟医院，或许身边已经布满了AI。

这，就是当下大模型应用的发展趋势——

AI技术正以惊人的速度从实验室走向千行百业，深刻改变着各个领域的发展格局。

近期百度副总裁阮瑜在量子位举办的第三届AIGC产业峰会上，围绕着“万物皆可AI”的主题分享了百度在AIGC以及 AI 应用方面的新尝试和探索。

百度阮瑜：大模型应用落地正从简单高容错向复杂低容错场景延伸｜中国AIGC产业峰会

△百度副总裁阮瑜

为了完整体现阮瑜的思考，在不改变原意的基础上，量子位对演讲内容进行了编辑整理，希望能给你带来更多启发。

中国AIGC产业峰会是由量子位主办的AI领域前沿峰会，20余位产业代表与会讨论。线下参会观众超千人，线上直播观众320万+，累计曝光2000万+。

话题要点

AI行业所呈现出的三大趋势：技术开发轻量化、应用场景深化拓展、服务模式革新

视觉智能在大模型时代迎来爆点

大模型应用辅助决策开始往自主决策方向演进

从通用赋能到行业深耕，大模型应用边界不断拓展

以下为阮瑜演讲全文：

AI行业所呈现出的三大趋势

非常荣幸能够参加中国AIGC产业峰会，今天我跟大家来分享一下百度在AIGC以及AI应用有哪些新的尝试和探索。

首先来看一下关于AI未来发展的趋势，我们能看到这两年来AI变化风起云涌，而且速度也非常快。

最近我们能够洞察到这个行业有三个非常明显的趋势在发生。

百度阮瑜：大模型应用落地正从简单高容错向复杂低容错场景延伸｜中国AIGC产业峰会

第一个是高性价比和高性能的底层模型开始拥抱开源路径。

很多低代码的开发软件不断横空出世，很多开发者可以用成本极低且快速的方式生成AI应用，在这一块就体现出来了门槛逐步地在降低。

第二个新趋势是场景不断地延伸。

所谓场景在延伸，我们发现大模型应用落地场景开始从最开始非常简单高容错的场景，逐步深入到复杂的低容错场景，这个趋势也是非常明确的。

第三个趋势是，随着 Agent 技术的出现，有非常多企业开始通过“软件+服务”的方式去服务客户。

这个领域里面看到原来大家更在乎我们只提供一个工具，现在不完全通过一个工具去解决客户的问题，而是通过“工具+服务”，最后为结果负责。

很多企业从“原来的License购买”开始转向为效果付费，越来越重视ROI，这也能看到从最早的工具的延伸开始往“服务+工具”方向演进。

这块一旦从传统的工具市场变成了专业服务的市场，整个市场边界发生非常大的变化，市场的潜力也会不断地爆发出来。

百度阮瑜：大模型应用落地正从简单高容错向复杂低容错场景延伸｜中国AIGC产业峰会

我们能看到在大模型的应用趋势中，Agent出来以后，单一智能体开始变成多智能体，

其实一个智能体可以把任务拆解成非常简单的环节，你可以把一个简单的任务通过一个Agent来完成。

但是当出现了一个复杂任务的时候，其实需要多智能体之间的协同，甚至每一个智能体在自己的专业领域里面有自己的擅长，相互协同以后会产生非常大的能量。

另外在模态层面上，我们也看到从传统的单模态开始演进到多模态，甚至出现了非常多跨模态的应用。

尤其是随着底层模型跨模态能力不断增强，跨模态的数据处理能力也日益凸显。

AI交互从文本对话向多模态的交互发展，这个发展也是在很多产品和应用中能够看到这个趋势。

我们也看到在大模型应用层面，有非常多的新的变化，最早大家做大模型应用的时候，都是在做辅助的决策，大模型无法完全自主决策。

但是随着底层模型不断地演进，我们也看到了通过端到端产品的优化，已经开始有很多自主执行和决策的应用的出现。

这里面也体现出来了未来的趋势，大模型应用从辅助决策开始往自主决策方向演进，

未来也坚信这个趋势下还会涌现出更多的AI应用来解决用户现场使用过程中很多实际问题。

百度智能云基于百度自研的 IaaS 层百舸AI异构计算平台和千帆大模型平台，进行了诸多尝试，在两个平台之上长出了非常多自己面对千行百业的应用。

我们把应用分成两个大类：

一部分是通用应用，面对的还是普适性可以标准化的不同行业里的应用。

另外一方面是在行业应用里面，深入到行业里面以后，行业里面有非常多Know-How，基于这些行业Know-How产生出非常多行业应用。

今天我也从两个方面去讲一下，我们在这些趋势下，以及在这些行业里面深耕的阶段性成果。

视觉智能在大模型时代迎来爆点

刚才也提过了，大模型演进里面很大一部分是多模态的方向，我们很早也在多模态领域里做了大量的实践和深耕。

能看到在小模型时代的时候，这种多模态的视觉的琐碎的需求，有95%是没有被满足的。

如果做小模型的视觉的产品，会发现要投大量的工程师在里面做各种算法优化，投入很大，周期很长，而且碎片化，泛化能力比较弱。

大模型时代，我们发现大小模型相结合，随着多模态技术不断发展，模型底层精度不断提升，

泛化能力提升了以后，我们能看到整个AI视觉技能的生产成本，调优成本是显著降低的，而且碎片化的需求是有非常大的可能性会被标准化的产品来满足。

尤其是在很多企业生产过程中的标准化的工序里面的安全合规视觉稽查是比较有空间能够做到的。

我们也判断，长期看，随着大模型底层模型不断地优化，视觉智能化管理数字化的爆发，很快会在我们眼前发生。

百度阮瑜：大模型应用落地正从简单高容错向复杂低容错场景延伸｜中国AIGC产业峰会

百度智能云一见是视觉领域里面的应用，也是我们投入了很多年在做的一款产品。

这个产品主要是基于大模型的技术重构了以后，我们帮助客户去实现针对多模态视觉场景里面的自动调优，模型的准确率是可以做到95%的。

而且最大的特点是一句话，人机对话的一句话可以生成一个AI的视觉的技能，直接用在客户摄像头，

线上SaaS的方式直接下放到摄像头里，这个速度是以前私有化的模式非常难以想象的。

而且通过大小模型的结合，我们能发现，调优的成本，以及生产的成本是大幅降低的，

这里面也体现出来了在性价比层面上，在客户层面是要通过大模型技术的优化去解决客户场景中的痛点。

百度阮瑜：大模型应用落地正从简单高容错向复杂低容错场景延伸｜中国AIGC产业峰会

一见主要是三个大的场景。

一个是安全生产，有很多能源制造的客户在安全生产过程中有非常多的隐患的担忧，

我们沉淀了800多个安全的生产模型去帮助客户降低线上的巡检、安全事故等。

二是连锁合规，合规的需求，服务场景下面有非常多的服务的合规，包括后厨里的餐饮安全，这里面也有大量的视觉场景的需求。

三是品质管控，在生产的时候，我们有很多SOP标准的流程，每一个流程是不是符合工序流程，

这一块也落地了非常多的头部企业，也能看到在应用了这些大模型的视觉技术以后，质检的效率提升了5-10倍。

下面看一个视频，来简单地理解一见在场景中的应用。

百度阮瑜：大模型应用落地正从简单高容错向复杂低容错场景延伸｜中国AIGC产业峰会

百度智能云的实践案例

我们有非常多成功的案例在客户这里应用，这里举了两个例子。

第一个例子是在连锁合规场景中，案例的结果在上面已经比较显著地看到。

我讲一个很实际的例子，我们现实中跟很多穿戴设备，尤其是跟一见的多模态的视觉平台绑定在一起的一些应用。

比如说我们跟一个比较大型的餐饮品牌合作，现在可以做到服务员的手上有手环，晚上12点的时候如果有客人进店，店面比较大了以后很难观察到客户。

客户对摄像头招一下手，通过一见的识别会通知服务员可以服务这位客户，对应的是不是有小孩、老人，有哪些注意事项。

这些现在通过多模态的识别技术，联动云边端和智能设备IoT设备的联动，

可以把整个餐饮的连锁打造得越来越智能，对于大型连锁的餐饮机构和商店的场景下是非常实用的。

百度阮瑜：大模型应用落地正从简单高容错向复杂低容错场景延伸｜中国AIGC产业峰会

另外一个是风电场景下也有一些合作。

有很多大型的集团有大量的风机在外面，风机的巡检，以及人员检查风机的时候有非常多安全注意事项，

比如穿戴设备是否合规，出仓是否符合安全的要求等，整个视觉技术可以做到及时预警通报。

原来是小时级才能通报，现在分钟级就能通知到，管理过程是要更加注意的，整个巡检效率也提升了非常多。

这一块是在安全层面上，一见在安全和服务合规上做了非常多的尝试和探索。

大模型应用边界不断拓展

在通用型的应用之后，我们也发现大模型的应用在行业里面是有非常多的变化，以及很多场景的结合。

尤其是我们能看到，在医疗领域里，整个变化是非常大的，从行业深耕里面可以深耕的非常细。

我们可以看到医疗这个行业里，每次AI技术来了以后，医疗都是先行者，

渗透了非常多环节，包括像临床、管理、科研、制药、AI手术机器人、患者管理等，非常多的场景和领域，

现在都能看到已经被大模型的技术开始应用且创新产生结果。

百度本身也是依赖自己的AI技术，以及全栈式的AI布局，我们在自研的灵医大模型基础上，跟很多医院尝试了非常多的合作，

今天跟大家讲我们做了哪些合作，希望跟大家有些共同的探讨。

在过往的时间里，其实合作了有将近500家的医院，包括很多机构。

在大模型的应用过程中，我们也可以看出来，整个大模型的应用，从医疗这个领域里，从辅助决策开始往自动执行的领域里的演进。

百度阮瑜：大模型应用落地正从简单高容错向复杂低容错场景延伸｜中国AIGC产业峰会

我们讲一个案例，北大国际医院是我们非常紧密的合作伙伴，我们在医疗这个领域做了非常深度的应用，

包括智能病历的辅助生成，智能辅助推荐，包括医疗知识的简报。

整个这些功能上线了以后，我们能看到整个病历的质量提升了60%，

而且临床科室的使用比例从30%提升到了95%，也能看到大模型的应用在帮助医生更好地做医疗的辅助工作。

后面看一个视频，具体看一下这些功能是长什么样子的，以及具体怎么应用的。

百度阮瑜：大模型应用落地正从简单高容错向复杂低容错场景延伸｜中国AIGC产业峰会

其实随着整个大模型技术的不断演进，我们也看到应用在各个行业里面发生了非常多的化学反应，这些也离不开各界的产业人士大家一起共同的努力。

我们也期待在未来有更多的机会去携手跟大家共同在大模型应用落地的领域里有很多新的尝试，把整个生态做得更加繁荣。

感谢各位！

文章来自于微信公众号“量子位”，作者：量子位编辑部

百度阮瑜：大模型应用落地正从简单高容错向复杂低容错场景延伸｜中国AIGC产业峰会

关键词: AI , 百度AI , 人工智能 , AIGC峰会

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales