吴恩达预言成真？这群AI「员工」狂卷KPI

8801点击 2024-04-13 17:51

最近，一大波智能体的应用诞生，让全行业看到了「新大陆」。

号称世界首个AI工程师Devin，7×24小时不限时打工，能够debug、训模型、构建部署应用程序，胜任各种代码任务。

几天前的谷歌Next大会上，还发布了「智能体构建器」，可以让每个人能够用自然语言构建自己的Agent。

不难看出，智能体不仅将会成为人人可触及的一项技术，而且各行各业都将被不断升级迭代的智能体重塑。

甚至，这场AI技术+场景的爆发，还会诞生出一些「前无古人」的东西。

用大模型+智能体，对抗汽车行业内卷

如今的汽车行业，已经卷到超乎想象的程度。

用户需求的多样化，愈发丰富的触点，都需要业内人士时时翻出创新的水花。

幸运的是，飞速发展的LLM，让任何全新的视角都有了可能。

吴恩达预言成真？这群AI「员工」狂卷KPI

就拿一辆车的获客场景来说吧。

如今的新媒体，已经成为营销过程中的重要一环。

谁能拥有优质内容，就会拥有最大的曝光度，完成奇迹般的获客KPI。

要知道，传统的4S店，并没有专业的创意内容生产团队，视频制作、账号运营，经常都是销售人员和市场经理兼职完成，效率非常低下。

而这时，就需要非常擅长输出高质量视频、图文、海报的AI登场了！

吴恩达预言成真？这群AI「员工」狂卷KPI

为此，易慧智能联合推出提出了一个全新的群体智能组织孪生方案。

人类主管来定目标、审结果，而其余的活儿，包括任务分解、任务执行、任务复盘，都可以通通交给智能体！

吴恩达预言成真？这群AI「员工」狂卷KPI

比如，现在我们要为一个账户定个KPI：一周内涨粉500人。

目标输入系统后，智能体们就开始忙活了。

吴恩达预言成真？这群AI「员工」狂卷KPI

第一步，运营经理Agent会给自己的AI「同事」们进行任务拆解——

1. 我们本周需要策划2场直播，把品牌信息传播出去，还要和用户好好互动。

2. 我们需要在抖音、快手、小红书发布5个短视频，提升品牌影响力。

3. 还要保持平台账号的活跃度，及时回复用户评论，增加他们的参与感。

「领命」后，文案策划师Agent和海报设计师Agent，会基于品牌价值观，制作出吸引眼球的文案和海报，同时还会负责传递和交付。

随后，运营专员Agent，就会把内容分发至各个平台了。

在这个过程中，唯一涉及人类的环节，就是市场部经理需要对内容进行人工确认，确保品牌形象的一致性和专业性。

活动结束后，运营经理Agent还会整体来个复盘。它会仔细分析数据，确保创意能带来实际的营销效果，为后续的内容和用户运营提供数据支持。

吴恩达看好的智能体，或许已实现GPT-5

说到智能体，就不得不提到AI大牛吴恩达，最近可谓是多次公开表示非常看好它们的发展：

AI Agent工作流将在今年取得重大进步，甚至可能超越下一代「基础模型」。

吴恩达预言成真？这群AI「员工」狂卷KPI

他发现，基于GPT-3.5的智能体工作流在应用中，实力超越了GPT-4。

也就是，可能我们早就提前到达了GPT-5，因为在GPT-4之上构建的智能体可以实现性能跃阶。

吴恩达预言成真？这群AI「员工」狂卷KPI

能够取得碾压大模型惊艳效果的智能体，有四种常见的设计模式，即自我反思、工具使用、规划，以及多智能体协作。

吴恩达预言成真？这群AI「员工」狂卷KPI

智能体关键组件框架｜来源：OpenAI科学家Lilian Wang

大模型群体智能

其中的多智能体协作，其实对我们来说并不陌生。

比如斯坦福西部小镇SmallVille，就是基于层次规划的智能体社会小镇，来实现对人类社群行为的可信模拟。

除此之外，清华自然语言处理实验室和面壁智能共同提出的ChatDev，则是基于语言交互的智能体软件开发，实现群体交互协作式任务完成。

吴恩达预言成真？这群AI「员工」狂卷KPI

对此，吴恩达表示：「让多个协作智能体辩论协作，要比单独使用一个智能体，可以取得更好的性能。」

吴恩达预言成真？这群AI「员工」狂卷KPI

不仅如此，大量的研究和实践也提到，多个智能体之间可以通过彼此交流、分享信息和策略，甚至进行「辩论」来找到更优、更有效的解决方案。

如今，一场大模型+智能体应用狂潮，即将在汽车这一垂直领域中率先爆发。

车企大模型落地新范式：组织孪生

2023年，易慧智能在走访调研了大量汽车客户后，发现了诸多痛点。比如，行业竞争白热化，降本增效压力巨大；用户媒介触点多样化；购买周期长期化等等。

与此同时，想要在这一领域直接落地传统的大模型应用，则不得不面对信息孤岛、流程复杂、成本控制和市场响应速度等难题。

而前文提到的「群体智能」，恰恰可以利用自身强大的智能协作和信息共享能力，来解决这些问题。

吴恩达预言成真？这群AI「员工」狂卷KPI

如今，一种基于AI Agent和群体智能技术的全新范式——「组织孪生」正在诞生。

它以数字创新为核心技术框架，主要包含了三个部分：岗位孪生、架构孪生、业务孪生。

更直白地讲，智能体贯穿到了企业整个组织工作流中。

吴恩达预言成真？这群AI「员工」狂卷KPI

岗位孪生

其中，数字员工是岗位孪生最直接的表现形式。

数字员工可以直接应用到行业链中，比如常见的客户服务、电话销售等等。

利用LLM创建的数字员工，能够模拟真人的交流方式，不仅包括声音、表情，还具备了高情商的智能。

我们都知道，数字员工最大的亮点便是，「工作」不限地点时间，7×24全天候提供及时、高效的服务。

凭借智能体技术，数字虚拟人可以持续学习和进化，能够具备执行任务深度反思的能力，实现在技术和服务水平上不断提升。

除此以外，数字员工可以根据企业需求，进行个性化高度定制。

架构孪生

如上，岗位孪生可以简单理解为，智能体个体在执行自己流程中的任务。

但是，如同人类协作一样，有些任务非一己之力所为，而是需要群体智能体去完成。

这时候，「架构孪生」就上场了。

吴恩达预言成真？这群AI「员工」狂卷KPI

它是指将真实世界中的组织架构映射到数字世界中，通过智能体网络技术定义智能体间的交流和逻辑。

举个简单例子，清华自然语言处理实验室和面壁智能联合开发的智能体平台AgentVerse中，就可以利用基础模型定制多智能体环境，以及创建刚刚提到的这些具有不同能力与身份的智能体。

其中，协同决策是最重要的一环，需要智能体之间密切交流。

AgentVerse横向沟通模型侧重的是智能体之间相互理解和协作，而纵向沟通更侧重于职责分工。

而基于易慧智能的每个单独场景，智能体之间可以实现横向和纵向沟通。

吴恩达预言成真？这群AI「员工」狂卷KPI

业务孪生

此外，在汽车行业中，真实的业务流程非常复杂。

就拿出差任务来说，从申请、行程安排、车票酒店预订，到事后报销等等，都需要调配大量人力物力资源。

通过整合大模型、搜索增强（RAG）、智能体构建等技术，业务孪生可实现自动执行任务，优化执行效果。

举个例子，面壁智能的AI智能体框架XAgent创新性引入了「双循环机制」。

在外循环中，XAgent对任务进行规划，在内循环，它便成为任务高效执行者。

吴恩达预言成真？这群AI「员工」狂卷KPI

另外，XAgent在设计过程中，还引入了专为增强人机协作的交互机制。

可见，这一框架能够为复杂的行业场景，提供一个全新数字化工作和管理方式。

LLM群体智能赋能汽车行业

有了组织孪生新范式，LLM群体智能究竟如何在汽车行业应用中发挥最大效益？

不如就拿车企营销中五大核心场景来举例。

营销五大场景

作为消费领域超级大单品，汽车的营销有着其它消费品难以企及的销售难度和销售周期。

汽车销售中最具独特地方在于，高客单价、低成交率，以及长销售生命周期。

目前，为了应对营销场景中许多困难，提高销量，汽车营销场景也积累了一套标准化、全闭环的方法论。

吴恩达预言成真？这群AI「员工」狂卷KPI

针对汽车营销环节长久积累的应用实践痛点，以及结合对智能体应用落地的独到理解，易慧智能基于汽车营销的核心场景增长需求，联合推出了五大场景营销解决方案。

它们分别是数智研究院场景解决方案、新媒体运营场景解决方案、用户运营场景解决方案、集约DDC场景解决方案、與情运营场景解决方案。

并且，通过群体智能技术实现汽车营销业务的组织孪生，提高行业效能。

吴恩达预言成真？这群AI「员工」狂卷KPI

- 集约DDC场景解决方案

汽车营销中，常见的一种模式是DCC，也就是外呼邀约客户。

它对外呼专员的工作繁琐程度、沟通能力要求多且繁杂，成为制约获客转化效率的痛点和难点。

通过对呼叫中心客服进行的组织孪生，利用LLM可以提供及时反馈能力，提升转化效率。

- 用户运营场景解决方案

同时，培育和孵化潜在客户也是一个复杂，但至关重要的环节。

利用群体智能体，可以极大地释放销售人员的客户培育的压力，提高了销售环节转换效率。

吴恩达预言成真？这群AI「员工」狂卷KPI

比如，在新客孵化过程中，客户分析智能体可以对客户信息的要素进行更加细致地筛选，最终产出值得孵化的客户名单。

吴恩达预言成真？这群AI「员工」狂卷KPI

- 数智研究院场景解决方案

消费者需求分析，竞品分析报告对于改善运营效率，优化销售和售后流程有着重要的意义。

这时据数智研究院，便可以代替人类去完成某些繁琐任务。

其间，智能体会自动收集全网数据，并对数据进行高效治理和分析，大幅缩短报告生成时间，提高了时效性和准确性。

吴恩达预言成真？这群AI「员工」狂卷KPI

- 舆情运营场景解决方案

除此以外，舆情对品牌形象和产品销售有着重要的影响。

有了群体智能体，一旦检测到潜在负面舆情，数字员工会直接拉群，立即通知其他员工，一起协作完成难题。

这样一来，群体智能体赋能了汽车行业中完整的营销场景，可以大大实现企业的降本增效。

吴恩达预言成真？这群AI「员工」狂卷KPI

智能体生态建设

但若要汽车行业实现智能最大化，仅靠一个企业是无法完成的，而需要多方团结协作。

也就是说，我们需要搭建一个「群体智能协作平台」。

这是汽车行业实现「组织孪生」的载体。

其将通用大模型、行业工具、行业解决方案、行业数据伙伴串联在一起，实现技术和能力互补。

吴恩达预言成真？这群AI「员工」狂卷KPI

那么，在这个群体智能体生态中，车企们如何去选择通用大模型，获取行业数据，如何应用行业工具？

当前，通用大模型遍地都是，难就难在该用哪个？哪个适合自己？

对于企业来说，选择大模型往往需要考虑以下一些因素，包括能否匹配特定需求，集成和兼容问题，成本效率，定制化和可扩展能力等等。

选好大模型，下一个问题便是数据处理和获取问题。

汽车行业中，制造商、供应商、维修服务商之间数据共享不足，导致无法形成完整的数据周期。

吴恩达预言成真？这群AI「员工」狂卷KPI

甚至，数据的准确性、合规性、隐私性都是亟待解决的问题

此外，接入行业工具是群体智能技术最重要的一个环节。

汽车行业中的技术工具依然存在API开放性差、安全性差等问题。对此，急需建立一个完善的API开放机制，以及使用规范。

除了技术项的问题，还需要企业对汽车行业业务流程市场环境，以及客户需求有着深入分析。

若想攻克这些难题，实现汽车行业的组织孪生，需要全体生态伙伴不断进步与持续合作。

三巨头强强联合

有了以上对汽车行业的深刻洞察，清华自然语言处理实验室、易慧智能、面壁智能三方共同发布了《大模型驱动的汽车行业群体智能技术白皮书》，受到业内广泛关注。

有趣的是，不仅易慧智能总裁李伟毕业于清华大学自然语言处理实验室，在智能体技术领先的面壁智能也正是由清华孵化的AI公司。作为国内最早研究NLP和大模型的研究团队之一，它的影响力可见一斑。

与此同时，他们在理论和实践上也正巧能力互补。

清华自然语言处理实验室希望进行技术转化；面壁希望大模型和智能体的方案进入更多行业；易慧智能则希望技术与行业场景结合，产生更多客户价值。

于是，一拍即合，决定开启合作。

吴恩达预言成真？这群AI「员工」狂卷KPI

由此缔造的大模型驱动群体智能协同工作平台，无疑会将企业级AI应用和生态建设带到新的水平，帮企业智能化升级最后一公里。

在这个过程中，三方也是携手攻克了重重难关。

最显而易见的一个难题就是：大模型的幻觉问题，在智能体的应用实践中该怎样避免呢？

吴恩达预言成真？这群AI「员工」狂卷KPI

来自：「Siren’s Song in the AI Ocean: A Survey on Hallucination in Large Language Models」

攻克重重难关

这个问题难以避免，但还是有对应的解决之道。

在这方面，清华大学教授刘知远和面壁智能联创李大海都有着丰富的经验。

首先是从模型自身的层面：

比如可以通过预训练和微调，来给模型注入领域知识，从而进行控制。

其次是在Agent的设计上：

在调用工具时，如果发现API或URL是来自幻觉，就中断执行；
设计反思机制，让模型根据出错的信息自行修正结果；
借助外部知识，通过搜索引擎或知识库，引入正确的上下文。

吴恩达预言成真？这群AI「员工」狂卷KPI

当然，具体落地过程中，还会有其他问题。

如果智能体之间依赖自然语言交互，交互过程就容易失控，这时就需要设计协议或给定workflow，通过Function call等方式指定输出形式。

多智能体系统成本太高，太耗费token怎么办呢？

吴恩达预言成真？这群AI「员工」狂卷KPI

这时，就需要综合比较workflow设计的灵活性、RAG还是微调模型、各个环节采用什么模型，并且在工程和推理中有更多策略设计。

此外，由于目前的大模型还是黑箱，最终效果难以达到预期时，还需要从算法策略上来调优，而这，就到了考验团队能力和沉淀经验的时候。

业内首份白皮书重磅发布

如今白皮书的发布，对汽车产业的智能化进程，无疑具有重大的指导价值。

对学界而言，白皮书对「大语言模型」「单体智能」「群体智能」等关键技术专题进行了深入、系统的总结和梳理，并且做了案例分析，将对相关研究提供有益参考。

它总结和展望了大模型群体智能在汽车营销领域的应用，这将对汽车行业的智能化转型意义深远。

对于业界而言，它更是首次提出了汽车营销领域的AgentVerse群体智能协同框架。从此，大模型场景化落地便有了标杆。

而这种「人机协作」的新理念，也将人的创意与大模型结合了起来。

吴恩达预言成真？这群AI「员工」狂卷KPI

对此，三方也非常期待，通过白皮书与业界同仁共同探索和实践，将大模型群体智能的潜力转为现实。

清华大学刘知远教授认为，「我们正步入一个由大模型驱动的「Internet of Agents」智联网时代」。通过白皮书，LLM群体智能的潜力将转化成现实，一同推动汽车行业迎接智能化的挑战和机遇。

面壁智能联创李大海同样看好三方的协力合作：「通过打造的智能体协同平台，为车企们提供群体智能与组织孪生的一站式解决方案」。

在易慧智能总裁李伟的畅想中，在20年后，自动驾驶一定已经走入我们的生活，我们的出行不再需要司机，而是虚拟个人助理和虚拟数字员工团队。

而100年后的某一天，我们大概已经进入「虚拟时代」。那时的人们不会再依赖于出行，而是「身未动，心已远」。

文章来自微信公众号“新智元”，作者：新智元编辑部

吴恩达预言成真？这群AI「员工」狂卷KPI

关键词: 吴恩达 , AI , AI工程师 , AI编程 , AI员工

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。
项目地址：https://github.com/labring/FastGPT

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales