# 热门搜索 #
搜索
吴恩达预言成真?这群AI「员工」狂卷KPI
6626点击    2024-04-13 17:51

最近,一大波智能体的应用诞生,让全行业看到了「新大陆」。


号称世界首个AI工程师Devin,7×24小时不限时打工,能够debug、训模型、构建部署应用程序,胜任各种代码任务。


几天前的谷歌Next大会上,还发布了「智能体构建器」,可以让每个人能够用自然语言构建自己的Agent。

不难看出,智能体不仅将会成为人人可触及的一项技术,而且各行各业都将被不断升级迭代的智能体重塑。


甚至,这场AI技术+场景的爆发,还会诞生出一些「前无古人」的东西。


用大模型+智能体,对抗汽车行业内卷


如今的汽车行业,已经卷到超乎想象的程度。


用户需求的多样化,愈发丰富的触点,都需要业内人士时时翻出创新的水花。


幸运的是,飞速发展的LLM,让任何全新的视角都有了可能。

就拿一辆车的获客场景来说吧。


如今的新媒体,已经成为营销过程中的重要一环。


谁能拥有优质内容,就会拥有最大的曝光度,完成奇迹般的获客KPI。


要知道,传统的4S店,并没有专业的创意内容生产团队,视频制作、账号运营,经常都是销售人员和市场经理兼职完成,效率非常低下。


而这时,就需要非常擅长输出高质量视频、图文、海报的AI登场了!

为此,易慧智能联合推出提出了一个全新的群体智能组织孪生方案。


人类主管来定目标、审结果,而其余的活儿,包括任务分解、任务执行、任务复盘,都可以通通交给智能体!

比如,现在我们要为一个账户定个KPI:一周内涨粉500人。


目标输入系统后,智能体们就开始忙活了。

第一步,运营经理Agent会给自己的AI「同事」们进行任务拆解——


1. 我们本周需要策划2场直播,把品牌信息传播出去,还要和用户好好互动。


2. 我们需要在抖音、快手、小红书发布5个短视频,提升品牌影响力。


3. 还要保持平台账号的活跃度,及时回复用户评论,增加他们的参与感。


「领命」后,文案策划师Agent和海报设计师Agent,会基于品牌价值观,制作出吸引眼球的文案和海报,同时还会负责传递和交付。


随后,运营专员Agent,就会把内容分发至各个平台了。


在这个过程中,唯一涉及人类的环节,就是市场部经理需要对内容进行人工确认,确保品牌形象的一致性和专业性。


活动结束后,运营经理Agent还会整体来个复盘。它会仔细分析数据,确保创意能带来实际的营销效果,为后续的内容和用户运营提供数据支持。


吴恩达看好的智能体,或许已实现GPT-5


说到智能体,就不得不提到AI大牛吴恩达,最近可谓是多次公开表示非常看好它们的发展:


AI Agent工作流将在今年取得重大进步,甚至可能超越下一代「基础模型」。

他发现,基于GPT-3.5的智能体工作流在应用中,实力超越了GPT-4。


也就是,可能我们早就提前到达了GPT-5,因为在GPT-4之上构建的智能体可以实现性能跃阶。

能够取得碾压大模型惊艳效果的智能体,有四种常见的设计模式,即自我反思、工具使用、规划,以及多智能体协作。

智能体关键组件框架|来源:OpenAI科学家Lilian Wang


大模型群体智能


其中的多智能体协作,其实对我们来说并不陌生。


比如斯坦福西部小镇SmallVille,就是基于层次规划的智能体社会小镇,来实现对人类社群行为的可信模拟。


除此之外,清华自然语言处理实验室和面壁智能共同提出的ChatDev,则是基于语言交互的智能体软件开发,实现群体交互协作式任务完成。

对此,吴恩达表示:「让多个协作智能体辩论协作,要比单独使用一个智能体,可以取得更好的性能。」

不仅如此,大量的研究和实践也提到,多个智能体之间可以通过彼此交流、分享信息和策略,甚至进行「辩论」来找到更优、更有效的解决方案。


如今,一场大模型+智能体应用狂潮,即将在汽车这一垂直领域中率先爆发。


车企大模型落地新范式:组织孪生


2023年,易慧智能在走访调研了大量汽车客户后,发现了诸多痛点。比如,行业竞争白热化,降本增效压力巨大;用户媒介触点多样化;购买周期长期化等等。


与此同时,想要在这一领域直接落地传统的大模型应用,则不得不面对信息孤岛、流程复杂、成本控制和市场响应速度等难题。


而前文提到的「群体智能」,恰恰可以利用自身强大的智能协作和信息共享能力,来解决这些问题。

如今,一种基于AI Agent和群体智能技术的全新范式——「组织孪生」正在诞生。


它以数字创新为核心技术框架,主要包含了三个部分:岗位孪生、架构孪生、业务孪生。


更直白地讲,智能体贯穿到了企业整个组织工作流中。

岗位孪生


其中,数字员工是岗位孪生最直接的表现形式。


数字员工可以直接应用到行业链中,比如常见的客户服务、电话销售等等。


利用LLM创建的数字员工,能够模拟真人的交流方式,不仅包括声音、表情,还具备了高情商的智能。


我们都知道,数字员工最大的亮点便是,「工作」不限地点时间,7×24全天候提供及时、高效的服务。


凭借智能体技术,数字虚拟人可以持续学习和进化,能够具备执行任务深度反思的能力,实现在技术和服务水平上不断提升。


除此以外,数字员工可以根据企业需求,进行个性化高度定制。


架构孪生


如上,岗位孪生可以简单理解为,智能体个体在执行自己流程中的任务。


但是,如同人类协作一样,有些任务非一己之力所为,而是需要群体智能体去完成。


这时候,「架构孪生」就上场了。

它是指将真实世界中的组织架构映射到数字世界中,通过智能体网络技术定义智能体间的交流和逻辑。


举个简单例子,清华自然语言处理实验室和面壁智能联合开发的智能体平台AgentVerse中,就可以利用基础模型定制多智能体环境,以及创建刚刚提到的这些具有不同能力与身份的智能体。


其中,协同决策是最重要的一环,需要智能体之间密切交流。


AgentVerse横向沟通模型侧重的是智能体之间相互理解和协作,而纵向沟通更侧重于职责分工。


而基于易慧智能的每个单独场景,智能体之间可以实现横向和纵向沟通。

业务孪生


此外,在汽车行业中,真实的业务流程非常复杂。


就拿出差任务来说,从申请、行程安排、车票酒店预订,到事后报销等等,都需要调配大量人力物力资源。


通过整合大模型、搜索增强(RAG)、智能体构建等技术,业务孪生可实现自动执行任务,优化执行效果。


举个例子,面壁智能的AI智能体框架XAgent创新性引入了「双循环机制」。


在外循环中,XAgent对任务进行规划,在内循环,它便成为任务高效执行者。

另外,XAgent在设计过程中,还引入了专为增强人机协作的交互机制。


可见,这一框架能够为复杂的行业场景,提供一个全新数字化工作和管理方式。


LLM群体智能赋能汽车行业


有了组织孪生新范式,LLM群体智能究竟如何在汽车行业应用中发挥最大效益?


不如就拿车企营销中五大核心场景来举例。


营销五大场景


作为消费领域超级大单品,汽车的营销有着其它消费品难以企及的销售难度和销售周期。


汽车销售中最具独特地方在于,高客单价、低成交率,以及长销售生命周期。


目前,为了应对营销场景中许多困难,提高销量,汽车营销场景也积累了一套标准化、全闭环的方法论。

针对汽车营销环节长久积累的应用实践痛点,以及结合对智能体应用落地的独到理解,易慧智能基于汽车营销的核心场景增长需求,联合推出了五大场景营销解决方案。


它们分别是数智研究院场景解决方案、新媒体运营场景解决方案、用户运营场景解决方案、集约DDC场景解决方案、與情运营场景解决方案。


并且,通过群体智能技术实现汽车营销业务的组织孪生,提高行业效能。

- 集约DDC场景解决方案


汽车营销中,常见的一种模式是DCC,也就是外呼邀约客户。


它对外呼专员的工作繁琐程度、沟通能力要求多且繁杂,成为制约获客转化效率的痛点和难点。


通过对呼叫中心客服进行的组织孪生,利用LLM可以提供及时反馈能力,提升转化效率。


- 用户运营场景解决方案


同时,培育和孵化潜在客户也是一个复杂,但至关重要的环节。


利用群体智能体,可以极大地释放销售人员的客户培育的压力,提高了销售环节转换效率。

比如,在新客孵化过程中,客户分析智能体可以对客户信息的要素进行更加细致地筛选,最终产出值得孵化的客户名单。

- 数智研究院场景解决方案


消费者需求分析,竞品分析报告对于改善运营效率,优化销售和售后流程有着重要的意义。


这时据数智研究院,便可以代替人类去完成某些繁琐任务。


其间,智能体会自动收集全网数据,并对数据进行高效治理和分析,大幅缩短报告生成时间,提高了时效性和准确性。

- 舆情运营场景解决方案


除此以外,舆情对品牌形象和产品销售有着重要的影响。


有了群体智能体,一旦检测到潜在负面舆情,数字员工会直接拉群,立即通知其他员工,一起协作完成难题。


这样一来,群体智能体赋能了汽车行业中完整的营销场景,可以大大实现企业的降本增效。

智能体生态建设


但若要汽车行业实现智能最大化,仅靠一个企业是无法完成的,而需要多方团结协作。


也就是说,我们需要搭建一个「群体智能协作平台」。


这是汽车行业实现「组织孪生」的载体。


其将通用大模型、行业工具、行业解决方案、行业数据伙伴串联在一起,实现技术和能力互补。

那么,在这个群体智能体生态中,车企们如何去选择通用大模型,获取行业数据,如何应用行业工具?


当前,通用大模型遍地都是,难就难在该用哪个?哪个适合自己?


对于企业来说,选择大模型往往需要考虑以下一些因素,包括能否匹配特定需求,集成和兼容问题,成本效率,定制化和可扩展能力等等。


选好大模型,下一个问题便是数据处理和获取问题。


汽车行业中,制造商、供应商、维修服务商之间数据共享不足,导致无法形成完整的数据周期。

甚至,数据的准确性、合规性、隐私性都是亟待解决的问题


此外,接入行业工具是群体智能技术最重要的一个环节。


汽车行业中的技术工具依然存在API开放性差、安全性差等问题。对此,急需建立一个完善的API开放机制,以及使用规范。


除了技术项的问题,还需要企业对汽车行业业务流程市场环境,以及客户需求有着深入分析。


若想攻克这些难题,实现汽车行业的组织孪生,需要全体生态伙伴不断进步与持续合作。


三巨头强强联合



有了以上对汽车行业的深刻洞察,清华自然语言处理实验室、易慧智能、面壁智能三方共同发布了《大模型驱动的汽车行业群体智能技术白皮书》,受到业内广泛关注。


有趣的是,不仅易慧智能总裁李伟毕业于清华大学自然语言处理实验室,在智能体技术领先的面壁智能也正是由清华孵化的AI公司。作为国内最早研究NLP和大模型的研究团队之一,它的影响力可见一斑。


与此同时,他们在理论和实践上也正巧能力互补。


清华自然语言处理实验室希望进行技术转化;面壁希望大模型和智能体的方案进入更多行业;易慧智能则希望技术与行业场景结合,产生更多客户价值。


于是,一拍即合,决定开启合作。


由此缔造的大模型驱动群体智能协同工作平台,无疑会将企业级AI应用和生态建设带到新的水平,帮企业智能化升级最后一公里。


在这个过程中,三方也是携手攻克了重重难关。


最显而易见的一个难题就是:大模型的幻觉问题,在智能体的应用实践中该怎样避免呢?

来自:「Siren’s Song in the AI Ocean: A Survey on Hallucination in Large Language Models」


攻克重重难关


这个问题难以避免,但还是有对应的解决之道。


在这方面,清华大学教授刘知远和面壁智能联创李大海都有着丰富的经验。


首先是从模型自身的层面:


比如可以通过预训练和微调,来给模型注入领域知识,从而进行控制。


其次是在Agent的设计上:


  1. 在调用工具时,如果发现API或URL是来自幻觉,就中断执行;
  2. 设计反思机制,让模型根据出错的信息自行修正结果;
  3. 借助外部知识,通过搜索引擎或知识库,引入正确的上下文。

当然,具体落地过程中,还会有其他问题。


如果智能体之间依赖自然语言交互,交互过程就容易失控,这时就需要设计协议或给定workflow,通过Function call等方式指定输出形式。


多智能体系统成本太高,太耗费token怎么办呢?

这时,就需要综合比较workflow设计的灵活性、RAG还是微调模型、各个环节采用什么模型,并且在工程和推理中有更多策略设计。


此外,由于目前的大模型还是黑箱,最终效果难以达到预期时,还需要从算法策略上来调优,而这,就到了考验团队能力和沉淀经验的时候。


业内首份白皮书重磅发布


如今白皮书的发布,对汽车产业的智能化进程,无疑具有重大的指导价值。


对学界而言,白皮书对「大语言模型」「单体智能」「群体智能」等关键技术专题进行了深入、系统的总结和梳理,并且做了案例分析,将对相关研究提供有益参考。


它总结和展望了大模型群体智能在汽车营销领域的应用,这将对汽车行业的智能化转型意义深远。


对于业界而言,它更是首次提出了汽车营销领域的AgentVerse群体智能协同框架。从此,大模型场景化落地便有了标杆。


而这种「人机协作」的新理念,也将人的创意与大模型结合了起来。

对此,三方也非常期待,通过白皮书与业界同仁共同探索和实践,将大模型群体智能的潜力转为现实。


清华大学刘知远教授认为,「我们正步入一个由大模型驱动的「Internet of Agents」智联网时代」。通过白皮书,LLM群体智能的潜力将转化成现实,一同推动汽车行业迎接智能化的挑战和机遇。


面壁智能联创李大海同样看好三方的协力合作:「通过打造的智能体协同平台,为车企们提供群体智能与组织孪生的一站式解决方案」。


在易慧智能总裁李伟的畅想中,在20年后,自动驾驶一定已经走入我们的生活,我们的出行不再需要司机,而是虚拟个人助理和虚拟数字员工团队。


而100年后的某一天,我们大概已经进入「虚拟时代」。那时的人们不会再依赖于出行,而是「身未动,心已远」。


文章来自微信公众号“新智元”,作者:新智元编辑部

AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

4
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

5
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

6
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

7
无人直播

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales