ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
深度 | AI 智能体赛道持续升温,Super Agent还有多远?
3937点击    2024-10-26 13:26

2024 年是 AI Agent 的发展元年,多位科技巨头曾在公开演讲中表示 AI Agent 是 AI 应用的重要落地方向。


用吴恩达老师的话来说:“AI 智能体将在今年推动 AI 领域的巨大进步——甚至可能比下一代基础模型的影响还要大。这是一个重要的趋势,我敦促所有从事 AI 工作的人都关注它。”


本篇文章中,我们将一起探讨 AI 智能体的发展趋势、目前阶段,解析未来的 Super Agent的落地方向。尽管目前 AI Agent 技术尚未完全成熟,但它们在提高工作效率、个性化服务以及专业领域应用上的潜力已经初露端倪。


01.

AI Agent是AI时代的APP


比尔盖茨曾在他的官方博客中预言,在不久的将来,任何上网的人都能拥有一个远超今天技术水平的人工智能助手(Personal Assistant Powered by Artificial Intelligence),它将彻底改变我们的生活方式。


类比于接入手足的 LLM(语言大模型),AI Agent有记忆、规划、行动、和使用工具的能力。


它不仅能够执行复杂的跨应用任务,还能进行细致入微的对话,理解用户的意图和行为模式。它们的主动性体现在能够预测用户需求并提供建议,而不仅仅是被动响应。随着使用,AI Agent会不断学习和改进,适应用户的独特需求。


AI Agent原理图


目前,AI行业已经达成普遍共识:智能体是 AI 时代的 APP。


随着语言大模型 token 成本的减少和 AI Agent 搭建门槛的降低,“人人都可以一句话搭建自己的AI智能体” 的 Agent 时代逐渐来临。


根据百度 CEO 李彦宏的预测,人工智能领域将迎来一个重要的转变,即 AI 智能体将会大量出现、形成生态。


在各行各业、各个领域都会依据自己具体的场景,根据自己特有的经验、规则、数据,做出来这些智能体。最终,AI智能体的数量可能会比人类还多,人们能以不同的方式与之互动。


02.

AI Agent 目前的阶段


目前,AI Agent 领域的竞争已经进入白热化阶段,各大科技公司都在积极探索其潜力。


微软推出了“Copilot”项目,旨在通过自动化技术帮助企业提升客户服务和管理任务的效率。Anthropic 则发布了其人工智能聊天机器人Claude的新功能,允许用户创建个性化的“人工智能助手”。


OpenAI 将 AI Agent 视为实现 AGI(通用人工智能)的五级方法中的第二级,显示出其在 AI 发展历程中的重要地位。近日,OpenAI 推出了 Canvas,正式下场做 Agent 产品,利用 AI 重塑创作体验,收获好评无数。


Canvas界面:用于与 ChatGPT 合作编写或编码项目


VC (风险投资)也正在涌入智能体初创公司,这些公司承诺将彻底改变人与技术的互动方式。AI Agent 赛道成为风投资金最活跃的方向。


AGI 的终极目标是创造一个真正的合作伙伴,而不仅仅是一个 AI 工具。自 20 世纪 70 年代以来,科技公司一直在尝试实现个人工作的自动化,而现在,AI Agent正逐步接近这一目标。


B 端企业希望通过 Agent 处理从客户服务到数据分析的所有事务,从而实现效率的飞跃。对于 C 端个人而言,人工智能公司正在开创一个生产力的新时代,在这个时代,常规任务的自动化将释放出更多时间,让人们专注于创造性和战略性工作。


我们见证了许多有趣的 AI Agent 应用逐渐成为现实,目前刷屏朋友圈的智能体热点已成为趋势。


例如,作为辅助工具型的AI Agent,Cursor 能够让完全不会代码的小白用户在数分钟内手搓代码,并实现落地应用。


最典型的使用案例就是 Cursor 创始人的女儿在该智能体的帮助下,仅用 8 分钟就创建了个人网站。过程仅需用自然语言描述自己的需求,Cursor 就能直接生成代码并一键实现,这一用例迅速在网络上走红。


( Cursor Demo 观看地址:https://www.youtube.com/watch?v=o5uvDZ8srHA)


还有娱乐型的 AI Agent,如文心智能体平台上的“躺平之城推荐官”。这款智能体能够基于大数据和AI,帮助当代 45° 躺平青年发现最适合自己的躺平城市。


比如,在对话框内输入:哪个城市最具性价比,该款智能体便自动帮我计算各个城市的综合得分,并给出了答案:鹤岗。


它还详细地给出了关于鹤岗这座城市在房价、成本、气候等各个维度的评分。


(“躺平之城推荐官”体验地址:https://agents.baidu.com/center/agent/preview/04HOPSY3WXIzsFHbm6M2IGBMcNxWftrm )


03.

为什么Super Agent尚未出现?


尽管 AI 智能体赛道已经鸣枪开跑,如火如荼的探索热潮之下,Super Agents 仍未出现。


Sam Altman 曾将 Super AI Agents 描述为“超级能干的同事“,他憧憬着:“你真正想要的就是这个能帮你的东西。它完全了解我的一生、每封电子邮件、我曾经进行过的每一次对话,但又不觉得是它的简单延伸。它可以立即处理简单的任务,对于更复杂的任务,它会尝试执行,但如果需要,它会返回问题。”


现实却不如理想中的美好。AI Agents 虽然容易想象,但实现起来却困难重重,AI Agents 的杀手级应用还在不确定的未来。


Super Agent 的瓶颈之一在于目前的 LLM (大语言模型)缺乏足够的长尾推理能力而稍显笨拙,无法在没有人工介入的情况下真正解决复杂、高风险的问题。此外,大模型的幻觉问题仍然不容小觑,难以严格遵循指令,容易带来一系列安全隐患。


当然,这种情况会随着新模型的出现而在未来有所改变,但我们也可能需要将 Agent 的规划能力转移到不受 LLM 控制的更具确定性的系统。


除了大模型的能力限制之外,另一个挑战是场景的挖掘。


落地容易,爆款难出,AI Agent 赛道拥挤,各类智能体应用功能同质化严重。


要让 AI 智能体真正用起来,实现商业变现,如同拿着锤子找钉子,需要找到各个垂类场景下合适的锚点。


“AI 教母”李飞飞也曾强调:AI Agent 的用武之地可能在各个行业的垂直领域。因为在各个传统行业,有大量的专业场景、数据、经验没有被挖掘,特别是专业壁垒高的行业如医疗、法律、建筑等。


例如,文心智能体平台上的这款“武守恭医生的 AI 分身”,专注于提供中医和儿科领域的专业知识。它收录了武守恭医生 40 年的临床专业知识。患者可以针对日常生活中遇到的常见病症,对该款 AI 智能体进行咨询。


只要输入对病情相关的描述,便可以快速获得在相关领域的专业指导,切实地解决了病人看病难、不方便的问题。


(“武守恭医生智能体”体验地址:https://agents.baidu.com/center/agent/preview/pFCFkkzaEkedOQflo7WVSRZSMVDHY70q )


未来,通用型 AI Agents 会逐渐走向细分专业化。专业化的 AI Agents 能够更精准地解决特定领域的问题,提供更高效的服务。


04.

结语


Open AI 新任首席产品官 Kevin Weil 在新闻发布会上表示:“我坚信 2025 年将是 AI 智能体真正进入主流的一年。如果我们能够正确地引导这一进程,它将引领我们进入一个全新的世界,在这个世界里,我们可以将更多的时间投入到真正重要的事情上。”


在接下来的几年里,我们可能会见证人工智能从那些过于膨胀的期望中回归,转向更加脚踏实地的应用领域。


这并不是说人工智能的创新步伐会有所减缓,相反,我们将看到更多专注于解决实际问题并带来实实在在益处的人工智能解决方案的涌现。


随着技术的不断进步,AI 智能体的工作流程已经开始从一种新奇的“玩具”阶段,逐步过渡到真正的务实阶段。未来,它们必将为开发者带来前所未有的高效创新体验,让我们拭目以待。


参考材料


https://www.gatesnotes.com/AI-agents


https://app.xinhuanet.com/news/article.html?articleId=d6c5df11a519a2998207adc8754c69eb


文章来自于微信公众号“深思SenseAI”,作者“SenseAI”


关键词: AI , Agent , 智能体 , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md