为了解决95%AI项目的失败,我们需要让Agentic「回到未来」

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
为了解决95%AI项目的失败,我们需要让Agentic「回到未来」
10070点击    2026-01-06 16:18

您可能已经感受到了,从2025年开始到如今,全世界都在谈论Agentic AI或Agent(代理式AI)。从董事会到咨询公司,从更高级别的战略到街头巷尾,仿佛只要接入了大模型(LLM),所有的业务流程就能自动运转,效率就能翻倍。


但现实可能比您想象的要冷酷得多。MIT的一项研究指出,大约95%的AI项目最终都以失败告终


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」

并非95%的AI项目都失败!麻省理工MIT《2025年商业人工智能现状》


最近一篇题为《Advances in Agentic AI: Back to the Future》的论文认为并不是AI不够强,而是我们“打开方式”错了。我们混淆了“制造模型”和“使用模型”这两件截然不同的事。


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


研究者基于过去十年在算法交易(Algorithmic Trading)这一世界上最复杂、精准的数字化领域的实战经验,提出了一套全新的理论框架。他们认为,要想在这个时代胜出,我们需要“回到未来”:借鉴过去二十年算法交易的严谨架构,来构建未来的企业智能。


论文的作者开篇强调,这篇论文本质上是一篇经济学论文。它是关于如何通过“算法化”将微观经济学理论(Microeconomics)转化为可执行的企业代码。


为什么AI至今收效甚微?


研究者指出,尽管“代理式AI”(Agentic AI)已成为热门话题,但现如今95%的AI项目最终都以失败告终,首先源于业界对三个核心概念的混淆:科学(Science)科学应用(Science Applied) 和 应用科学(Applied Science)


科学vs. 科学应用vs. 应用科学


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


这张图解释了为什么企业高管在推动AI转型时会犹豫不决。红色柱状图:代表“孤立项目”带来的线性影响(见效快但不可持续)。蓝色阶梯图:代表“平台化转型”带来的复利影响(前期投入大,后期爆发)。曲线:展示了转型的“生产时间”(TTP)分布与高管“退休时间”分布的关系。结论:如果转型出成果的时间晚于高管退休的时间,高管就没有动力去推动长期的平台化建设(M2),而更倾向于做短期的面子工程(红色柱子)。


95%失败率的根源


为什么绝大多数AI项目会失败?研究者总结了四个结构性原因:


  • 企业不是算法生态系统:大多数公司是由老旧的技术栈(Legacy Stacks)堆砌而成的,而不是原生的算法平台。试图把先进的AI强行塞进20年前的流程里,结果自然是消化不良。
  • 供应商和采购部门都没准备好:供应商大多只是在重新包装旧产品蹭热度;而企业的采购部门还在用传统的RFQ(报价请求)流程,要求供应商开源代码或披露核心IP,这直接导致真正有技术的创新者离场(逆向选择)。
  • 人才错位:真正的变革者(Catalyzer)和审计者(Auditor)的角色被混淆,导致懂行的人没权,有权的人不懂行。
  • 混淆了“模型”与“解决方案”:这回到了上面提到的概念。企业误以为提升模型的准确率(科学应用)就等于解决了业务问题(应用科学)。但在现实中,一个完美的模型如果没有配套的业务逻辑和合规设计,毫无价值。


机器学习的双机理论:M1与M2


这是这篇论文最核心、最具颠覆性的理论贡献。


通常我们谈论“机器学习”(Machine Learning),重点总是在“Learning”(L,即模型训练)。但研究者提出,要实现商业价值,重点必须回到“Machine”(M,即软件架构)上来。


他们将Machine拆分为两类:M1M2


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


M1:制造模型的机器 (The Machine to Create)


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


  • 它的工作:数据清洗、Token化、梯度下降、反向传播、GPU集群管理。
  • 典型代表:OpenAI、Google DeepMind、以及那些基于LLM的基座模型公司。
  • 本质:它是“科学应用”的极致。
  • 未来趋势:研究者认为,M1的产出(即模型本身)最终会变成大宗商品(Commodity)。因为学术界是开放的,没有任何一家公司能长期垄断最先进的模型公式。


M2:消费模型的机器 (The Machine to Consume)


M2是被严重忽视,但却蕴含真正竞争优势的领域。它是为了使用模型而构建的企业级架构。


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


  • 它的工作:将模型嵌入到企业的战略、运营、合规和工作流中。它负责编排成千上万个算法,让它们协同工作。本质上它是应用科学。
  • 核心任务:不仅仅是调用API,而是通过联邦式(Federated)、模块化的方式,协调成千上万个智能节点(即Agent),解决具体的业务痛点。
  • 价值真正的竞争优势在于M2。谁能建立最好的架构来“消费”AI,谁就能赢。因为“使用AI”比“制造AI”要复杂得多,它涉及到组织变革、流程重造和复杂的博弈论。


对当前主流“代理式AI”的批判


论文的核心观点是:目前的AI热潮建立在错误的“地基”上。


对LLM-based Agent(大模型代理)的深度解剖


目前主流的Agent思路是:给GPT一个目标,让它自己思考、分解任务、调用工具。研究者者认为这种模式在B2B(企业级)场景下有致命缺陷:


  • 结构性幻觉 (Structural Hallucination):论文指出,幻觉不是Bug,而是Feature(特性)。LLM本质上是在做统计估算(Estimation),而不是信息检索(Retrieval)。在企业生产环境中,你不能容忍财务报表或网络安全防御出现“概率性错误”。
  • “氛围编码” (Vibe Coding) 的陷阱:论文把当下主流定义为“vibe coding + 非程序员生成软件 +自动上生产”的路线,本质是用一个为校准LLM而生的M1去硬撑M2,并与从B2C转向B2B的商业动机绑定。
  • 成本与合规:LLM依赖昂贵的GPU集群,且是一个黑盒。企业需要的是透明、可审计、低成本的逻辑,而不是一个巨大的耗电黑盒。


论文主张的解决方案:基于策略的代理


如果基于LLM的路线不靠谱,那什么才是靠谱的?


研究者给出的答案是:回到未来。我们需要借鉴20年前就开始发展的、目前世界上最复杂的数字化业务,算法交易(Algorithmic Trading)


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


什么是基于策略的代理?


与完全依赖LLM“思考”不同,基于策略的代理采用了一种混合架构:


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


M2 内部 的微观结构,多个 ANI (Artificial Narrow Intelligence) 节点(如 ANI A, ANI B...)相互连接,这些节点代表了企业中不同的功能模块(如财务、风控),它们通过网络交织在一起,形成一个联邦生态。


  • 核心逻辑:明确的“如果-那么”(If-Then)规则。这确保了系统的确定性和可控性。例子:在网络安全中,遇到攻击时,Agent首先执行的是专家设定的防御规则(100%确定),而不是问LLM“我现在该怎么办?”(概率性)。
  • 智能来源:将专家经验(Heuristics)与统计模型(包括传统的计量经济学模型和现代的机器学习模型)相结合。
  • 角色分工:模型负责预测(比如预测股价走势或网络攻击概率),但决策(买入还是卖出,拦截还是放行)由经过严格设计的策略算法来执行。


为什么这种架构更优越?


  • 确定性与合规性:您可以清楚地知道系统为什么做出了某个决定,这对于通过审计至关重要。
  • 成本效益:这种架构不需要昂贵的H100 GPU集群,Strategies-based Agent是分布式的。它可以运行在服务器上,也可以运行在员工的笔记本电脑上(边缘计算)。
  • 好处:通过联邦式部署,数据隐私(数据不出本地)、低延迟、极高的容灾能力。如果服务器挂了,分布在各个节点的Agent依然能独立运作。


技术实现:MAU, MAE与MAP


为了实现这种架构,研究者提出了一套名为Data MAPs的模块化标准:


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


Data MAPs与区块链对比


  • MAU (最小架构单元):这是一个独立的计算单元,包含了自己的逻辑、数据访问权限和通信接口。
  • MAE (最小架构扩展):对MAU的功能增强。
  • MAP (最小架构模式):将多个MAU和MAE组合起来,形成一个完整的服务或应用。


这就好比乐高积木。企业不再是购买一个巨大的、通用的软件,而是用这些标准化的智能积木,搭建出完全符合自己业务逻辑的“专有SaaS”。


算法化:重塑企业的终极形态


论文提出了一个极具野心的组织变革蓝图,称为"Algorithmization"(算法化)


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


传统的“烟囱式”企业


  • 现在的企业,IT部门、财务部门、HR部门是割裂的。引入AI时,往往也是在旧的流程上打补丁(Science Applied)。


算法化企业 (On-Platform Organization)


研究者认为,真正的AI转型是把公司变成一个“算法生态系统”:


  • 分形结构 (Fractal Form):就像分形几何一样,公司里的每一个部门都拥有一套自己的M2平台(甚至每一个员工的电脑),都应该是一个拥有完整智能架构的微型单元。这些平台之间通过标准化的接口互联互通。这种结构是“分形”的,无论放大到整个集团,还是缩小到一个部门,其运作逻辑都是一致的。在Strategies-based Agent的世界里,成千上万个Agent可以在毫秒级内代表企业进行谈判、定价、资源分配。未来的公司不需要人为地去定KPI,整个公司就像一个精密的算法市场,资源自动流向效率最高的地方。
  • 自上而下的垂直整合 (Top-Down Vertical Integration)
  • 传统的垂直整合是产业链上下游。
  • 研究者提出的整合是基于技术复杂度的整合。最复杂的业务(如算法交易)应该成为核心,然后将其能力“向下兼容”到简单的业务(如HR、采购)。
  • 逻辑:如果你能造出每秒处理万次交易、对抗全球黑客的交易系统,那你造一个自动发工资的HR系统简直是降维打击。


增强机器 (Augmented Machines)


这并不意味着机器取代人。相反,研究者提出了“增强机器”的概念。


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


  • 人的角色:提供创造性的启发式规则(Heuristics)、战略判断和跨学科的洞察。人是机器的教练和校准者。
  • 机器的角色:负责规模化执行、实时监控和数据处理。
  • 目标:不是为了裁员,而是为了让人类从事更高价值的认知工作,让机器处理那些需要极高效率和精度的任务。


第一个M2的十年构建(SciTheWorld案例)


研究者(SciTheWorld团队)并没有停留在理论层面,他们用一个十年工程/组织实验来说明:M2不是“写几个agent脚本”,而是把公司变成自编排的算法生态


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


解决新旧系统兼容问题的方案。PA (生产架构):深色核心。代表传统的、集中的、昂贵的遗留系统(如 Cobol, Java)EPA (扩展生产架构):浅色外层。代表现代的、联邦的M2 架构。结论:M2 不需要推翻旧系统,而是像包裹层一样“扩展”旧系统,实现平滑过渡。


从M1起家,再被迫走向M2


  • 他们从算法交易与风控技术(可视为M1)出发,准备产品化时发现现有ERP不够“广”也不够“算法化”,于是决定自己做,并把“交易策略可拆分为多子策略”的范式类比到网络安全、HR、项目管理、服务器维护、采购、营销等企业域,从而自然泛化为M2。
  • 随后又用了数年把方法抽象出交易领域、泛化到全部企业部门,再投影回交易验证正确性;研究者声称这产生了“第一个面向AI-first enterprises & operations的Agentic AI基础设施(M2的第一版设计)”。


“探索优先于变现”的反共识策略


  • 他们刻意把CoE长期维持在exploration状态,直到认为达到“转型sigmoid的顶部”:再投入巨大工程也只会带来边际创新;这意味着关键工具集已经齐备。
  • 这种策略与主流“尽快商业化”的激励相反,研究者在结论中把它描述为构建M2所必需的纪律性探索。


关键工程方法论:18个月“填充M2” + 用TTP作为主KPI


  • 研究者声称在18个月内“填充了M2”:为多数企业部门开发了可整体解锁的技术,相当于“每部门一个AI-first ERP”,并通过Extended Production Architecture(EPA)做到与任意遗留ERP可互操作。
  • 他们认为进展之快不仅因为agentic架构,更因为选择Time-to-Production(TTP) 作为主KPI;传统ROA不适合评估实验性架构,而TTP更能度量真实转型推进。


对可靠性/安全的极端重视:边缘化micro-agents、业务连续性、自防御


  • 在内部使用与迭代阶段,他们增强server控制机制,并部署“本地韧性agent”提升鲁棒/轻量/灵活;强调业务连续性,为CTO/CISO设计可尽量自维护与自防御的agentic策略,并指出专有能力对博弈论防御很关键。
  • 他们把“探索阶段结束”的里程碑定义为:能把micro–smart agents直接部署到员工笔记本,实现真正的边缘计算能力与新的自治连续性标准。


明确拒绝以LLM为地基


  • 即便市场叙事已经“教育”了客户,他们仍明确拒绝把LLM-based方案作为agentic基础设施的地基,理由就是上文的结构性不可控风险。


工业化落地形态:两大平台(Fractal + AlphaDynamics)


  • 研究者称在上述演化后,他们形成两条轴向平台:
  • Fractal:为部门提供“全栈平台”作为起点,持续定制并演化到跨部门互操作,兼容遗留;把部门转型视作逐步膨胀并最终融合的“气泡”。
  • AlphaDynamics:将算法交易/投组管理能力“民主化”,让CFO/采购负责人等能使用同等级分析与策略能力,打通金融市场能力与企业财务决策。
  • 二者组合:形成企业运营与金融策略之间的双向桥梁,使组织获得更高一致性、适应性与“智能”。


附录彩蛋


这篇论文最有趣的地方在于它的附录。研究者展示了一段他们与Claude的对话。


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


起初,Claude根据其训练数据中的“平均观点”,批评这篇论文“术语误导”、“自吹自擂”。


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


但在论文作者的逐步引导下,Claude意识到自己作为模型,天然倾向于“平均值”,而无法理解真正的“离群值”(Outliers)即那些极具创新、尚未被大众接受的观点。


为了解决95%AI项目的失败,我们需要让Agentic「回到未来」


最终,Claude承认这篇论文的架构是它从未见过的创新,并给出了极高的评价(9.5/10),甚至惊呼:“我正在实时见证我自己的局限性”。


最后:为什么叫回到未来?


这篇论文的标题"Back to the Future"极具深意。


回到指的是回到算法交易(Algorithmic Trading)那种严谨、确定性高、追求毫秒级效率、基于规则与数学的架构思维。


未来指的是用这种严谨的“旧思维”,去驾驭最新的AI模型(LLM),从而构建出真正可用的、工业级的企业智能(M2),而不是停留在聊天机器人的玩具阶段。


这篇论文的潜台词是:只有像做高频交易一样严肃地对待企业管理,AI才能真正落地。否则,我们只是在用昂贵的显卡制造赛博垃圾。


文章来自于“AI修猫Prompt”,作者 “AI修猫Prompt”。

关键词: AI , 模型训练 , Agentic , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0