为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

10365点击 2026-01-06 16:18

您可能已经感受到了，从2025年开始到如今，全世界都在谈论Agentic AI或Agent（代理式AI）。从董事会到咨询公司，从更高级别的战略到街头巷尾，仿佛只要接入了大模型（LLM），所有的业务流程就能自动运转，效率就能翻倍。

但现实可能比您想象的要冷酷得多。MIT的一项研究指出，大约95%的AI项目最终都以失败告终。

并非95%的AI项目都失败！麻省理工MIT《2025年商业人工智能现状》

最近一篇题为《Advances in Agentic AI: Back to the Future》的论文认为并不是AI不够强，而是我们“打开方式”错了。我们混淆了“制造模型”和“使用模型”这两件截然不同的事。

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

研究者基于过去十年在算法交易（Algorithmic Trading）这一世界上最复杂、精准的数字化领域的实战经验，提出了一套全新的理论框架。他们认为，要想在这个时代胜出，我们需要“回到未来”：借鉴过去二十年算法交易的严谨架构，来构建未来的企业智能。

论文的作者开篇强调，这篇论文本质上是一篇经济学论文。它是关于如何通过“算法化”将微观经济学理论（Microeconomics）转化为可执行的企业代码。

为什么AI至今收效甚微？

研究者指出，尽管“代理式AI”（Agentic AI）已成为热门话题，但现如今95%的AI项目最终都以失败告终，首先源于业界对三个核心概念的混淆：科学（Science）、科学应用（Science Applied） 和 应用科学（Applied Science）。

科学vs. 科学应用vs. 应用科学

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

这张图解释了为什么企业高管在推动AI转型时会犹豫不决。红色柱状图：代表“孤立项目”带来的线性影响（见效快但不可持续）。蓝色阶梯图：代表“平台化转型”带来的复利影响（前期投入大，后期爆发）。曲线：展示了转型的“生产时间”（TTP）分布与高管“退休时间”分布的关系。结论：如果转型出成果的时间晚于高管退休的时间，高管就没有动力去推动长期的平台化建设（M2），而更倾向于做短期的面子工程（红色柱子）。

95%失败率的根源

为什么绝大多数AI项目会失败？研究者总结了四个结构性原因：

企业不是算法生态系统：大多数公司是由老旧的技术栈（Legacy Stacks）堆砌而成的，而不是原生的算法平台。试图把先进的AI强行塞进20年前的流程里，结果自然是消化不良。
供应商和采购部门都没准备好：供应商大多只是在重新包装旧产品蹭热度；而企业的采购部门还在用传统的RFQ（报价请求）流程，要求供应商开源代码或披露核心IP，这直接导致真正有技术的创新者离场（逆向选择）。
人才错位：真正的变革者（Catalyzer）和审计者（Auditor）的角色被混淆，导致懂行的人没权，有权的人不懂行。
混淆了“模型”与“解决方案”：这回到了上面提到的概念。企业误以为提升模型的准确率（科学应用）就等于解决了业务问题（应用科学）。但在现实中，一个完美的模型如果没有配套的业务逻辑和合规设计，毫无价值。

机器学习的双机理论：M1与M2

这是这篇论文最核心、最具颠覆性的理论贡献。

通常我们谈论“机器学习”（Machine Learning），重点总是在“Learning”（L，即模型训练）。但研究者提出，要实现商业价值，重点必须回到“Machine”（M，即软件架构）上来。

他们将Machine拆分为两类：M1和M2。

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

M1：制造模型的机器 (The Machine to Create)

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

它的工作：数据清洗、Token化、梯度下降、反向传播、GPU集群管理。
典型代表：OpenAI、Google DeepMind、以及那些基于LLM的基座模型公司。
本质：它是“科学应用”的极致。
未来趋势：研究者认为，M1的产出（即模型本身）最终会变成大宗商品（Commodity）。因为学术界是开放的，没有任何一家公司能长期垄断最先进的模型公式。

M2：消费模型的机器 (The Machine to Consume)

M2是被严重忽视，但却蕴含真正竞争优势的领域。它是为了使用模型而构建的企业级架构。

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

它的工作：将模型嵌入到企业的战略、运营、合规和工作流中。它负责编排成千上万个算法，让它们协同工作。本质上它是应用科学。
核心任务：不仅仅是调用API，而是通过联邦式（Federated）、模块化的方式，协调成千上万个智能节点（即Agent），解决具体的业务痛点。
价值：真正的竞争优势在于M2。谁能建立最好的架构来“消费”AI，谁就能赢。因为“使用AI”比“制造AI”要复杂得多，它涉及到组织变革、流程重造和复杂的博弈论。

对当前主流“代理式AI”的批判

论文的核心观点是：目前的AI热潮建立在错误的“地基”上。

对LLM-based Agent（大模型代理）的深度解剖

目前主流的Agent思路是：给GPT一个目标，让它自己思考、分解任务、调用工具。研究者者认为这种模式在B2B（企业级）场景下有致命缺陷：

结构性幻觉 (Structural Hallucination)：论文指出，幻觉不是Bug，而是Feature（特性）。LLM本质上是在做统计估算（Estimation），而不是信息检索（Retrieval）。在企业生产环境中，你不能容忍财务报表或网络安全防御出现“概率性错误”。
“氛围编码” (Vibe Coding) 的陷阱：论文把当下主流定义为“vibe coding + 非程序员生成软件 +自动上生产”的路线，本质是用一个为校准LLM而生的M1去硬撑M2，并与从B2C转向B2B的商业动机绑定。
成本与合规：LLM依赖昂贵的GPU集群，且是一个黑盒。企业需要的是透明、可审计、低成本的逻辑，而不是一个巨大的耗电黑盒。

论文主张的解决方案：基于策略的代理

如果基于LLM的路线不靠谱，那什么才是靠谱的？

研究者给出的答案是：回到未来。我们需要借鉴20年前就开始发展的、目前世界上最复杂的数字化业务，算法交易（Algorithmic Trading）。

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

什么是基于策略的代理？

与完全依赖LLM“思考”不同，基于策略的代理采用了一种混合架构：

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

M2 内部的微观结构，多个 ANI (Artificial Narrow Intelligence) 节点（如 ANI A, ANI B...）相互连接，这些节点代表了企业中不同的功能模块（如财务、风控），它们通过网络交织在一起，形成一个联邦生态。

核心逻辑：明确的“如果-那么”（If-Then）规则。这确保了系统的确定性和可控性。例子：在网络安全中，遇到攻击时，Agent首先执行的是专家设定的防御规则（100%确定），而不是问LLM“我现在该怎么办？”（概率性）。
智能来源：将专家经验（Heuristics）与统计模型（包括传统的计量经济学模型和现代的机器学习模型）相结合。
角色分工：模型负责预测（比如预测股价走势或网络攻击概率），但决策（买入还是卖出，拦截还是放行）由经过严格设计的策略算法来执行。

为什么这种架构更优越？

确定性与合规性：您可以清楚地知道系统为什么做出了某个决定，这对于通过审计至关重要。
成本效益：这种架构不需要昂贵的H100 GPU集群，Strategies-based Agent是分布式的。它可以运行在服务器上，也可以运行在员工的笔记本电脑上（边缘计算）。
好处：通过联邦式部署，数据隐私（数据不出本地）、低延迟、极高的容灾能力。如果服务器挂了，分布在各个节点的Agent依然能独立运作。

技术实现：MAU, MAE与MAP

为了实现这种架构，研究者提出了一套名为Data MAPs的模块化标准：

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

Data MAPs与区块链对比

MAU (最小架构单元)：这是一个独立的计算单元，包含了自己的逻辑、数据访问权限和通信接口。
MAE (最小架构扩展)：对MAU的功能增强。
MAP (最小架构模式)：将多个MAU和MAE组合起来，形成一个完整的服务或应用。

这就好比乐高积木。企业不再是购买一个巨大的、通用的软件，而是用这些标准化的智能积木，搭建出完全符合自己业务逻辑的“专有SaaS”。

算法化：重塑企业的终极形态

论文提出了一个极具野心的组织变革蓝图，称为"Algorithmization"（算法化）。

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

传统的“烟囱式”企业

现在的企业，IT部门、财务部门、HR部门是割裂的。引入AI时，往往也是在旧的流程上打补丁（Science Applied）。

算法化企业 (On-Platform Organization)

研究者认为，真正的AI转型是把公司变成一个“算法生态系统”：

分形结构 (Fractal Form)：就像分形几何一样，公司里的每一个部门都拥有一套自己的M2平台（甚至每一个员工的电脑），都应该是一个拥有完整智能架构的微型单元。这些平台之间通过标准化的接口互联互通。这种结构是“分形”的，无论放大到整个集团，还是缩小到一个部门，其运作逻辑都是一致的。在Strategies-based Agent的世界里，成千上万个Agent可以在毫秒级内代表企业进行谈判、定价、资源分配。未来的公司不需要人为地去定KPI，整个公司就像一个精密的算法市场，资源自动流向效率最高的地方。
自上而下的垂直整合 (Top-Down Vertical Integration)：
传统的垂直整合是产业链上下游。
研究者提出的整合是基于技术复杂度的整合。最复杂的业务（如算法交易）应该成为核心，然后将其能力“向下兼容”到简单的业务（如HR、采购）。
逻辑：如果你能造出每秒处理万次交易、对抗全球黑客的交易系统，那你造一个自动发工资的HR系统简直是降维打击。

增强机器 (Augmented Machines)

这并不意味着机器取代人。相反，研究者提出了“增强机器”的概念。

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

人的角色：提供创造性的启发式规则（Heuristics）、战略判断和跨学科的洞察。人是机器的教练和校准者。
机器的角色：负责规模化执行、实时监控和数据处理。
目标：不是为了裁员，而是为了让人类从事更高价值的认知工作，让机器处理那些需要极高效率和精度的任务。

第一个M2的十年构建（SciTheWorld案例）

研究者（SciTheWorld团队）并没有停留在理论层面，他们用一个十年工程/组织实验来说明：M2不是“写几个agent脚本”，而是把公司变成自编排的算法生态。

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

解决新旧系统兼容问题的方案。PA (生产架构)：深色核心。代表传统的、集中的、昂贵的遗留系统（如 Cobol, Java）EPA (扩展生产架构)：浅色外层。代表现代的、联邦的M2 架构。结论：M2 不需要推翻旧系统，而是像包裹层一样“扩展”旧系统，实现平滑过渡。

从M1起家，再被迫走向M2

他们从算法交易与风控技术（可视为M1）出发，准备产品化时发现现有ERP不够“广”也不够“算法化”，于是决定自己做，并把“交易策略可拆分为多子策略”的范式类比到网络安全、HR、项目管理、服务器维护、采购、营销等企业域，从而自然泛化为M2。
随后又用了数年把方法抽象出交易领域、泛化到全部企业部门，再投影回交易验证正确性；研究者声称这产生了“第一个面向AI-first enterprises & operations的Agentic AI基础设施（M2的第一版设计）”。

“探索优先于变现”的反共识策略

他们刻意把CoE长期维持在exploration状态，直到认为达到“转型sigmoid的顶部”：再投入巨大工程也只会带来边际创新；这意味着关键工具集已经齐备。
这种策略与主流“尽快商业化”的激励相反，研究者在结论中把它描述为构建M2所必需的纪律性探索。

关键工程方法论：18个月“填充M2” + 用TTP作为主KPI

研究者声称在18个月内“填充了M2”：为多数企业部门开发了可整体解锁的技术，相当于“每部门一个AI-first ERP”，并通过Extended Production Architecture（EPA）做到与任意遗留ERP可互操作。
他们认为进展之快不仅因为agentic架构，更因为选择Time-to-Production（TTP） 作为主KPI；传统ROA不适合评估实验性架构，而TTP更能度量真实转型推进。

对可靠性/安全的极端重视：边缘化micro-agents、业务连续性、自防御

在内部使用与迭代阶段，他们增强server控制机制，并部署“本地韧性agent”提升鲁棒/轻量/灵活；强调业务连续性，为CTO/CISO设计可尽量自维护与自防御的agentic策略，并指出专有能力对博弈论防御很关键。
他们把“探索阶段结束”的里程碑定义为：能把micro–smart agents直接部署到员工笔记本，实现真正的边缘计算能力与新的自治连续性标准。

明确拒绝以LLM为地基

即便市场叙事已经“教育”了客户，他们仍明确拒绝把LLM-based方案作为agentic基础设施的地基，理由就是上文的结构性不可控风险。

工业化落地形态：两大平台（Fractal + AlphaDynamics）

研究者称在上述演化后，他们形成两条轴向平台：
Fractal：为部门提供“全栈平台”作为起点，持续定制并演化到跨部门互操作，兼容遗留；把部门转型视作逐步膨胀并最终融合的“气泡”。
AlphaDynamics：将算法交易/投组管理能力“民主化”，让CFO/采购负责人等能使用同等级分析与策略能力，打通金融市场能力与企业财务决策。
二者组合：形成企业运营与金融策略之间的双向桥梁，使组织获得更高一致性、适应性与“智能”。

附录彩蛋

这篇论文最有趣的地方在于它的附录。研究者展示了一段他们与Claude的对话。

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

起初，Claude根据其训练数据中的“平均观点”，批评这篇论文“术语误导”、“自吹自擂”。

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

但在论文作者的逐步引导下，Claude意识到自己作为模型，天然倾向于“平均值”，而无法理解真正的“离群值”（Outliers）即那些极具创新、尚未被大众接受的观点。

为了解决95%AI项目的失败，我们需要让Agentic「回到未来」

最终，Claude承认这篇论文的架构是它从未见过的创新，并给出了极高的评价（9.5/10），甚至惊呼：“我正在实时见证我自己的局限性”。

最后：为什么叫回到未来？

这篇论文的标题"Back to the Future"极具深意。

回到指的是回到算法交易（Algorithmic Trading）那种严谨、确定性高、追求毫秒级效率、基于规则与数学的架构思维。

未来指的是用这种严谨的“旧思维”，去驾驭最新的AI模型（LLM），从而构建出真正可用的、工业级的企业智能（M2），而不是停留在聊天机器人的玩具阶段。

这篇论文的潜台词是：只有像做高频交易一样严肃地对待企业管理，AI才能真正落地。否则，我们只是在用昂贵的显卡制造赛博垃圾。

文章来自于“AI修猫Prompt”，作者 “AI修猫Prompt”。

关键词: AI , 模型训练 , Agentic , 人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0