这份来自麻省理工的2025年商业AI现状的研究报告最近在网上炸锅了,该报告称 95% 的人工智能试点都失败了,这吓坏了美国股市的投资者。报告提到大多数公司都陷入了困境,因为 95% 的 GenAI 试点项目都没有产生任何投资回报率,而只有 5% 的公司通过使用可学习、可融入实际工作流程并随着使用而改进的系统获得了成功。
事实上,许多人都误读了这份著名的麻省理工学院报告。人工智能结果数字中的“95%失败”仅衡量了脆弱的定制企业试点,而不是一般的人工智能。您可以从统计学的角度反思一下。相反,日常工作者不断从个人人工智能工具中获得真正的价值。
报告的数据来源于研究人员分析了超过300个公开发布的人工智能项目和计划,与来自52个不同组织的代表进行了结构化访谈,并且收集了在四个主要行业会议上对153位高级领导的调查问卷回复。报告还明确指出,其研究是在2025年1月至6月期间进行的,非常新。
从作者们的访谈、调查以及对 300 个公开实施案例的分析中,出现了四个定义 GenAI 鸿沟的模式:
1.有限的颠覆:8个主要行业中只有2个有结构性变化。
2.企业悖论:大公司试点多,但规模化应用落后。
3.投资偏见:预算偏向可见的、顶层的功能(如销售),而不是高投资回报率的后台。
4.实施优势:外部合作的成功率是内部开发的两倍。
报告认为,鸿沟的决定因素不是模型质量或法规和人才,而是“学习”(learning)和“方法”(approach)。
明明大家私下里都在用ChatGPT、Claude处理工作,效率飞起,可一旦公司花了重金采购或公司亲自下场研发一款企业级AI工具,用户却不买账?研究者们将这种现象称为“GenAI鸿沟”,即AI的高采用率和低业务转型率之间的巨大裂痕。这背后,隐藏着几个值得我们深思的残酷现实。
研究者们创建了一个“AI市场颠覆指数”来量化AI对不同行业的影响。从0到5分,结果发现,在九个主要行业中,只有科技Technology)和媒体与电信(Media & Telecom)得分最高(2.8和2.3)出现了较为明显的结构性变化,而金融、医疗、零售等绝大多数行业,尽管试点活动频繁,但“没有任何根本性的改变”。
一位制造业COO的话很经典:“领英上的炒作说一切都变了,但在我们的运营中,没有任何根本性的改变。”
这是最触目惊心的数据。报告指出,对于企业级的、为特定任务定制的AI工具:
并且通用的LLM聊天机器人(如ChatGPT)的试点到实施率高达83%。这背后有一个价值认知的分裂。员工喜欢用消费级工具,因为它们灵活、熟悉、立即可用。但他们对公司推销的定制AI工具充满怀疑,认为它们“脆弱、过度设计或与实际工作流程不符”。这背后有一个深层原因,非常有意思。
报告揭示了一个极其有趣的“影子AI经济”现象。虽然只有约40%的公司为员工购买了官方的LLM订阅,但超过90%的公司员工在日常工作中使用自己付费的个人AI工具。这是一个巨大的反差。员工们用个人工具已经悄悄“跨越了鸿沟”,而公司的官方项目还在原地踏步。这说明,问题不在于AI本身有没有用,而在于公司“如何”提供和集成AI。
在投资方面,约70%的AI预算流向了销售和营销这类前台部门,因为它们的产出更容易量化。但研究者发现,真正的、能带来巨额回报的ROI金矿,其实埋藏在后台职能中(如财务、采购、法务)。通过AI自动化替代昂贵的业务流程外包(BPO)和外部咨询,所带来的成本节约远比前台的增收更为直接和可观。不过由于很难量化并向CEO汇报,这种投资偏见导致的资源错配,高ROI的机会被现在很多企业忽视了。
那么问题到底出在哪?是我们的模型不够强大,还是算法不够先进?都不是。研究者一针见血地指出,根本原因在于“学习差距”(The Learning Gap)我们构建的大多数AI系统,本质上是个患有严重“失忆症”的天才。
报告调查了AI应用的主要障碍,排在第一的是“抵制采用新工具”,而紧随其后的就是“模型质量/不可靠的输出”。这就产生了一个悖论:既然员工私下里那么爱用ChatGPT,为什么又会抱怨企业级AI的模型质量呢?研究者解释道,“上下文”是关键。在没有严格流程约束的个人任务中,AI的灵活性是优点;但在需要精确、一致、可靠的企业工作流中,同样的AI就因无法理解复杂的业务上下文而显得“不可靠”了。
关于上下文工程(Context Engineering),感兴趣您可以看下这两篇《中科院清北重磅发布:「上下文工程」的系统脉络图来了!》和《第一性原理的Context Engineering工具、指南》
研究者发现,即使用上了同款底层模型,用户也普遍认为直接使用ChatGPT网站的体验,远胜于将其集成在企业软件里的工具。原因有三:
既然如此,为什么企业不能直接用ChatGPT处理所有关键任务呢?因为它存在几个致命的局限性,而这些局限性正是“学习差距”的集中体现:
我之前介绍过一篇微软的论文,其中的观点很相似,他们提到“我们的数万名员工每天都在经历反复重申意图、手动追逐依赖关系,并费力的将不同工具的上下文拼接在一起,充当人力胶水的痛苦”
感兴趣您可以看看《微软已为Agent悄然调转船头,当大厂都在卷“通用Agent”》
当被问及处理高风险工作时,用户的选择清晰地说明了这一点。对于起草邮件这类简单重复工作,70%的人选择AI。但对于复杂或长期的任务,90%的人选择人类同事。 AI和人类的界限不是“智能”,而是“记忆、适应性和学习能力”。这正是AI鸿沟的两边所区分的特质。
报告指出,成功的AI供应商都在解决“学习、记忆和工作流适应”的问题。
成功的供应商都深刻理解企业客户的真实需求,他们想要的不仅仅是算法:
成功的AI初创公司通常会执行两大战术:
1.为特定工作流程深度定制:他们放弃了打造“万金油”平台的幻想,而是从非核心或邻近的流程切入,进行深度定制,展示明确价值,然后扩展到核心流程。成功的工具通常配置负担低、价值立即可见。
2.利用推荐网络:通过系统集成商、董事会成员或行业顾问的推荐来克服企业的信任壁垒,实现冷启动。冷不防的推销邮件/电话”(Cold Inbound Offer)几乎无效,而来自现有供应商(20%)、合作伙伴(15%)、同行(13%)和董事会(10%)的推荐则占据了主导地位。意思就是说想要成功,最好借助和建立信任网络,进行盲目的市场推广效果可能不好。
报告还提到了一个紧迫感:“跨越鸿沟的窗口正在迅速关闭”。企业正在锁定那些具备学习能力的工具,一旦企业投入时间训练一个系统来理解其工作流程,转换成本就会变得非常高。
这一章是给企业客户的 playbook。
成功的AI购买者,行为模式更像BPO(业务流程外包)客户,而不是SaaS客户。他们不再只看功能列表,而是要求供应商对最终的业务指标负责。
这清晰地表明,在当前阶段,利用外部成熟的专业能力远比闭门造车更明智。
企业在推动AI时面临两个核心的组织设计决策,而最成功的企业往往在这两点上都做出了明智的选择。
第一个决策:项目应该由谁主导?答案是“赋权一线”。 报告发现,相比依赖一个中心化的“AI卓越中心”(CoE)自上而下地寻找应用场景,由最懂业务的一线管理者和“超级用户”自下而上地发现需求、主导选型,成功率要高得多 。这种“业务线主导”的模式能最大程度确保解决方案与实际运营的契合度。
第二个决策:技术应该如何实现?答案是“战略合作”。 无论项目由谁主导,在实现方式上,报告的数据给出了明确的答案:“购买”远胜于“构建”。通过与外部供应商建立战略合作伙伴关系(即购买或合作开发模式),项目的成功部署率高达66%,是完全依赖内部团队自建(33%)的两倍。
最后,报告将视野拔高,提出了“智能体网络”(Agentic Web)的概念,那是一个超越了单个AI工具的时代。动态的智能体取代了孤立的SaaS工具和静态的工作流程。在这个网络里,无数个具备学习、记忆和自主行动能力的“智能体”,可以跨越公司和平台的界限,自主地协同工作,去发现问题、谈判任务、执行流程。
这标志着从“提示驱动”到“协议驱动”的自主协调的转变。
报告最核心的洞见之一是,企业内部自行构建AI工具的成功率远低于与外部供应商合作。数据显示,通过战略合作部署的AI项目成功率(66%)是内部开发(33%)的两倍。这颠覆了许多企业认为必须掌握核心技术自研的传统观念,指出成功的关键在于利用外部专业知识快速实现价值。
一个普遍的战略误区是将大部分AI预算投向光鲜的“前台”业务,如销售和市场营销。报告洞察到,尽管这些领域获得了约70%的投资 ,但最快、最可衡量的投资回报(ROI)往往来自被忽视的“后台”职能,如运营、财务和采购。通过自动化后台流程来取代昂贵的业务流程外包(BPO)和外部机构,可以实现数百万美元的成本节约。
阻碍AI广泛应用和产生价值的根本原因不是模型质量、数据或法规,而是大多数AI系统缺乏“学习能力”。这些系统无法从用户反馈中学习、记住上下文或适应不断变化的工作流程。因此,战略重点应从评估AI的技术基准转向评估其学习、适应和与现有工作流程集成的能力。
报告发现,员工自发使用个人AI工具(如ChatGPT)的“影子AI经济”非常普遍。90%的员工在工作中使用个人AI工具,而只有40%的公司购买了官方订阅。这一现象不应被视为安全风险,而是一个战略洞察:它揭示了什么样的AI工具是员工真正需要的灵活、易用、能立即解决问题。成功的组织会学习“影子AI”的使用模式,并以此为依据来采购企业级解决方案。
成功部署AI更多的是一个组织设计问题,而非技术问题。成功的企业通常会采取“去中心化”的实施方式,将选择和推广AI工具的权力下放给一线的业务经理和预算负责人,而不是依赖一个集中的AI中心或IT部门。这种自下而上的方法确保了AI解决方案能真正贴合业务需求,从而加速了采用。
报告发出了一个明确的战略预警:企业选择能够学习和适应的AI系统并进行投资后,会产生巨大的转换成本 。随着系统不断学习特定公司的流程和数据,其价值会持续累积,导致竞争对手难以追赶。报告预测,在未来18个月内,许多企业将锁定核心的AI供应商关系。这意味着,现在犹豫不决的企业将在未来几年内处于严重的竞争劣势。
文章来自于微信公众号“AI修猫Prompt”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0