Menlo Ventures 今天发布了一份关于 AI 很有价值的报告,这个报告由他们对 600 名企业 IT 决策者进行调查后得出的结果(原文地址:https://menlovc.com/2024-the-state-of-generative-ai-in-the-enterprise/),
很多结论跟我的观察非常类似,这里基于 AI 的翻译简单做一下分享(部分删节),
有几个数据挺值得关注:
首先是今年企业在 AI 的支出达到了 138 亿美金,是去年 23 亿美金的 6 倍多,Menlo Ventures 说这是一个非常明确的信号,表明企业正在从实验转向执行,将人工智能嵌入其业务战略的核心。
支出的激增还反映了企业的乐观情绪;72% 的决策者预计在不久的将来会更广泛地采用生成式人工智能工具。这种信心并不只是猜测,生成式人工智能工具已经深入到从程序员到医疗服务提供者等专业人士的日常工作中。
不过尽管前景乐观,投资也在不断增加,但许多决策者仍在摸索什么对他们的企业有效,什么对他们的企业无效。在其调查中,超过三分之一的受访者对于如何在其组织内实施生成式人工智能没有清晰的愿景。
数据显示,今天 60% 的企业生成式 AI 投资来自创新预算,这反映了生成式 AI 采纳的早期阶段。然而,随着 40% 的生成式 AI 支出来自更为永久的预算——其中 58% 是从现有分配中重新分配的——企业正在展示其对 AI 转型的日益承诺。
其次,虽然大模型仍然是支出的大头,但是应用层的增长更快。Menlo Ventures 的数据显示,2024 年,许多活动都发生在应用层。随着许多架构设计模式的确立,应用层公司正在利用 LLM 跨领域的能力来释放新的效率和能力。企业买家正在抓住这一时机,在 2024 年向生成式人工智能应用投入 46 亿美元,比去年的 6 亿美元增长了近 8 倍。
目前最有价值的四个应用场景
这 4 个应用场景跟我的观察非常类似,分别是 AI 编程、AI 客服、AI for Work 以及 AI 笔记(会议),都是我今年核心关注的几个重点领域。
代理与自动化:AI 正在开始掌舵
报告说,目前的实施模式表明,人们更倾向于增强人类的工作流程,而不是完全自动化。但我们现在才刚刚接近向更加自主的解决方案过渡。能够独立管理复杂的端到端流程的人工智能代理的早期案例正在各行各业涌现。金融后台工作流程中的先驱企业 Forge 和 Sema4,以及 Clay 的市场推广工具,都展示了完全自主的生成式人工智能系统如何改变传统上由人类主导的行业,并指向未来的服务即软件时代,即人工智能驱动的解决方案提供传统服务提供商的功能,但完全通过软件运行。
在决定是自己构建还是购买时,企业的比例都比较均匀,47% 的解决方案是内部开发的,53%是从供应商处采购的。与 2023 年相比,这是一个明显的变化,当时其报告称 80% 的企业依赖第三方生成式人工智能软件,这表明许多企业越来越有信心和能力建立自己的内部人工智能工具,而不是主要依赖外部供应商。
长期游戏:企业在生成式人工智能采用中优先考虑价值而非快速收益
在选择生成式人工智能应用时,企业有明确的优先考虑事项:在选择新工具时,投资回报和特定行业的定制化最为重要。令人惊讶的是,价格并不是主要问题;在我们调查的企业领导者中,仅有 1%的人提到价格是选择时考虑的因素。买家们玩的是长期游戏:他们更关注能提供可衡量价值的工具(30%)和能理解其工作独特背景的工具(26%),而不是价格最低的工具(1%)。
尽管企业在投资回报率和定制化方面做了大量工作,但他们可能会忽略实施难题中的关键部分。通常情况下,企业发现自己低估了技术集成、持续支持和可扩展性的重要性,为时已晚。这就好比买车时只考虑燃油效率,后来才发现服务的可用性和易维护性在长期使用中同样重要。
当人工智能试点遇到困难或停滞不前时,往往是由于在选择过程中没有充分考虑到挑战。虽然购买者并不检查价格标签,但在 26% 的失败试点中提到的实施成本常常让他们措手不及。数据隐私障碍(21%)和令人失望的投资回报率(18%)也让试点项目偏离了正轨。技术问题,尤其是幻觉(15%),是导致失败的主要原因。在规划和选择阶段积极解决这些潜在的隐患,可以提高成功实施的可能性。
现有企业更容易受到初创企业的干扰
去年,现有企业通过在现有产品上添加人工智能生成功能的 "附加 "战略,主导了企业市场。我们曾预测初创企业将逐渐占据优势,而今年的数据验证了我们的想法:虽然 64% 的客户仍倾向于从老牌供应商处购买产品,理由是信任和开箱即用的功能,但现有供应商的主导地位已开始出现裂痕。
我们的数据揭示了日益增长的不满情绪:18%的决策者对现有产品表示失望;40%的决策者质疑现有解决方案是否能真正满足他们的需求,这预示着创新型初创企业有机会介入并确立自己的地位。
AI 开始从部门开始变革
如今,生成式人工智能的应用引人注目的不仅仅是规模,还有范围。今年,生成式人工智能的预算流向了每个部门。其中技术部门占据了最大的支出份额,IT(22%)、产品+工程(19%)和数据科学(8%)共占企业生成式人工智能投资的近一半。
其余预算分布在面向客户的职能部门,如支持(9%)、销售(8%)和营销(7%),包括人力资源和财务在内的后台团队(各占 7%),以及较小的部门,如设计(6%)和法务(3%)。
垂直人工智能应用开始崛起
这块跟我的观察也非常类似,首批生成式人工智能应用是用于文本和图像生成的横向解决方案,但 2024 年,越来越多的应用发现,将 LLM 的新功能应用到高度特定领域的垂直化工作流程中具有 traction。以下垂直领域的应用处于领先地位:
基础设施与现代人工智能堆栈
经过一年的快速发展,现代人工智能堆栈在 2024 年趋于稳定,企业围绕核心构件展开合作,这些构件构成了大多数生产型人工智能系统的运行时架构。
基础模型仍占主导地位。LLM 层获得了 65 亿美元的企业投资。然而,通过不断尝试和犯错,企业越来越认识到数据脚手架和集成在构建复杂的复合人工智能架构中的重要性,这种架构可以在生产中可靠运行,而不仅仅是一次性演示。
LLM 趋势:多模型战略占上风,OpenAI 让位于 Anthropic
企业不再依赖单一的供应商,而是采用了务实的多模型方法。我们的研究表明,企业通常会在其人工智能堆栈中部署三种或三种以上的基础模型,并根据用例或结果选择不同的模型。
这种策略延伸到了开放源代码与封闭源代码的争论中,尽管行业讨论激烈,但人们对开放源代码与封闭源代码的偏好一直保持稳定。闭源解决方案占据了绝大多数市场份额,达到 81%,而开源替代方案(以 Meta 的 Llama 3 为首)则稳定在 19%,与 2023 年相比仅下降了一个百分点。
在闭源模型中,OpenAI 的先发优势有所削弱,企业市场份额从 50% 降至 34%。Anthropic 是主要受益者,它的企业市场份额从 12% 倍增到 24%,因为一些企业在 Claude 3.5 Sonnet 成为最先进模型后,从 GPT-4 转向了 Claude 3.5 Sonnet。在转向新的 LLM 时,企业最常见的动机是安全考虑(46%)、价格(44%)、性能(42%)和扩展功能(41%)。‘
设计模式趋势:RAG 增势迅猛,微调十分罕见,代理异军突起
企业人工智能设计模式--用于构建高效、可扩展人工智能系统的标准化架构--正在迅速发展。RAG(检索增强生成)目前占主导地位,采用率为 51%,比去年的 31% 大幅上升。与此同时,经常被吹捧的微调,尤其是在领先的应用提供商中,仍然少得令人吃惊,只有 9% 的生产模型进行了微调。
今年最大的突破是什么?代理架构首次亮相,已经为 12% 的应用提供了动力。
数据库、ETL 和数据管道:RAG 的基础
要为 RAG 提供动力,企业必须高效地存储和访问相关的查询知识。尽管 Postgres(15%)和 MongoDB(14%)等传统数据库仍很常见,但人工智能优先的解决方案仍在不断壮大。Pinecone 是一款人工智能原生向量数据库,已经占据了 18% 的市场份额。类似的转变也发生在数据 ETL/准备领域。传统的 ETL平台(如Azure Document Intelligence)仍然占据了28%的部署份额,但 Unstructured 等专业工具旨在处理 PDF 和 HTML 等文档中的非结构化数据的细微差别,正在开辟自己的空间,占据了16%的市场份额。在整个技术堆栈中,我们看到了对专为满足现代人工智能需求而设计的技术的需求。
Menlo Ventures 的 3 个预测
最后,Menlo Ventures 认为这一切才刚刚开始,人工智能正在为一个新的转型时代铺平道路,它由尖端的人工智能工具、增强能力的员工队伍和变革性的商业模式驱动,将重塑我们的经济。
文章来自微信公众号 “ 投资实习所 ”,作者 “ StartupBoy “
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner