2024即将结束,今年依然是AI发展突飞猛进的一年,市场前景也变得更加清晰。
最近,风投公司Menlo Ventures的三位合伙人和投资者发布了一报告,调查了600名美国企业IT决策者,全面揭示了AI产业的现状。
作者列表:Tim Tully, Joff Redfern, Derek Xiao
报告链接:https://menlovc.com/2024-the-state-of-generative-ai-in-the-enterprise/
2023年报告:https://menlovc.com/2023-the-state-of-generative-ai-in-the-enterprise-report/
总的来说,2024年的人工智能投资激增至138亿美元,是2023年23亿美元的六倍多,表明企业正在从实验阶段转向执行阶段,切实地将人工智能嵌入到核心商业战略中。
支出的激增也反映了组织的乐观情绪:72%的决策者预计在不久的将来会更广泛地采用生成式人工智能工具,而且这些工具已经走入了程序员、医疗保健等专业人员的日常工作中。
尽管前景乐观且投资不断增加,但许多决策者仍不清楚到底什么是对自己企业有利的,超过三分之一的受访者对于如何在其组织中实施生成式人工智能没有明确的愿景。
我们仍处于大规模转型的早期阶段,企业领导者才刚刚开始认识到生成型人工智能将对其组织产生的深远影响。
2024年,大部分AI大事件都发生在「应用程序」层,利用LLMs跨领域的能力来提升效率。
投资者在全年面向应用层投入46亿美元,比去年的6亿美元增长了近8倍。
在公司侧,企业家的目标也更高了,公司不仅增加了支出,想法也变多了,平均每个企业都确定了10个潜在用例,其中近四分之一(24%)被优先考虑在近期实施;只有少数用例在生产中,而其中三分之一仍处于原型设计和评估阶段(33%)。
虽然AI应用仍然是一片实验场,但部分应用场景下,已经证实了其能够提高生产力和运营效率。
Code Copilots
以51%的采用率遥遥领先,也使得开发人员成为了AI领域最早的资深用户。
GitHub Copilot的收入迅速攀升至3亿美元,Codeium和Cursor等新兴工具也在快速增长。
除了通用编码助手之外,企业还会购买特定任务的编程助手应用,例如Harness的AI DevOps Engineer、可用于管道生成和测试自动化的QA助理,以及类似All Hands这样能够执行更多端到端操作的AI智能体软件开发。
Support chatbots
企业采用率为31%,可以为内部员工和外部客户提供可靠、24/7、基于知识的支持,产品包括Aisera、Decagon和Sierra,能够直接与终端客户互动;Observe AI在通话期间为联络中心座席提供实时指导。
企业搜索/检索+数据提取/转换
采用率分别为28%和27%,企业需要利用上数据孤岛中的宝贵知识。
Glean和Sana等解决方案可连接到电子邮件、即时通讯工具和文档存储,从而实现跨不同系统的统一语义搜索,并提供基于AI的知识管理能力。
会议总结
在使用案例中排名第五,采用率为24%,通过自动化生成笔记和要点来节省时间并提高生产力。
产品包括Fireflies.ai、Otter.ai和Sana等,能够捕获并总结在线会议;Fathom从视频中提取关键点;Eleos Health将这一创新应用于医疗保健,自动化记录时间并直接与EHR集成,以便医疗保健提供者可以专注于患者护理。
当前的实践模式表明,与完全自动化相比,用户更倾向于辅助增强人工流程,但行业目前正在向更加自主、完全自动化的解决方案进行过渡。
现有工具包括金融后台工作流程Forge、Sema4,以及上市工具Clay,展现了「完全自主的生成式人工智能系统」能够改变传统上以人类为主导的部门,有望走向未来「服务即软件」(Services-as-Software)的时代。
两种方案的公司比例几乎持平:47%的公司选择内部开发,53%选择供应商。
与2023年相比,变化相当明显,当时80%的企业仍然依赖第三方生成式人工智能软件,表明现在的企业越来越有信心和能力建立自己的内部AI工具。
只有1%的买家将低价作为主要关注点,现在企业更关注那些能够提供可衡量价值(30%)并具有独特研发背景(26%)的AI工具。
不过,虽然价格不是主要考虑因素,但还是有不少买家(26%)低估了AI的使用成本,导致AI战略失败;数据隐私障碍 (21%) 和过低投资回报 (ROI) (18%) 是次要原因;在技术方面,主要影响因素是模型幻觉(15%)。
在规划和选择阶段主动解决这些潜在陷阱,可以增加成功的可能性。
虽然64%的客户仍然更喜欢从老牌供应商那里购买产品,理由是「信任」和「开箱即用」的功能,但趋势已经开始发生变化。
18%的决策者对现有产品表示失望;40% 的受访者质疑大公司当前的解决方案无法真正满足需求,表明创新型初创公司有很大的机会介入,并提供更贴合用户需求的服务。
除了更大的规模外,生成式AI已经开始破圈,企业内各个部门都开始增加了AI工具的预算。
不过技术部门仍然占据了最大的支出份额,其中 IT (22%)、产品+工程 (19%) 和数据科学 (8%) ,合计占所有投资的近一半。
剩余预算主要分配给面向客户的职能部门,如支持 (9%)、销售 (8%) 和营销 (7%)、包括人力资源和财务在内的后台团队(各 7%),以及较小的部门,如设计 ( 6%)和法律(3%)。
第一个生成式人工智能应用是用于文本和图像生成的横向解决方案,但到了2024年,越来越多的垂直领域得到扩展。
医疗保健
以5亿美元的企业支出引领生成式AI应用:Abridge、Ambience、Heidi和Eleos Health等环境抄写器(aimbient scribes)已经成了医生办公室的主要产品;自动化解决方案也在整个临床生命周期中不断涌现,从分类和摄入(Notable )到编码(SmarterDx、Codametrix),再到收入周期管理(Adonis、Rivet)。
法律
历来最抵制技术的法律行业,其企业人工智能支出也达到3.5亿美元,主要用生成式AI来管理大量非结构化数据并自动化复杂的、基于模式的工作流程,大致可以分为诉讼法和交易法。
Everlaw植根于诉讼,专注于法律保留、电子证据开示和审判准备;Harvey和Spellbook则通过合同审查、法律研究和并购解决方案推进交易法。
具体的实践领域也有针对性的人工智能创新:EvenUp专注于伤害法,Garden专注于专利和知识产权,Manifest专注于移民和就业法,Eve则重新发明(re-invent)从客户接收到解决的原告案件工作。
金融服务
凭借其复杂的数据、严格的法规和关键的工作流程,金融服务的支出也达到了1 亿美元。
Numeric和Klarity等初创公司正在彻底改变会计行业;Arkifi和Rogo通过先进的数据提取加速金融研究;Arch正在使用人工智能来扰乱RIA和投资基金的后台流程;Orby和Sema4是从对账和报告开始的,提供更广泛的横向解决方案;Greenlite和Norm AI提供实时合规性监控,以跟上不断变化的法规。
媒体和娱乐
从好莱坞的大屏幕到智能手机,生成式 AI 正在重塑媒体和娱乐,支出达1亿美元。Runway已经是工作室级别的工具;Captions和Descript为独立创作者提供了支持;Black Forest Labs、Higgsfield、Ideogram、Midjourney和Pika等平台让普通人也能拥有专业的图像和视频创作能力。
经过一年的快速发展,AI技术堆栈也逐渐趋于稳定。
基础模型仍然占主导地位,LLM层需要65亿美元的企业投资。
通过反复试验,企业越来越了解数据脚手架(data scaffold)和复合架构方面的重要性,更重视在生产中可靠地执行,而不仅仅是一次性演示。
企业不再依赖单一提供商,而是采用务实的多模型方法。
研究表明,组织通常在其人工智能堆栈中部署三个或更多基础模型,然后根据用例或结果路由到不同模型。
目前81%的市场方案为闭源模型,而开源替代方案(以Meta的Llama 3为首)稳定在19%,比2023年仅下降了1个百分点。
在闭源模型中, OpenAI的先发优势有所削弱,企业市场份额从50%下降至34%,一些企业在选择模型时从GPT-4转向Claude 3.5 Sonnet,主要受益者Anthropic的企业占有率从12%翻了一番至24%
当选择新模型时,企业的主要考虑因素包括安全 (46%)、价格 (44%)、性能 (42%) 和扩展功能 (41%) 。
企业人工智能设计模式——用于构建高效、可扩展人工智能系统的标准化架构——正在迅速发展。
RAG(检索增强生成)目前以51%的采用率占据主导地位,比去年的31%大幅上升;而之前常用的微调,尤其是在领先的应用程序提供商中,已经非常少见了,大约只有9%的生产模型进行了微调。
智能体架构也开始发力,在12%的实践场景中提供技术支持。
为了支持 RAG,企业必须有效地存储和访问相关查询知识。
虽然Postgres (15%) 和MongoDB (14%) 等传统数据库仍然很常见,但人工智能原生矢量数据库也开始普及,Pinecone已占据18%的市场份额。
传统ETL平台(如Azure 文档智能)仍占部署的28%,但Unstructe等专用工具(处理PDF和HTML等文档中非结构化数据)也占据了16%的市场份额。
智能体将推动下一波AI架构转型
智能体自动化(agentic automation)可以处理复杂的多步骤任务,而这些任务无法被当前专注于「内容生成」和「知识检索」的系统所解决。
Clay和Forge等平台的成功,证明了先进的智能体可以扰乱4000亿美元的软件市场,并蚕食10万亿美元的美国服务经济。
但这种转变需要新的基础设施:智能体身份验证、工具集成平台、人工智能浏览器框架以及人工智能生成代码的专用运行时。
更多「上位者」倒台
ChatGPT今年战绩斐然:Chegg 的市值蒸发了85%,Stack Overflow的网络流量减半。
其他类别的颠覆时机也已经成熟,像Cognizan这样IT外包公司和UiPath等传统自动化公司也应该对AI颠覆做好准备。
随着时间的推移,即使是Salesforce和Autodesk这样的软件巨头也将面临人工智能原生的挑战者。
没有缓解的迹象:AI人才短缺加剧
随着人工智能系统的激增,且变得越来越复杂,行业目前还处于大规模人才短缺的边缘,科技行业将面临严重的稀缺。
不仅仅是数据科学家的短缺,能够将先进的人工智能能力与特定领域的专业知识联系起来的专家也严重不足。
人才库已经低得危险。
参考资料:
https://x.com/deedydas/status/1859318303308886188
https://x.com/kimmonismus/status/1859344416193888390
文章来自于微信公众号 “新智元”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner