企业AI创业:控成本、打硬仗、去肥水田
企业客户对AI的采用意愿,目前呈高涨状态:根据IDC的《2023-2024全球企业高管调查报告》,超过一半高管认为生成式AI是新投资的重中之重,87%的高管表示他们至少在探索潜在的应用场景。
企业AI的基本技术架构也已经达成共识:强大的AI模型+图技术加持的RAG+Agent搭建+安全护栏。但是企业们也发现, 在应用AI时,几乎90%的时间和成本都花在基础设施和各种必要的架构上,那么是不是有一个平台能够免除这些花费,还能提供强大的AI能力?
已经有一些平台满足了这种需求,比如此前我们介绍过的Glean和Sierra,这些平台采取的是垂直策略,Glean专注于企业AI搜索,Sierra目前只做对话式客户体验;最近有一个全栈的企业AI平台获得了融资,它拥有自己的AI模型及全套的企业AI应用基础设施,在AI使用成本和安全性方面做了特别的加强。
这家叫Writer的创业公司最近获得Premji Invest、Radical Ventures和ICONIQ Growth共同领投的2亿美元C轮融资,Salesforce Ventures、Adobe Ventures、B Capital、Citi Ventures、IBM Ventures和Workday Ventures也参与了此次融资。这使它的累计融资额达到3.26亿美元,估值超过19亿美元。预计到2024年年底,Writer将从其300多家客户中实现约5000万美元的年度经常性收入。
Writer由May Habib(CEO)和Waseem AlShikh(CTO)于2020年创立,两人在2013年共同创立了他们的第一家公司,这家公司最初的业务是机器翻译,后来进化成一个能够将各种内容本地化的软件平台。两位创始人在那个时期就自己构建机器翻译模型,当Transformer模型横空出世后,他们认识到这种模型的潜力,于是再次联手,创建了Writer。
基于第一次创业的经验,他们坚定押注并构建自己的Transformer模型,先从模型的文本处理功能出发,专注在营销领域,随后扩展到支持、销售、运营、人力资源和财务等团队,并拥有了自己的基础模型和行业模型家族,搭建了全栈的企业AI平台。
Salesforce产品副总裁Patrick Stokes表示:“将大模型转化为可靠的业务工具需要大量的工程工作。Writer提供了一个精细的AI驱动解决方案,它不仅有效且易于部署,还加速了我们在Salesforce的工作流程。我们不仅是它的投资者,也是它的客户。”
ICONIQ Growth合伙人Doug Pepper表示:“我们相信,针对企业的生成式AI正处于一个拐点,而Writer在提供全栈且安全的平台方面脱颖而出,兑现了AI的巨大承诺。”
2024年,AI的投融资热度不减,根据海外投资机构Accel的一份报告,生成式AI初创企业将获得今年云技术领域40%的风险投资资金。根据PitchBook的数据,仅在2024年上半年,生成式AI初创企业的投资额就超过了39亿美元(还不包括OpenAI的66亿美元融资)。
企业AI是这一波AI投融资热潮的重要组成部分,而支撑热潮的是企业对AI的较高采用。根据IDC的《2023-2024全球企业高管调查报告》,超过一半高管认为生成式AI是新投资的重中之重,87%的高管表示他们至少在探索潜在的应用场景。
但是企业对生成式AI的采用还处于初步探索阶段,企业们发现,单纯的使用内部行业数据+GPT模型,并不能解决一些复杂的操作和用例。想要让AI帮助企业完成一些业务方面的复杂操作,需要搭建企业Agent,这让企业面临一系列RAG技术,数据收集和清理以及工作流程构建的复杂工作,而这部分工作实际占了让AI实用化的90%的时间和成本。例如,之前想要将AI嵌入企业的工作流程,有时员工需要花费数小时在不同格式之间转换相同的内容。
以Writer为代表的企业AI平台做的事情,就是开发能够完成企业关键任务的高级AI系统,而不仅专注于基础模型或服务于有限用例的现成应用。
构建能够完成企业关键任务的高级AI系统,行业内已经有一个基本的技术架构共识。那就是强大的AI模型+图技术加持的RAG+Agent搭建+安全护栏。因为企业AI一方面要应对企业面临的现实复杂场景,另一方面要保持安全性、可靠性和适应性。
Writer平台的核心是Palmyra系列模型(Writer自己训练的大模型),并配备先进的基于图的检索增强生成(RAG)、可定制的AI防护措施,以及一套无代码和代码开发工具。在这些核心组件之上,Writer提供灵活的应用层,包括聊天机器人、预构建应用和可组合的UI选项,以服务于企业内部各个职能部门的用例。此外,Writer还有集成和API生态系统,将Writer带入员工工作的各个场景中。
Palmyra系列大模型主要有两个差异化特点,第一是低成本,第二是安全性和透明性。
例如,Writer发布了几乎完全基于合成数据训练的模型Palmyra X 004。据Writer称,开发该模型的成本仅为70万美元,而类似规模的OpenAI模型开发成本估计高达460万美元,GPT-4的预估成本则超过1亿美元。这个新模型在工具调用方面实现了高度的准确性和可靠性,这是执行复杂操作和工作流程的关键能力。
此外,Writer声称其模型是基于未受版权保护的商业写作进行训练的,这避免了版权方面的不确定性。而且在透明度方面,客户可以检查模型的代码、功能和数据,这些模型也不会使用客户数据进行训练。
“对我们来说,构建自己的大语言模型非常重要,因为这样我们的模型能够由客户自行托管,并且是开放、透明且可审计的,而不是采用‘黑箱’方式。”Writer创始人May Habib说道。
目前,Palmyra系列有超过18个模型,其中也包括针对金融和医疗场景的Palmyra-Fin和Palmyra-Med模型。Palmyra-Med模型在多个医疗基准测试(斯坦福HELM和PubMedQA)中表现得更为准确,且使用成本低于GPT-4和Claude 3.5等通用闭源模型。它的模型强调的不是创意,而是准确性。
基于图的检索增强生成(RAG)最主要的好处,是允许企业客户将模型与业务数据源连接,这样可以提升模型的研究、事实核查和问题解答能力。同时,RAG也是构建Agent的核心技术之一,没有它,Agent就很难深入到企业客户的工作和业务流程中。
Writer在AI防护措施上也做了不少工作,他们强调企业AI的安全性、数据隐私和合规性。他们的AI遵守SOC 2 Type II、GDPR、CCPA、HIPAA和PCI等一系列安全和隐私合规标准。确保无论是由人工还是AI生成的内容,都符合法规、准确、包容且符合品牌定位。
在AI部署方式上,他们不仅提供企业的私有云部署,也包括在AWS和GCP上的多租户和单租户部署。
在客户开发方面,Writer的客户行业拓展和产品功能发展是相辅相成的。它从最初的企业写作工具出发,专注在营销领域,之后将业务拓展到支持、销售、运营、人力资源和财务等企业内部团队,以及金融和医疗等对准确率,安全性要求很高的行业,产品上也变成了全栈的企业AI应用平台。
目前,Writer全球数百家大型企业作为客户,它的AI应用和AI Agent也能在系统和团队之间规划和执行复杂企业工作流程。这些客户包括Mars、Qualcomm、Salesforce和Uber在内的财富500强公司,他们的长期客户里还有Vanguard、Accenture、L’Oreal(欧莱雅)和Intuit等行业领先公司。
Writer表示,它们已经客户为节省了数百万小时的生产力,并且平均实现了9倍的投资回报率。预计到2024年年底,Writer将从其300多家客户中实现约5000万美元的年度经常性收入。
在具体用例上,Uber的Writer版本生成了对常见客户支持问题的回答,Qualcomm的法律团队使用Writer管理数百个商标并分析市场趋势,Dropbox则依赖Writer生成SEO博客并校对现有内容。
在2023年,它们的收入增长了10倍,净收入留存率超过150%。
结合Writer以及Glean和Sierra的例子,我们发现,企业希望AI具有低成本,可控的属性,而且希望AI能够深入它们的业务和工作流,帮他们解决复杂的问题。这个低成本不仅是运营成本,也是部署和扩展的成本。
但是这三家公司其实一定程度上提供的都不是传统的SaaS模式,而有比较重的定制化成分。大家此前普遍认为定制化会让企业服务类公司很难赚钱。上一波AI浪潮中很多发展得不错的公司,也面临这个难题。
对于AI公司,模型的训练是成本的大头,Writer采用的策略是降低模型本身的成本,并且训练和微调一些行业模型来进行半定制化(这样会提升通用性,降低成本)。
对于中国市场的企业AI创业者,有一个利好是企业AI的难度很大一部分在于场景、产品能力、以及工程能力,包括解决复杂问题的RAG技术、Agent搭建、AI基础设施的部署,而这些能力中国的创业者和工程师们是很强的。
另一个就是模型成本的降低,而这方面,无论是使用海外(llama)和国内(Qwen)的开源模型,还是对大的基座模型进行行业数据微调和增强推理能力的后训练,其实成本相对都在可控范围内。
在进入市场方面,中国显然有巨大的市场和丰富的场景,而且因为企业AI能解决的问题比传统SaaS解决的问题更难也更有价值,这个潜在市场还可能更大。中国创业者们可以学习Writer的客户策略首先找容易进入的领域为入口,然后完善产品并往利润高的肥水田进发。
文章来自于微信公众号“阿尔法公社”,作者“发现非凡创业者的”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner