AI 不是万能的,不做 AI 是万万不能的。
开源大模型的发展,大模型使用成本的不断降低,推动大模型应用进入爆发期。
据国家互联网信息办公室公布,截至2024年8月,我国共有188个生成式人工智能服务完成备案,大模型进入“落地之年”。
IDC数据显示,2027年,中国生成式 AI 投资规模将超130亿美元,五年复合增长率为86.2%。在近两年生成式AI的投资热潮下,诞生了一波明星公司,也产生了不少泡沫。有媒体统计,截至8月,2024年国内新增 AI 公司约30万家;而从 ChatGPT 发布到今年7月,国内倒闭的 AI 公司有近 8 万家!
从全球范围看,SaaS 厂商都在积极拥抱生成式AI 技术。然而,“SaaS+AI”最大的挑战,仍在于商业化的不确定性。
目前国内“SaaS+AI”商业化仍处于早期:大模型技术仍在快速迭代,新的技术范式尚未形成,落地场景还在不断探索和细分中,大模型在 B 端具体场景中的应用价值仍待验证;训练企业级大模型,也需要大模型厂商和SaaS厂商在数据和服务链路上打通……
大模型浪潮下,SaaS 厂商,如何穿透 AI 商业化的迷雾,拥抱 AI 新增量?
一位 SaaS 企业CEO告诉牛透社,“SaaS厂商在 AI 上的投入有点像‘炼丹’,具有较大的不确定性。对生成式 AI 的过高预期,试用后的过低预期,让当前一些客户在尝试 AI 服务时都比较谨慎,在价值验证之前,客户通常希望厂商能够完全投入;模型训练需要客户提供数据,有的客户也不愿意提供。”
目前,大模型技术仍在快速迭代中,新的技术范式尚未形成。理性看待大模型的能力就非常重要:既不能过于低估而不去尝试,也不能过于高估,以为大模型能搞定所有问题。合理的做法,是根据大模型的能力边界,在现有客户场景中为大模型找到适当的用武之地。
同时,还要协同各种技术手段,包括人工的方式来解决问题。比如哪些可以用生成式 AI 替代,哪些需要结合传统 AI,哪些需要人工辅助……需要 SaaS 厂商依托行业 know-How,结合场景、数据、成本等因素后综合判断。
找到 AI 落地场景,是大模型迈出企业级应用的关键一步。
谈到近期在 AI 商业化方面的进展,成都晓多科技产品与方案中心负责人田曲称,“今年 5 月,晓多科技的 XPT 模型,完成了电商行业大模型的国家级备案,是智能客服领域第一个实现国家级备案的大模型。从目前来看,在综合考虑和验证了大模型的可控性、成本和效果(能不能真正解决业务问题)之后,我们对于在电商和智能客服领域,与大模型结合后能干什么、不能干什么,有了更加清晰的认知。从以前的探索阶段,进入了一个全面落地的阶段。”
与传统 AI 相比,大模型具备了一定的推理和内容生成能力,在交互方式上具备更高的拟人性,这使得大模型在一部分对话和内容生成的场景下更具优势。然而对于一些严谨的 to B 业务场景,大模型幻觉和内容生成质量,目前仍是一个严重制约。大模型的能力边界(可控性),是寻找大模型落地场景时的首要考虑因素。
此外,与可控性相关的还有安全合规性,这也决定了大模型在一些不影响到用户信息或数据安全的场景中更容易推广。田曲说,比如在智能客服领域,客服培训用大模型就非常适合。AI 模拟买家做咨询,对客服做训练,并不涉及与真实买家的对话,因此不会关系到企业的敏感数据以及买家的个人隐私数据,这也是目前晓多科技在 AI 应用上重点推广的场景。晓多科技结合大模型技术的“AI 训练场”产品,推向市场后也得到了客户的认可和快速增长。
同样,还有内容电商赛道,因为 SaaS 厂商帮助商家生成的营销内容,很快就会分发到各个公共平台,具有公众传播的属性,因此也是很好的落地场景。
“SaaS+AI” 商业化三要素牛透社制图
结合上图,一些和 AIGC 强相关、可控性强的场景,比如 AI 陪练、智能对话、知识管理、内容电商等场景,比较容易找到与生成式AI的结合点。
每一次新的科技革命,总会带动一波新的创业浪潮(泡沫)。在这波大模型创业浪潮中,从百模大战,到知识库、Copilot、AI Agent……每个场景都可能有大量公司投入研发,盲目竞赛而导致泡沫:比如表面功能的堆砌、同质化的微调;偏离客户痛点,投入半年也摸不清客群、市场、产品定位,等等。
正如吴昊老师(独立SaaS顾问、《SaaS创业路线图2.0》作者)在“SaaS+AI创新大赛”后总结三类失败案例时所提到的:“浅、泛、浮”:“浅”是指层应用,没有深入挖掘行业需求和痛点;“泛”是指功能泛化,缺乏聚焦,无法提供明确价值;“浮”,是指缺乏业务基础,试图一蹴而就地实现功能全面的解决方案。
这正是技术驱动而非场景驱动所带来的泡沫。
然而,泡沫的另一面,还要看到增长机会:“SaaS+AI”,为 SaaS 带来新的关注度;私有部署的高门槛,让生成式 AI 更多通过云端普及,促进客户更加接受 SaaS 的公有云和订阅模式;AI 创新,增强了客户对 SaaS 厂商的认可与信任;AI 产品带来的交叉销售,可以增加 SaaS 厂商的 ARR……这些,都是 AI 可能带给 SaaS 的新增量。
以电商行业为例。极睿科技创始人兼CEO武彬表示,“生成式 AI 进一步降低了电商商家的选品、供应链、销售等经营环节的成本,为许多商家带来了弯道超车的可能,也为周边服务商创造了新机会。极睿每年的收入规模都在快速增长,大概两年能翻十倍。”
目前,生成式 AI 可能更快重构的行业,主要集中在电商、智能客服、知识管理、创意工具等与 AIGC 强相关领域。对于这些赛道的 SaaS 厂商来说,加大 AI 投入都是战略上的正确。但从 ROI 来看,大模型商业化还处于早期,SaaS 厂商更宜关注 AI 创新带来的长期增长机会,比如客户黏性增加、交叉销售机会等,而非过于看重盈利收入。
AI 真正能为 SaaS 带来持续增长,仅为客户创造情绪价值还不够,明确的、可量化的价值体现,才能让客户续费。
从目前实践看,生成式 AI 与传统 AI、数字化工具融合,包括人机协同的混合模式,是实现AI商业化的一种可行方式。SaaS+AI,是混合赛,而非单项赛。
生成式 AI 与传统 AI 结合,是实现 AI 商业化的有效路径。田曲认为,这主要是基于两点考虑:一是客户业务。并不是所有的业务场景都必须要使用大模型。比如一些智能客服的简单应答场景,传统 AI 效果已经够了。而在一些高价值的复杂业务场景,才需要利用生成式AI来突破效果的“天花板”;二是成本。在效果能达到的前提下,商业化必然要考虑ROI,“在一些业务场景下,几百兆的模型跑起来既高效,稳定性又强,从ROI上考虑就没必要使用大模型。”
在武彬看来,生成式AI 技术与传统 AI 技术,更多是一种替换和叠加的关系。“极睿最早的产品是基于判别式模型,结合Template(模板)、Rule-Based(基于规则)构建的。2022年底,生成式AI技术逐渐成熟,极睿产品的一部分底层能力用大模型做了替换;大模型也为内容电商带来了一部分新能力,比如模特的上身、视频的剪辑加工,更好的内容生成效果等,我们能做的事情也变得更多。”
To B 业务的流程和复杂度较高,生成式 AI 的可控性还较弱,目前还很难完全用生成式 AI 来满足 to B 场景的需要。因此,在武彬看来,很长时间内,混合模型仍是必要的。“可控性是 to B 领域最核心的要求。以电商内容为例,如果做出的效果很 Fancy(花俏),但和实际货品不一致,这样不仅没有用,还可能涉及虚假宣传。因此,可控性一定是最大的优先级。”
除了结合传统AI技术,生成式AI也需要与人工结合,才能更好地解决大模型落地的可控性难题。武彬提到内容合规审核的场景,除了极睿内部的审核机制之外,商家还可以通过Copilot,在发布内容前通过人工辅助审核来提高可控性。
Copilot的人机协同方式,目前在医疗、法务等专业领域也有应用场景。从Copilot到AI Agent,以及多AI Agent的协同,人机协同方式在不断进化,数字员工正逐步走进现实,成为新的工作范式。但生成式AI与传统AI、数字化工具、人工的结合,仍是目前AI商业化的可行模式,核心逻辑仍是以客户需求导向,用新工具不断帮助客户提升解决问题的能力和效率。
训练企业级大模型,需要一定的专有数据。但目前挑战在于:在很多场景下,大模型与专有数据之间是割裂的:企业的私有数据很多都是闭源的。SaaS 厂商的专有数据同样也是闭源的,它们都被数据所有者视为自己的核心资产(竞争壁垒)。
出于对核心数据资产的保护,有条件的 SaaS 厂商通常会选择利用开源大模型部署和训练自己的行业大模型。在数据管理上,把客户的企业私有知识(数据),植入私有的向量数据库,实现租户级的隔离。通过这种方式,SaaS 企业或者客户,可以更好地保证自身数据的安全可控。
谈到开源大模型,武彬表示,目前极睿科技没有选择闭源大模型,而是在开源大模型的基础上,拿自己的数据来训练垂直行业的大模型。因为开源大模型能保证SaaS厂商掌控自己的数据,以及更好的训练效果。对于极睿而言,选择开源模型,不仅是出于市场需求考虑,同样也是企业的长期发展战略。“在比较长的一段时间之内,我们都不太可能选择闭源模型,因为调用闭源模型的 API 接口,可能把我们的数据传出去,而数据是我们的核心资产,也是我们的竞争壁垒。”
使用开源大模型,SaaS 厂商更容易实现产品迭代,提升服务闭环的效率。
“大模型厂商如果能将模型开源出来,让应用厂商可以加入自己的专业知识和数据,对整个行业和生态创新都将是一种推动力;闭源大模型对于SaaS厂商来说就好比一个黑盒,模型的底层是封闭的。如果需要优化和调整模型,SaaS厂商只能向大模型供应方提需求,由其协助进行。在商业化过程中,这样的服务和迭代链路就会比较长。SaaS厂商使用开源模型,在部署和管理上会更加可控。”
田曲在提到上述问题时表示,晓多目前的做法是根据场景不同,选择开源或者闭源模型。比如,对于涉及买家和用户侧信息安全的场景,如智能问答,晓多使用的是自己的专业大模型,即XPT模型。这样做一是效果更可控。客户有反馈,不用再经过第三方,在问题处理和服务链路上更可控;二是数据安全。避免把买家信息暴露给通用的第三方模型,造成数据安全与合规风险;而在类似"AI训练场”模拟买家对话场景,晓多更多是考虑采用行业生态合作伙伴的模型能力,来实现业务效果和目标,共建AI生态。
在对SaaS厂商的调研中,我们发现闭源大模型与应用厂商之间更容易存在一种割裂关系。这种割裂,不仅体现在大模型技术与垂域知识、数据的融合上,也体现在面向客户的服务闭环上,这些都是影响“SaaS+AI”商业化的难点。
开源和闭源,作为两种技术和生态,就像苹果和安卓,或者Windows和Linux一样,一定是长期并行的关系。选择开源模型还是闭源模型,还需要SaaS厂商结合自身战略,以及客户场景、成本、安全可控等因素综合考虑。
任何一种技术应用,都会带来业务流程的重塑,生成式AI同样如此。这个重塑是一个逐渐渗透和替代的过程。
有赞创始人兼CEO白鸦在解读有赞2024半年度财报时提到,未来将不断加强AI技术在产品中的体现,帮助客户降低使用成本、降低试错成本、提高经营效率;此外,在有赞内部,AI也可以持续优化客户服务、市场销售、产品研发效率等作业效率。
同样,北森的客服中心通过AI技术回答客户问题,极大提升了效率。
极睿也一直非常注重利用AI来提升自身效率。极睿的创始团队具有很强的AI背景,但相比较AI原生,武彬更看重场景原生,他提到极睿主要是聚焦电商场景,通过不断提高AI替代率,来提升服务客户的效率。“从 Day one 起,极睿内部就有一个AI替代率的指标,用于考核哪些服务客户的流程是能被AI所替代的。”
武彬发现很多品牌和商家并没有真正把工具用起来,这也是国内工具类SaaS常见的挑战。因此极睿在提供工具之外,同时也下场做运营和服务。
“有一些客户如果不会用工具,我们可以通过工具直接帮客户生成内容;此外,我们还可以直接帮客户带货,通过内容实现成交。”用武彬的话说,极睿是一家坚持“技术实用主义”的公司,AI替代率考核的是极睿团队在服务客户过程中的效率能力,“AI替代率是一个持续改善流程的过程,AI也不太可能一上来就把所有的事情都做了”。
以客服场景举例,在AI的加持下,如果5人能完成原来10人的工作,省下的人力就可以做更有创造力的事,比如客户洞察、增值服务等;同时,生成式AI也会带来交互体验、内容生成质量的提升,这些也会改善客服机器人的对话效果,带来AI陪练等新场景,从而推进智能客服业务流程的升级。
随着生成式AI渗透率的提高,生成式AI也将成为数智化加速的核心技术,“SaaS+AI”的商业化,也是从一步步提升AI替代率开始的。
大模型应用的爆发,可能为SaaS厂商带来新增量,也可能带来泡沫,主要取决于SaaS厂商是否找到了真正具有商业价值的落地场景。就好比冲浪,找对浪头比速度更重要。
从目前阶段看,“SaaS+AI”不是为了创造新的需求场景,而是要在原有需求场景中,找到更优解。生成式AI与传统AI、数字化工具的融合,包括人机协同的混合模式,是AI商业化的一种可行方式。
在采访中,我们发现开源大模型,目前可以更好地满足模型使用方(SaaS厂商及其客户)对数据安全可控的需求,提升服务效率。数据是智能之源。训练企业级大模型,需要大模型厂商和SaaS厂商在数据和服务链路上打通,这也是“SaaS+AI”商业化亟待突破的一个关卡。
文章来源于“牛透社”,作者“张保文”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner