2023年是大模型走入公众视野的第一年。共识粉碎机也从这年开始将写作与活动内容都聚焦在AI领域。
4月份,我们写下了第一篇AI大文章《AI如何颠覆软件:你能为AI打工吗?》。
一年后再回过头看,发现多数对了,但也有明显错的。
对的地方:
没我们想得好的地方:
错的地方:
当时我们提到未来一年是赛跑,现在回过头来看:
《创新者的窘境》中描述的经典情景在2023年没有复现,积极投身研发的成熟企业在面对大模型出现时,还没有出现掉队迹象。我们还没看到新时代的柯达、百代唱片和西尔斯百货。
归根到底,大模型的成长情况在2023年还只能算作是“延续性创新”,随着Agent的继续进化才会到达“颠覆性创新”。
这是一个无比聪明的时代。因为在这次之前,有过很多反面教材。
你不能再靠指望大公司犯错,找到弯道超车的机会。
一、开始摘Low-hanging Fruit(2024)
我们在2023年看到了很多大模型的应用苗头:
在2024年,这些不需要多步推理的场景会随着成本和延迟的改善而真正到摘果子的时候。
如果将AI产生的价值,以面向的人工智能群体来分:
我们首先会看到价值替换的会在客服行业:
同时我们也会看到替换发生在审核行业:
Semantic Search从2023年底正在成为最热门的创业方向:
Copilot作为目前AI SaaS中TAM最大的场景也会收获第一次果实:
同样的原理我们也会在设计行业大幅看到,创意行业相比其他更加严谨的行业,提高效率也更加明显。
二、我们会第一次看待AI带来的Real Economic Impact(2024)
有一个比喻对现在的很多AI产品很合适,“买一个AI产品就像为员工买一把人体工学椅”。可能很有用,员工更精神了,但多喝一顿下午茶效果就没了。
2024年要摘的果子和人体工学椅已经截然不同。不再是粗糙的计算为员工提效了多少,而是可以直接计算企业级别的利润率提升。并且落地成为GDP和资本效率的贡献。
这非常重要,LLM第一次对世界有了Real Economic Impact。
以客服行业为例,目前普遍的AI客服定价都隐含相比人工客服接近1:10的ROI,这意味着过去在美国一位年薪5万刀的客服人员,在应用大模型产品后成本会降低到5000刀。
如果算笔大账来看的话:
节省的成本我们会看到可能会继续投入到市场扩张中,也可能成为永久的提高一批企业的利润率。从微观角度上看,很多类型的行业都会因此而永久受益:
除了客服以外:
需要值得注意的是,LLM带来的替换也不会一蹴而就:
假如这些场景能带来2500亿美金的利润增量是什么概念?
企业ROI的提升,也同样会带来裁员风险,更高的利润率也意味着员工也会减少。
很不幸这样的变化,可能也会在2024年成为主流话题。
但无论如何,全社会生产力的提高,都会带来更多的税收和福利,支持普通人探索更多领域的生活。这是一个更加长远的话题。
三、下一代Turbo会成为很多场景的分水岭(2024)
2023年底OpenAI的DevDay在我们看来是一次伟大的变化,他的效果可以用低开高走来形容。最初的舆论倾向于DevDay上没有看到新的技术进展,没有看到新模型,只看到了意料之中的降本和没什么用的GPTstore。
但回过头来看,我们会看到处于商业模式跑通临界期阶段的每一次降本和性能提升,都会明显带来需求赛道的解锁:
我们对下一代GPT 4.5/5 Turbo尤为期待,并期待下一代Turbo能继续解决这几个难点,成为Low-hanging Fruit场景真正走向大规模商业化的分水岭:
在下一代版本中,我们不需要Agent和幻觉有多大程度的优化,仅从成本/延迟角度,就足以打开很多商业想象力。(相比我们讨论的Low-hanging Fruit领域)
四、围绕AI衍生出新的Data Stack标准(2024)
全行业都非常关注Data Stack领域,“做好大模型首先得有数据、然后得有合适的数据架构”。从年初LLM展开后,所有人都在讲类似的故事。
但该有什么样的架构,一直到2023年底才变得越来越清晰。
回到2023年初,行业有一个非常模糊的概念:
但经过了一年时间,发现大模型的需求不仅于此:
而回过来看数据行业的先进大公司,各自的探索方向也完全不同。
Databricks作为AI领域的先行者,率先打造了End-to-End的full stack方案:
Snowflake在开头落后Databricks后,也迎头直上,找到了自己的发力点:
Elastic和MongoDB花了更多的时间在构建自己的RAG方案上:
除了我们熟知的几家公司,在向量数据库和RAG开发者排名中,创业公司也大放异彩。这包括我们熟知的Pinecone等,以及中国出海的Zilliz、MyScale等优秀公司。
这也使得Data Stack公司在面向大模型客户时出现了与过去不同的标准:
五、我们可能会经历一次断层,但可能不重要(2025)
相比上面提到的Low-hanging Fruit,摘更高一点的果实要困难得多。
Low-hanging Fruit之所以简单,是因为对Agent、容错率、幻觉的要求都没那么高。
在更复杂的场景效果通常都不如人意,而且看起来可能不是一两代模型就能解决的。
目前的大模型在做容错率低的场景时仍然面临很多问题,远没有我们想的那么神奇:
而到了Agent情况时候,很多Agent平台上的客户也只能做到2-3步的推理,停留在“在车里说热,车会开空调”的水平。
这同样从Copilot Pro上市后面临的大量用户吐槽中可以看出,A16z的投资人@Guido Appenzeller在Twitter抱怨了一连串的Copilot Pro使用体验。这是个很好的例子让我们可以展开聊聊:
看到上面这个问题后,我们就很容易理解Workflow产品为什么很难短期跑出来完整的LLM产品:
这些复杂的场景受制于模型能力、RAG发展、数据清晰、场景定制,每一个环节都会影响最终的准确度。每一个场景最后可能都有一个准确度的魔力指标,可能是95%,也可能是99%,在达到准确率指标前都是爬坡期。
也因为整个环节中有多个步骤,每个环节都会互相影响。同时在对问题拆解,或者要回答多个问题的时候,也需要关注连续正确率。这都使得难度进一步放大。
如果AI应用一直都还聚焦于Low-hanging Fruit,很快就会看出天花板的端倪,再次进入到一个不能证实、不能证伪的阶段。
我们不清楚这个断层会有多长,有可能是半年一年,也可能会更长。
六、2C领域成长很慢,游戏、音乐、教育可能是最先跑出来的(2025)
大模型的产品发展与互联网的产品发展有一个截然不同的地方,边际成本非常高:
这使得2C互联网爆炸期,我们在每个月都能见到很多产品迅速跑上100万DAU,其中有的存活下来,有的又昙花一现。这也让当年的投资人要花很多精力去鉴别是否存在DAU造假,以及评估DAU的持续性。
但在大模型时期,DAU不再是获取用户的过程,它成了评估商业模式的结果。
做2C产品,就像做2B产品一样,要非常小心而且缓慢的去跑Product-market Fit,去找到能跑通商业模式的核心用户群。一旦错误地估计了自己商业模式跑通的能力,就可能被成本压得喘不过气来。能跑出来100万DAU的产品就已经非常成功了,证明了他烧对其100万DAU对应的模型API费用。
在2C上面想不通的问题,对照到2B产品上就想得通了。SaaS行业里哪怕增长最快的Snowflake和Databricks,在成立的前五年都没什么收入与用户。
在成本之外,2C产品还面临着很多额外的问题:
创意型的内容场景例如游戏和音乐可能会最先跑出来:
在教育场景体验类中:
七、Workflow很难,但单点功能可以看到(2025)
我们上面讲到了Workflow为什么很难,但不做整体、做环节的SaaS产品很大概率都能看到价值提升。
在此我们就不做赘述了,多数的软件公司都在往这个方向探索。相比“破坏性创新”带来的架构推导重来,“延续性”创新更加容易,也很快会带来客单价的提升。
八、或许可以替代更高阶的职能(2026)
在客服、审核等技术门槛低的工作达到被AI颠覆的门槛后,有一些更高阶的智能也可能被替换,但也取决于更高阶场景大模型的错误率会降低多少。
首先是电销行业,电销行业是客服的进阶版本:
然后是数据分析师,程序员的弱化版本:
再然后是后台支持的运维分析师和安全分析师:
项目经理也可能被颠覆:
相比产品经理与工程师,项目经理在开发环节更容易被影响。
九、工业领域会看到很多多模态实践(2026)
工业场景对大模型落地属于容错率相对较低,行业know-how要求特别高:
大模型先在替代简单而重复的工作,在更加细分的容错度比较高的场景进行渗透:比如说初级运维人员,比如说一些允许试错的偏向于科研的场景。
处理简单任务的多模态能力是需要的:
数据平台可能更加重要:
十、基建与电力可能比GPU更稀缺(2024~2026)
Elon Musk说“2024年缺数据中心、2025年缺电。”
Sam Altman说“AI浪潮将会产生大量的能源需求。”
微软已经开始申请建设核电站。
能源行业在美国是一个高度监管行业,在数据中心申请开建时就需要一并申请能源指标,这使得2021-2022年申请的能源指标远远不够。
单GPU的用电需求远远高于CPU,随着LLM需求的大幅增加,2-3年前申请的能源指标已经不够用了。这也使得最近作为小型替代方案的柴油发电机、固体燃料电池价格不断走高。
数据中心用电量大概占到美国用电量的2%,但数据中心新增用电量需求量成倍增加,过去电网结构等问题也可能再次成为制约。
抢到更多的数据中心和能源指标,才有能力把GPU装进去。
本文来自微信公众号:共识粉碎机(ID:botaijin),作者:波太金、小熊猫、芋圆子
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales