近来看了些基于大模型的产品,真的是差点把自己看哭了。
倒不是悲天悯人,而是想起了过去十年里被这些创意和产品折磨的日子。
这些产品是死路,但新的一波同学们可能太新,所以并没有过去十年的记忆,因此在大量重复过去的故事。
这些创意在底层逻辑上并不会因为大模型就改变境遇,关键是内部结构的矛盾性,这些矛盾性在很多项目上并没有因为大模型而缩小,其实是放大了。
这里总结些典型的蕴含矛盾会搞死自己的模式,供感兴趣的同学参考吧。
长期做AI的同学大家都知道,上次的人工智能创业因为迟迟无法在产品上构建现金流,最后不管多有名的企业,不管起点是视觉、语音、NLP,最终大家的归宿几乎是一样的:做解决方案。
在开始投标、需求打磨、开发、交付这条路之后,前面说的结构性矛盾就出现了。
对于这种重运营、渠道工作,在内要消耗大量的人力,在外则定价的时候基本没啥发言权。
这难处就正好打在了创业公司的七寸上。
AI创业公司人贵,不擅长精细化运营。
真干上面这类工作要有点干毛巾能拧出水(稻盛和夫)的本事才行,技术在不影响定价权的时候其实反倒是不关键。
创业公司如果有精细化运营的本事那就不是创业公司。
基本处在傻大黑粗干想敢干阶段的创业公司和这个要求是矛盾的。
让科技公司改成这样,那差不多相当于让悟空、八戒天天念经,有紧箍咒都不好使,何况还没有,也没这意愿。
再加上人贵,于是就只能天天亏损。
一亏十年,其实是把一个本应技术产品驱动的活干成了运营业务驱动的细致活的必然结果。
这和谁干没关系,套在这种结构里面,谁进来都够呛。
大模型之后,这个模式的境地其实是变差了(还有经济环境变差的原因)。
因为大模型上的支出其实是提高的,不管是模型本身,还是人员成本,但你定价一端并没有变化,对精细化运营的要求也是有增无减。
有时候就会碰到几十上百万的项目四处找大模型的情况。
而为了拿到这些机会,模型的价格就一路下降。
这是个什么路数呢?
一个公司倾尽全力大模型也不一定能干好,所以随便那个领域的模型也不可能仅靠一点预算就能干出个有价值的结果。
一旦这类活启动,那最后只可能是在这链条上的人一起想办法把事情对付过去。
供给方赚个流水,还不一定赚钱。
消费方,花了钱拿到个不能用或者不好用的模型。(因为技术本身迭代很快,这么做出的模型只可能越来越不好用)
然后在外部声浪的助推下(比如OpenAI的新模型),这事一次一次发生,然后一次一次透支AI的预期。
在小模型或者互联网的情况下,这路不怎么赚钱大致还能走,在大模型的时代,这是条死路。(后面还跟着私有部署、长期运维等一系列事儿呢)
贴个图,这事就适合用五力模型看,一想特别清楚:
过去十年还一个和AI双生的巨大失败是SaaS的集体玩不转。
现在甚至一度到要给自己放义勇军进行曲进行激励的程度。(到了最危险的时刻)
说原因的人很多,但一直不怎么在点子上。
到点子上就会有点绝望,但绝望之为虚妄正与希望相同(鲁迅)。
我们可以用一句话从结果先进行总结:
单点工具在国内玩不转,没人付钱。
比如过去CRM不好卖,换成大模型做的CRM就好卖了么?
显然不是。
为什么不付钱呢?
这只能到工具的价值结构里面去找答案。
如果你是生死攸关的工具,那就怎么也得买,顶天不愿意续费。
如果是改善型的工具,那差不多能用就得了,我干嘛多花钱,别的钱还不够呢。
(和SaaS对比,是过去这些年在数字化上花的钱,其实一点也不少)
我们总和外国比,但泥土不一样,其实没的比。
泥土不一样还不是什么经营理念,而是老外IT、人都贵,弄SaaS是顺势而为。
我们要反过来逆势整,肯定就没人埋单,底层是需要创造更大的价值。
为什么从AI说到SaaS了呢?
因为SaaS代表了一种AI落地的形式:单点的功能型工具。
如果把模型进行简单包装,弄成XX写作、XX助理,那命运和SaaS肯定一样。
比SaaS还不如的是还随时得提防会不会被通用大模型碾压。
通用大模型像一个巨大的从山而下的雪球,这种小工具要在它的路上,那稍微挡路肯定被碾死。
上述这种小工具不单是SaaS还有很多变种。
比如各种堆集到音箱后面的技能,做个绘本、放个闹钟等等不一而足。
这种小技能在有些应用商店里一度上万,但其实时间稍微一长,做的人都不记得为什么做它了。
这事唯一有价值的可能是配合上一节说的,在报价的时候看着比较另类,辅助投标。
不是说单点工具不能做,但做的逻辑就变成快点做,快点赚点钱,并且不要在国内。
单点工具不好做,那做ERP整体工具是不是就可以了?
这还有另外一个坑。
近来谈Agent的人多了起来,但看着好像离这个坑越来越近。
整体性工具和直接用chatGPT最大的不同是什么呢?
它重构生产关系。(Copilot生产力,ERP生产关系)
说生产关系大家可能没感觉,可以再换个角度:重构资源流转和利益分配的方式。
这事《创新者窘境》里说的比较透彻:资源、价值观、流程定义分配秩序,而分配秩序就定义了企业擅长干什么不擅长干什么。
这个价值观最核心的部分可不是挂在墙上的以人为本什么的,而是谁拿多少钱,谁花多少钱的根子。
它的变化影响一个组织里面利益分配规则。
最简单的导入机器人都会让一部分人被淘汰,何况更顶级的整体性工具。
在这里整体性工具的收益要对冲的是既有资源流转体系。
如果是企业级工具,那无疑需要极为强势的推动。
新公司来做实在不乐观。
大家应该还记得流传颇广的华为上系统的时候削足适履一说,不支持的请离开。
模型本身就有不靠谱的地儿,再抗这么重的领域,有点像小树苗当大梁用。
第一很难构建现金流,第二即使构建了估计也不可持续。
我如果就写这也不行,那也不行,那估计会被喷:想那么多事干啥,干就完了(义和团用金钟罩铁布衫抗洋枪差不多就这样)。
所以要再写下新的领域究竟在那儿。
我们面临两类不同的业务情景:一类是变量数目其实定了;一类是究竟有多少变量还不知道(北大国发院王超老师管后者叫顽劣问题)。
比如我们盖房子差不多是前者,但做大模型或者大模型的应用就是后者。
两类结果都不确定但需要的思维方式其实不同。
前者还是要尽可能专业化,把细节搞很清楚,专业化,然后再下手。挖煤矿不尊重这种专业化,大概率吃不了兜着走。
后者就没法这么清楚和专业,要关注底层逻辑,然后结合到底相信什么做判断。(人类所知甚少的时候就什么都是哲学,但科学昌明后很多哲学问题变成了科学问题)
AI应用基本上是后者的状态,需要在一片混沌中形成一个自己自洽的套路,然后从未来中捞一把,也许能抓到些什么。
为了让这个过程有点套路,我这里提供一个底层逻辑的思维框架供参考:
不要再考虑单点工具了,在单点工具上AI并不比过去的技术进步多少。邮箱用不用AI其实没那么大区别,加个语音的交互的天气功能和手戳两下也没太大区别。
这次AI核心特征是能够理解概念,能够自主形成判断。
基于这个特征构建出的工具才是蓝海里的工具。至少是现有工具都干不了的事。
过去是累积一圈的各种功能型工具,企业里比如邮箱、电话会议、OA、代码管理工具等,这次是要联通。变成一个自主的“智能人”。
把AI放在原来各个工具里面,有点像电脑都出现了,还只是就用来当算盘或者打字。
即使是角色中心式计算的视角,你还要看到底这事能不能干,如果像上面说的和整个企业犯冲,那做的再好也形不成现金流。
这绝对是个产品视角,产品视角是个大综合的视角,高于现有工具、产品,高于模型。
这时候要有技术视角的判断,比如任何一个角色如果要细分可能要拆解成100个行为或者判断,那现在的模型在这100判断上表现怎么样。
如果考虑它偶尔抽风,精度基本还行,那技术供给是够的。
更要有角色本身的判断,比如这个角色的相关部分是否充分数字化了,别拿到的信息就不可能准,那模型再好也没用。
基础判断没问题,再快速验证,然后AI代理的这个角色不单从与人沟通中无法识别是AI,从现实反馈上也无法识别,那测试就算通过了。(比如你想发Offer,它真的发了)
一定不要互联网思维,不要单点极致口碑快。这些和AI思维冲突。
天时已经改变,换了人间,不要再老套路,如果不信可以回顾下智能音箱。
能够承接角色中心式计算和通过图灵测试2.0的一定是智能原生应用。
过去所有技术达不成这个目标。
那智能原生应用的核心特征是什么呢?
简单说可以叫:万物皆数、实时反馈、中心决策。
数字化必须足够充分,不管是项目还是统一性。
CEO再英明神武你给他假的信息一样昏聩。比如:坑爹的极致之一就是袁克定给袁世凯办了个报纸,然后袁世凯这北洋领袖就这么走了。
这里最难的不是事本身,而是持续做到这点所产生的隐性成本。
如果上层应用没打通,没有一种持续确保措施,那数据天生会变混乱和不准。
实时反馈说的是信息的在时间轴上价值不等。
那个将军能用两年前的情报指挥战斗呢。
中心决策其实揭示了另一个智能原生应用的底层规律。
智能的效能=模型X信息完整度。
所以必然有个中心代表完整度,这还不单是模型决定的。
架构要按照这三点进行设计。
第四则是落地的时候要搞定从1到10。
本文来自微信公众号“琢磨事”(ID:zuomoshi),作者:老李话一三
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md