AI-Native 的应用 Day One 就应该收费。这几乎是开发者当下的共识。
信息产业的历史多次证明,在一个有网络效应的产业里,往往是低价打败高价,免费打败付费。
在 AGI 的时代,到底是商业历史的再次重演,还是会衍生出新的商业规律?
这个话题我们也一直在思考。尤其是最近在 Founder Park 研究中心、变量资本的几次产业讨论中,这都是最后会涉及的话题。
如果说,移动互联网的成功,是因为移动互联网的网络效应与广告模式完美契合。那么,在 AGI 时代,很可能会产生加强版的网络效应,我们姑且称之为一种「智能聚合网络效应」,那就意味着长期来看,「付费」并非最优的竞争策略。
在这个「智能聚合网络效应」里,随着用户数量的增加和数据的积累,系统的智能能力得到聚合和提升,形成了一种网络化的智能增值效应。数据将成为最重要的生产要素之一,其价值和作用将远超互联网时代。数据的收集、处理、分析和利用将成为经济发展的重要驱动力。
得数据者得 AGI 的时代,付费真的是最优竞争策略么?
或许我们可以从 Scaling Law、技术共识、经济共识聊起,一起探讨下这个时代的竞争策略。
Scaling Law 在通用人工智能领域,已经成为一个重要的理论框架,最早来自 OpenAI 2020 年发布的论文,主要指的是模型性能与模型大小、数据集大小以及用于训练的计算浮点数之间的关系。
Scaling Law 的意义在于允许研究者预测模型性能随参数、数据和计算资源变化的趋势,这对于在有限预算下做出关键设计选择,如确定模型和数据的理想规模,避免昂贵的试错过程,具有重要意义。
2024 年初,OpenAI 发布 Sora,在其技术报告中再次强调了 Scaling Law。Sora 背后使用的 Diffusion Transformer 模型,也遵循随着用于训练的计算量增加,视频质量显著提升,这也让 Scaling Law 再次受到关注。
但即使如此,Scaling Law 今天还未成为行业技术共识。这也是为什么还有很多人仍称之为「信仰」的重要原因。
事实上,围绕 Scaling Law 的争议、讨论与质疑,在过去一直未有间断。比如,有人担忧,到 2024 年,高质量的语言数据将会用尽;比如,现在模型的「智能」可能是记忆力而非「智力」;比如,有人甚至认为,大模型存在方向上的路线错误,大模型只具有通过观察进行因果归纳的能力,不具备因果演绎的能力,就意味着其不是一个「能够理解世界」的模型。
在实际当中,以 Llama 为代表的模型也采用了不同于 Scaling Law 的开发理念。在 Llama 的思路里,给定模型的目标性能,并不需要用最优的计算效率在最快时间训练好模型,而应该在更大规模的数据上,训练一个相对更小模型,让模型在有限推理资源下有最佳的性能。
比如,Meta 田渊栋团队近期提出的 MobileLLM,通过深而窄的架构以及嵌入共享和分组查询注意力机制,提高模型的准确率。背后的逻辑即是深度比宽度更重要,这也与 Scaling Law 的技术理念相反。
从这些业内反馈来看,当前,Scaling Law 还不能称为像「摩尔定律」一样的技术共识。
即使是信仰「Scaling Law」,但在中国市场,大型语言模型还未能够充分体现 Scaling Law。
AGI 领域的 Scaling Law 的三要素:算力、算法、数据。为了实现 Scaling Law 则需要大量低成本资金的支持。
相比于海外模型头部公司,中国模型公司在算力、低成本资金两部分,处于劣势。因此一段周期内,中国的模型可能很难达到与 OpenAI 相同的模型能力,充分体现 Scaling Law。
算力对于 Scaling Law 的重要性已无需多言。它直接关系到 AI 模型的训练速度、模型的能力、复杂度与精细度。但随着国际关系的变化,中国在先进制程算力方面受到的限制日益明显。追赶先进制程,仍需要一段周期。
当前海外市场用于训练大模型的芯片,主要还是英伟达的高端制程芯片,如 H100 、A100 等。根据红杉美国最新发布的研究,去年 AI 行业只是在 Nvidia 的芯片上就花了大概 500 亿美元。GPT-4 为代表的万亿参数模型,仅一次训练的成本就在 6300 万美元左右。
而在近期,被曝光的一个微软工程师的对话的帖子中证实:微软正用 10 万个 H100 来帮 OpenAI 训练 GPT-6。同时,据 The Information 报道,微软和 OpenAI 正计划建设一个名为「星际之门」(Stargate)的特殊数据中心,投资可能在千亿美元左右。
2023 年 10 月底,美国对中国发起了第二次 AI 芯片出口管制,除了此前已被禁的 A100 和 H100,专为中国市场推出的改良版芯片 A800、H800 芯片被列入名单,消费级显卡 4090 也成为牺牲品。
由于无法获得高性能的原版芯片,中国 AI 公司可能需要面临性能下降、采购成本增加以及国际竞争力下降等问题。然而,这必定也会激发中国 AI 公司加强自主研发和创新的动力,推动中国在 AI 芯片领域的技术进步,只是仍需要一定的时间周期。
算力、 算法天才、数据背后都意味着巨大的成本开支。
低成本的资金,或来自于资本市场,或来自于用户和客户。前者往往是因为有吸引力的资本故事,后者则是因为产品具有稀缺性可以获得高毛利。
在用户端或者客户端,中国用户或者客户的付费能力远低于美国公司。来自于用户端的资金成本必然高于欧美发达国家。归根到底,差距背后是经济基础的差距,2023 年美国人均 GDP 达到了 8.29 万美元左右,中国则是在 1.26 万美元左右。
本轮 AGI 的创投热潮来自于资本市场,来自于美国科技巨头的持续加码投资。微软、Google、亚马逊、英伟达等持续加码,背后则是因为其资金成本低、资本效率更高。
首先,被投公司都是微软 Azure、亚马逊 AWS 当前新增的算力消耗大客户。其次,行业热度也将为这些云服务厂商带来更多的客户深度。再次,本轮的生成式 AI 技术特性,对于微软、AWS 等本身的产品性能提升明显,可以帮助其增加新的付费产品 SKU。第四,几家公司均因为加强布局 AI,市值提升。第五,AGI 是科技巨头不能输的战场。
以 OpenAI 为例,OpenAI 的融资中包括了微软 130 亿美元的投资。以 Anthropic 为例,历史上的融资中,有 30 亿美元左右来自于亚马逊,30 亿美元左右来自于 Google 及其关联方。
但目前,中国的创业者还很难大量募集到资金,背后则是因为国内还没有大量这样低成本的资金。
中国市场上,即使是百度、阿里、字节这样的互联网科技巨头,其资金成本也是高于海外科技大厂。海外科技巨头的营收体量高于国内科技巨头,其营收来自于全球市场,其研发运营投入也可以全球范围内摊薄,利润率更高;百度、阿里等均是美国上市公司,其在海外资本市场的被认可度或低于亚马逊、Google 这些海外对标公司。
可以看到,中国市场上,目前除了模型层公司、少量明星创业者团队,大多数 AI 早期公司的单轮融资金额多是低于 1 亿元人民币的。
目前,一些创业者开始寻求海外基金投资,部分已经取得成功,如 Heygen 等。但是华人创业者要与当地的创业者竞争,融资效率大概率低于本土创业者。
根据过去一到两年的经验,中国公司往往在市场上 OpenAI 探索出新的技术路线、行业先行者如 Google、Mistral、Meta 推出开源模型后可以快速、低成本跟进。
比如,根据市场上公开信息、水下信息总结,包括中国的模型研发公司,成本上,正努力以大约 1/10-1/5 的成本去实现 OpenAI 的目前一代先进模型的水平;速度上,追赶的周期越来越短,从 2023 年初大家预测的需要 18 个月以上的时间降低至 6 个月左右的时间。
目前,海外大模型的第一梯队已经基本形成:OpenAl>Google 、Anthropic 、 Mistral 、 Meta>其它大模型公司。中国公司可以在深入研究领先公司的先进模型架构和算法原理后,并在此基础上进行技术创新。这种模仿创新不仅可以帮助中国公司快速积累技术经验,还可以降低研发成本,提高研发效率。
历史多次证明,中国公司在成本控制和效率提升方面表现出色。模型层,通过优化模型训练过程、降低硬件成本、提高计算效率等手段,中国公司在一段时间后就能够以更低的成本实现与海外先进模型相当的性能水平。
在算力不够强,数据不足以形成中文市场以外的优势时,弯道超车的机会或许在于模型架构层的创新。
比如,MoE 的创新,就曾对大语言模型产生了积极的推动作用。
MoE 是一种神经网络架构设计,在 Transformer 模块中集成了专家/模型层。当数据流经 MoE 层时,每个输入 token 都会动态路由到专家子模型进行处理。当每个专家专门从事特定任务时,这种方法可以实现更高效的计算并获得更好的结果。
算法框架某种程度上是一种杠杆,有可能依赖于天才科学家的灵光一现。一种理性的推测是,研发创新型的算法框架,更有可能实现弯道超车。
今年 GTC 上,Transformer 中的七位作者们再聚首,都表达了期待看到更新的模型。比如,Cohere 的 CEO Aidan Gomez,提到,Transformer 在内存占用方面效率低,且很多架构可以重新优化,一个很长的上下文会变得昂贵且无法扩展,参数可能可以压缩,而不不要那么大。Inceptive CEO Jakob Uszkoreit 也提到,Transformer 架构可能在一个容易的问题上花太多钱,或者在一个太难的问题上花太少而最终得不到解决方案。
此外,值得一提的是,算法创新的最终目的是服务于实际应用。因此,将算法创新与具体应用场景相结合,推动大模型在各个领域的应用落地,这仍然是中国公司的优势。
某种程度上,我们并不应该神化 Scaling Law。当前的 Scaling Law 并不能等同于芯片领域的摩尔定律。摩尔定律更重要的价值是在于它的经济共识性质。
在半导体行业,摩尔定律往往更多的被认为是经济共识,人为的为行业指出了一条投入产出的 ROI 值,并吸引了产业上下游接受这个指标。
摩尔定律的核心内容是集成电路上可容纳的元器件数目大约每隔 18-24 个月会增加一倍,性能也将提升一倍,而价格保持不变。因为摩尔定律加入了价格的要素,自摩尔定律提出以来,全球半导体行业一直遵循这一定律,持续的加强投入。
当行业在一个新技术的投入产出上达成共识,这通常意味着该技术在产业内得到了广泛的认可和应用,并可能产生积极意义。比如,
(1)规模化效应与成本降低:当整个行业都认可并应用某一新技术时,该技术很可能实现规模化应用。规模化不仅可以提高生产效率,而且可以通过分摊研发成本、制造成本等,使得单个产品或服务的成本显著降低。成本的降低有助于企业提高盈利能力,同时也可能推动产品价格下降,从而惠及消费者。
(2)标准化与互操作性增强:行业共识往往意味着新技术的标准化。标准化有助于不同企业之间的产品和服务实现互操作性,加强产业链上下游之间的衔接。这不仅可以提高整个产业的运行效率,还能促进不同企业之间的合作与竞争,推动产业的健康发展。
(3)需求增长与市场扩张:新技术的应用往往能带来新的产品或服务,从而创造新的市场需求。当整个行业都投入到新技术的研发和应用中时,这种市场需求可能会得到进一步的扩大。市场的扩张不仅可以为企业带来更多的商业机会,还能推动整个产业的增长和发展。
(4)人才培养与产业升级:受产业内的创新氛围影响,企业为了保持竞争优势,会不断加大在新技术领域的研发投入,这有助于吸引和培养更多的创新人才。同时,市场扩张、人才培养都有助于产业升级。一些情况下,有可能催生新的产业形态和商业模式,为产业带来新的增长点。
以摩尔定律为例,当摩尔定律成为经济共识后,推动半导体产业链持续投资,持续进行技术创新和产品升级。
可以说,摩尔定律结合安迪比尔定律,推动了半导体行业的发展:摩尔定律引导用户开始购买处理器获得比处理器价格更多的生产力提升;安迪比尔定律建议客户持续找到能消耗更多处理器的场景,方向提出对芯片的新要求;此时,芯片厂商获得高营收和利润,进而遵循「摩尔定律」,沿着摩尔定律的技术共识进行研发,开发更高性能的处理器;硬件厂商,依据摩尔定律指出的技术方向提前进行产品规划;软件厂商继续遵循「安迪比尔定律」,吸引用户更新再购买提升更多生产力...... 如此循环往复。最终,最终这些技术提升不仅为硬件和软件的发展提供了更多的可能性,也为消费者带来了更强大的计算和交流工具,从而反向推动了整个半导体产业链的升级和发展。
当前诸多 AGI 相关方都在努力,定义 AGI 领域的「经济共识」,并获得产业的认可。但是目前市场上暂未有被广泛接受的理论。
我们认为,AGI 应用普及三要素:智能能力、成本、场景。
其中,
最终,AGI 领域的「经济共识」很可能围绕着三点展开。
智能能力无疑是 AGI 应用普及的基石。它决定了商业价值的下限,即技术是否能够达到实际应用所需的基本智能水平。只有当 AGI 系统具备了解决相应问题的智能能力,它才有可能在该场景里被广大用户所接受和采用。
成本因素在这里起到了决定上限的作用。AGI 技术的研发、部署和维护成本必须控制在合理的范围内,以便让更多的用户和企业能够承担得起。高昂的成本会成为普及的障碍,减缓技术的推广速度。
场景,作为 AGI 应用落地的重要载体,不仅决定了技术的实际应用范围,更深刻地影响着用户的付费意愿和付费能力,进而决定了应用的商业规模和体量。特定的场景往往对应着更强烈的的用户需求,这些场景往往会更容易获得客户,并激励客户付费。特定的场景往往对应着更大的需求人群或者更有付费能力的客户群体,也往往更容易证明市场价值。
当前的一些代表性的 AGI 领域的「阶段性经济共识」基本上围绕着这三点里的其中一点展开的。
大模型首先主攻「能力下沉市场」,智能能力是解锁相应应用的前提。
智能能力是指模型本身的能力,比如当模型具备了这个技能,就可以仅依赖模型就实现某种应用。模型的智能能力如就像移动互联网时代的手机传感器。每多一个传感器,就多了一些功能。
如,多了 CMOS 传感器就可以做拍照机相关应用;多了陀螺仪陀螺仪和加速度计可以帮助手机实现更精准的定位和导航;多了光线传感器可以根据环境光线自动调节屏幕亮度;多了指纹和面部识别传感器就能做生物特征支付。
如,GPT 具备了多语言能力,可以直接进行翻译;如 GPT 具备了生成能力,就可以进行文档内容生成。随着 GPT 具备多模态能力,模型本身可以完成的功能会越来越多。
智能能力影响场景实现。当前能够有一定影响力的应用均是受益于模型本身的能力。如,角色扮演类应用,普遍是利用了大模型的聊天能力。再如,光年之外推出的儿童涂鸦应用 Dodoboo,就是利用了大模型现在是高中生学霸水平,给小朋友做「家教」、「辅导员」完全足够了。现在可能模型还有部分能力是大专生的特长,如翻译、比如画画,所以能上初级岗了,或者教初高中生了。
这方面,最具代表性的「定律」来自于 Moonshot 创始人杨植麟。他提出来过一个「场景摩尔定律」,可供参考。每 n 个月,可用的 use case 的数量,会翻一倍;它本质上是 scaling law 的延伸。
中国如果没有充分实现 Scaling Law,可能意味着短期内最高级别中国市场的机器智能能力低于美国。那么,成本就变得重要。
一般来说,在应用端的期望是「10 倍成本下降撬动 100 倍需求量提升,带动总价值 10 倍提升」。
根据公开信息,模型训练的成本在过去 18 个月已经降了 4- 5 倍,模型推理的成本在过去 18 个月降了 10 倍左右。自去年市场上出现开源模型以来,整个市场的模型训练及模型调用成本也在大幅下滑,私有部署从最早的几千万元降到了几十万元量级,同样性能的模型成本至少低了一个数量级。
短期内,即使 AGI 的应用成本大幅降低,依然很贵。所以,如果用年薪 50-100 万的人力成本去解决实际只需要 10-30 万的人力成本的场景问题,在中国市场还很难走通。
这方面,投资机构拾象团队提出了「新时代摩尔定律」:每 1-2 年模型水平就能提升一到两代,模型训练成本每 18 个月就会降低至原来的 1/4、推理成本每 18 个月降低至是原来的 1/10,未来模型推理成本做到今天 1% 这件事是非常可预期的。
在这一范畴里,更进一步的是对于应用市场成本的判定。代表性的观点来自 OpenAI CEO Sam Altman。他认为,一旦足够强大的人工智能「加入劳动力大军」,许多种类的劳动力 (驱动商品和服务成本) 的价格将降至零。在这个基础上,他提出了「万物摩尔定律」——我们的世界在未来几十年,所有的东西包括住房、教育、食品、服装等价格每两年就会减一半。
场景,作为 AGI 应用落地的重要载体,不仅决定了技术的实际应用范围,更深刻地影响着用户的付费意愿和付费能力,进而决定了应用的商业规模和体量。
场景与付费意愿:具体到落地场景中,实际 AGI 新技术付费的逻辑很可能是:合规>避险>增收>增效>降本。虽然「降本增效」「开源节流」一直是很多企业及案例宣传的点,但实际当中,为合规、避险的实际付费能力很可能是优于降本、增效的。技术发展的早期,真正依靠技术获得较为可观收入、收益的,基本还是解决用户「合规」和「避险」诉求的。
「合规」较容易理解,主要包括直接或间接符合政府、组织内部规定。
「避险」主要包括责任避险、资产避险等。这些事件带来的影响往往会更造成比上一套新技术服务更高的成本,且责任人需要职业生涯将受到重大负面影响。
实际的商业环境中,「合规」和「避险」有时候也是可以转化的。「避险」往往是负面事件驱动的,当负面的程度足够高,有时候就会被要求成为「合规」要求。
百度 BV 的投资人有一个观点,他认为,AGI 领域 To B 常讲降本增效,但实际当中客户关注的是增收。因为引入 AI 首先是增本,在当前的时间段里 AI 依然还很贵。一般来说客户会去优先解决在未来 3-5 年的综合市场容量更大、AI 是最优解决方案的领域。
当然,这也不是说「开源节流」、「降本增效」并不重要。而是在当前的环境下,很多新技术、解决方案,都不能完全、完整、100% 的达到客户的需求和预期,因此客户买单时就与其心理、在组织内所处的位置十分相关。
场景与付费能力:从 AGI 的付费能力上来看,产业链的付费能力,大逻辑上来看是:宗教>黄赌毒> 军工>政府 >能源>大基建> 金融> ICT> 文娱>特殊行业(教育、医疗)>零售>制造>地产>其他。
这与行业的特殊属性、整体营收和利润体量、行业的集中度、行业的数字化程度相关。
兼具付费能力与付费意愿的场景里,需求端高频变化的场景才是 To B 新创公司的机会,低频变化的场景更适合老玩家。代表性的场景可能是金融、营销,这些都是在需求端高频变化,促使应用方寻找新的场景。
这方面目前并未有人提出相应的定律。但与之相关的另一个是来自于 Sam Altman 的思考——一个人的独角兽公司。如果理论上真的出现这样的公司,背后很可能与其场景选择有关。只有特定的场景,才有可能有这么高的杠杆率,在一个人的体量时就做多超预期的用户规模或者营收规模。
互联网时代核心是「编码」,依靠供需两端流量的聚集,对生产要素进行重新分配,解决的是标准化服务的低成本实现;
AGI 时代的核心是「建模」,依赖个性化的数据聚集,精准建模,对供需关系精准匹配,解决的是个性化服务的低成本实现。
摩尔定律是互联网时代的重要支撑,摩尔定律本质上是半导体行业持续规模化的重要经济共识。那么,符合 AGI 时代的经济共识和技术共识可能是什么?
一种可能是,在 AGI 时代,数据将成为最重要的生产要素之一,其价值和作用将远超互联网时代。数据的收集、处理、分析和利用将成为经济发展的重要驱动力。同时,由于个性化服务的需求日益增长,经济共识也可能涉及如何更高效、更公平地实现个性化服务的低成本提供。
因此,一个理性的猜测是,AGI 时代的摩尔定律,很可能是与「数据」高度相关。
AGI 领域可能是加强版的网络效应,可能会是一种「智能聚合网络效应」。
随着用户数量的增加和数据的积累,系统的智能能力得到聚合和提升,形成了一种网络化的智能增值效应。这种效应不仅体现在系统能够更好地理解用户需求和行为模式,提供个性化、精准的服务,还体现在系统能够通过自学习和自我优化,不断提升自身的智能水平和处理能力。
如果要细分拆解,可能的网络效应表现为:
智能协同效应:AGI 系统中智能与用户数量之间的协同作用,即随着用户数量的增长,系统的智能水平也相应提高,形成正向的协同效应。
知识网络放大:在 AGI 系统中,随着用户互动和数据共享,系统能够积累更多的知识,并通过智能算法将这些知识放大和应用于更广泛的场景。
智能聚合效应:在 AGI 系统中,即随着用户数量的增加,系统的智能能力得到聚合和提升,为用户提供更优质的服务。
移动互联网为什么可以成功?一个重要的原因是找到了「免费模式」,可以尽可能的扩大规模。而免费模式之所以能走得通,则是因为网络效应与广告模式的完美结合。
首先,广告的传播效果与网络用户规模的正相关关系。网络效应的核心在于用户数量的增加会提升网络的整体价值和效用。在广告模式下,随着用户数量的增长,广告的传播范围和影响力也会相应扩大。这是因为更多的用户意味着更多的潜在广告受众,广告信息可以在用户之间更广泛地传播和分享。
其次,网络效应有助于实现广告内容的个性化和精准投放。随着用户数量的增加和数据的积累,广告商可以利用大数据分析等技术手段,更准确地了解用户需求和兴趣,从而定制更符合用户需求的广告内容。这种个性化投放不仅提高了广告的点击率和转化率,也增强了用户对广告的接受度和满意度。
此外,网络效应还促进了广告传播模型的双向性和互动性。在移动互联网环境下,用户不仅可以接收广告信息,还可以通过评论、分享等方式与广告进行互动,甚至参与到广告内容的创作和传播中。这种双向互动不仅提高了广告的传播效果,也增强了用户与品牌之间的连接和互动体验。
移动互联网的「免费模式」极大地促进了用户规模的扩大。
在移动互联网的早期阶段,许多应用和服务采取了免费提供的策略,吸引了大量用户的关注和使用。这种免费模式降低了用户尝试新应用的门槛,使得更多人愿意尝试和体验新的移动应用。
通过提供免费的基础服务,移动互联网企业能够迅速积累用户基数,为后续的商业化运营奠定坚实基础。随着用户规模的扩大,移动应用能够提供更多个性化、精准化的服务,进一步提升用户体验和满意度。
这些因素共同促进了移动互联网广告的发展,使得广告成为移动互联网企业实现盈利的重要途径之一。随着用户规模的扩大和活跃度的提升,广告的价值也相应增加,为企业带来了可观的收益。这种广告模式不仅为企业提供了稳定的收入来源,还使得免费模式得以持续运行,进一步促进了用户规模的扩大。
可以说,广告模式与网络效应几乎完美适配,才成就了移动互联网的创业速度与产业进步。
回顾移动互联网时代,免费模式通过提供基础服务迅速吸引了大量用户,并通过网络效应和广告实现了盈利。
在 AGI 领域,如果有一种「智能聚合网络效应」,那么这种加强版网络效应就意味着,用户数量的增长能够带来系统整体价值的提升。
在这样的背景下,免费模式理论上有可能成为一种有效的市场策略。通过提供免费的基础服务,企业能够迅速吸引大量用户,建立起庞大的用户基础。这些用户在使用系统的过程中,会不断产生数据和反馈,为系统提供宝贵的训练材料。随着用户数量的增加,系统的智能化水平也会不断提升,进一步吸引更多用户加入,形成强大的用户粘性。
一旦企业成功吸引了足够多的用户,并建立了稳定的用户基础,就可以考虑通过其他方式实现盈利。
然而,需要注意的是,免费模式并不意味着企业可以无限制地投入资源而不考虑回报。在吸引用户的过程中,企业需要合理控制成本,确保在后期能够通过增值服务或其他方式实现盈利。此外,企业还需要密切关注市场动态和竞争对手的策略,以便及时调整自己的市场策略,保持竞争优势。
当前市场上普遍的观点认为:AI-Native 的 App 从 Day One 就应该是收费的。
这主要是与移动互联网可以快速发展不同,当前应用获客红利没了,运营成本指数上升。
移动互联网之所以产生创业潮,是因为多了 40-50 亿的移动用户。「软件吞噬世界」才能够成立。但,当前,暂时还没有超低成本的获得用户或者客户的变局。
当前,AI 的生态仍是长在 web 端、PC 端、移动端,这意味着市场的获客渠道并没有改变,移动互联网时代「买不起的流量,创业公司每一天都是生死存亡」的现象,还可能在未来复现。
去年 AI 相关的应用获得了增长红利,部分是受益于自全球「AI」自然流量增长。根据谷歌趋势(Google Trends)的数据,2022 年 12 月份开始,AI 相关的全球关注热度开始提升,5 中旬开始达到高点,此后基本维持在高位。因此,上半年可以看到很多增加了 LLM 或者其他 AGI 性能的应用用户量及 ARR 快速增长。(具体信息可以查看《拿钱、增长、TMF,大模型应用层创业的 13 个 Tips》一文。)
在交付端,AGI 的应用因为涉及到 Token 或者 GPU 的消耗,交付服务的成本也是指数级提升。而在移动互联网的下半场,非影视类的应用,工程及运维层面的开销已经非常低。
当前,AGI 的应用,或是通过调用公开的模型,或者基于开源模型「自研模型」,或是采购模型私有部署。其中,前两者是大多数应用的主流选择。
虽然大模型 Token 的价格是在不断下降的,如上文所说,模型推理的成本在过去 18 个月应该降了快 10 倍。但 Token 的成本往往是不具有模型能力的公司的重要成本支出。多个创业者反馈,Token 的成本已经成为研发成本外最重要的成本之一。而且,随着用户对生成内容的要求不断提高,或者未来进入到多模态阶段,Token 的成本还将进一步提升。
此前,我们也提出过观点——「虽然初创公司做应用并不一定要具备大模型能力,但很可能最终长成为独角兽级别以上的公司可能都需要具备一定的模型技术能力」,其中一个考量即是出于成本考虑。(具体信息可以查看《拿钱、增长、TMF,大模型应用层创业的 13 个 Tips》一文。)
当前基于开源模型改造模型,面临的主要问题则是模型迭代,原有的技术投入可能会失去价值。在过去一年的时间里,类似的情形已经多次发生。
因此,从两项成本出发,叠加 AGI 的应用很可能是低成本服务个性化需求,AGI 应用应该普遍采用收费模式。
但值得思考的问题是:这个是阶段性的现状还是长期现状?
在 AGI 领域中,如果免费模式有助于企业快速做大规模,进而有可能做大营收和利润,那么这种模式的可行性在很大程度上依赖于大模型推理的成本。大模型推理所需的 Token 是 AI 系统运作的基础,其成本直接影响到企业的运营费用和盈利能力。
考虑到 AGI 系统的复杂性和智能化水平,其所需的大模型往往非常庞大,推理时消耗的 Token 数量可能相当惊人。如果 Token 的价格高昂,那么即使通过免费模式吸引了大量用户,企业也可能因为高昂的推理成本而难以承受。这种情况下,免费模式不仅无法为企业带来可观的营收和利润,反而可能导致企业陷入财务困境。
因此,为了确保免费模式的可行性,我们需要一个前提条件:未来大模型推理时的 Token 要便宜到忽略不计。这样,即使企业为用户提供免费的基础服务,也能够通过其他方式(如增值服务、广告等)实现盈利,而不会因为高昂的推理成本而阻碍发展。
硬件技术的进步是一个不可忽视的因素。随着芯片技术的不断创新和计算能力的提升,未来推理时的计算效率有望大幅提升,从而降低 Token 成本。
随着算法和模型优化技术的不断发展,AI 模型将能够在更少的计算资源下实现更高的性能。例如,通过模型剪枝、量化、知识蒸馏等技术,可以在保持模型性能的同时,显著减少模型的大小和计算复杂度,从而降低推理成本。
本文来自微信公众号“Founder Park”