小模型当打之年？2024年AI预言“一网打尽”

8490点击 2024-01-09 09:25

2024年，投资者要看到实际的利润。

如果说2023年是当之无愧的“生成式AI的爆发之年”，那么2024年将是“生成式AI的突破之年”？还是“生成式AI的冷却之年”？初创公司的机会又在哪里？

在本篇文章中，适道将综合Coatue、a16z、Radical Ventures等明星VC预言；The Information、FT、Sifted汇集的投资者预言；以及Greg Brockman等行业大佬的观点，试着归纳接下来一年中AI的发展脉络。

01 主题：是冷却还是突破？

首先，在一众AI预言中，不乏“冷却论”支持者。

印度IT巨头Infosys最新发现，只有6%的欧洲公司通过生成式AI用例创造了商业价值；麦肯锡在2023年的一份报告中得出结论:“尽管生成式AI的使用可能会刺激其他人工智能工具的采用，但我们认为企业对这些技术的采用几乎没有实质性的增长。”

而根据调查机构Gartner著名的新兴技术炒作周期（Hype Cycle），生成式AI下一阶段将是“幻灭的低谷”。（适道注：Gartner将新兴技术炒作周期划分为“创新触发器”、“膨胀预期峰值”、“幻灭的低谷”、“启蒙的斜坡”和“生产力的高原”5 个阶段。）

小模型当打之年？2024年AI预言“一网打尽”

据此周期，在2024年，随着实验和实施失败，技术生产商要么出局，要么失败，总之人们的兴趣会减少。

资本市场的表现似乎也不乐观。一方面，从融资规模来看，生成式AI的投资浪潮是一次“短暂繁荣，在融资方面并不是什么大事”。AllianceBernstein成长股投资者Jim Tierney在FT采访中称：“2023 年，对新兴人工智能公司的私人投资大幅回升，但投资规模仍无法与之前的科技热潮相提并论。”

该观点被 Crunchbase 数据佐证：

在2023 年，人工智能独角兽公司的融资大幅下降，仅为 2021 年市场高峰时的 25% 左右；全球最活跃的九大 VC 在独角兽公司的投资大幅下降，共投资了 44 家独角兽公司，而在2022年，他们投资了213家公司，2021年则是 471家公司。

另一方面，当潮水退去的时候，才知道谁在裸泳。在每家科技公司都制定了生成式AI战略的一年之后，2024年，投资者要看到实际的利润。

AllianceBernstein成长股投资者Jim Tierney表示：“2024年，我们将看到谁只是在打人工智能牌，而不是拥有真正的商业模式”。

对此，华平投资集团（Warburg Pincus）前负责人Bill Janeway补充道：“如果有什么不同的话，缺乏更大的人工智能投资泡沫会阻碍该技术的发展，因为‘试错’会受到限制。”

当然，“突破论者”的声音更响亮。

例如，TMT之王Coatue在2023年末的报告中旗帜鲜明地指出：AI不是炒作，AI的黄金时代还没有到来。

和Gartner的Hype Cycle相似，Coatue对AI的发展给出了一个时间定位：对比新技术在美国达到50%用户渗透率的时间，PC用了20年，互联网用了12年，智能手机用了6年，而生成式AI大概只会用3年。Coatue发现，大多数 AI 投资都聚焦在模型层面（占比60%），入账价值已经显现。

OpenAI总裁Greg Brockman 也给出了一个时间参考：2024年将是突破性的一年。从长远来看，只需再过一年的时间，每个人的生活都会比今天更好。

Altimeter Capital 合伙人 Jamin Ball表示：2024 年将是 "从原型到生产"的一年。2023 年，每个人都在尝试 AI，但有很多问题限制了这些实验的推广，比方它们的成本是多少？它们安全吗？合规风险有多大？2024 年，这些问题都将得到解答，我们将看到 AI 应用从实验/原型/内部应用走向面向客户的大规模部署。

02 采用：是缓慢还是飞速？

不难看出，是否更多公司“采用”，将决定2024年AI能否打破“炒作论”，持续当前热潮的一个关键因素。

FT在《The AI revolution’s first year》中指出，2023年，许多公司为人工智能的广泛应用奠定了基础，现在投资者开始展望 2024 年，并开始接受至少在短期内人工智能技术的应用可能会比较缓慢的事实。

例如，Adobe的股价虽然比起2023年初已飙升了近 90%，但其2024年的收入预计会低于华尔街的预期。

微软的“AI+软件”比大多数公司走得更快，但其也在努力降低人们的预期，并称新“Copilot”功能2023下半年才可能带来销售回升。

人工智能采用起步缓慢的原因有三：

一是LLMs的“幻觉”问题还没得到解决，削弱了其商业价值。Salesforce战略主管Peter Schwartz说：“它会很有用，但不会像许多人希望的那样彻底改变游戏规则。”

二是许多潜在客户其实缺乏采用准备。企业需要用内部数据来训练模型，而现实则是“大多数公司都不具备成熟的数据能力，如果你不能使用自己的数据，就无法使用人工智能。”——埃森哲CEO Julie Sweet

三是成本限制。例如，微软对AI版 Office 定价为30 美元/月，这让一些客户的软件成本翻了一番。有分析师警告：高昂的价格将导致客户仅在小范围内适用AI技术，至少在AI工具的价值不被证明之前。

IT 研究公司Gartner的首席预测师John-David Lovelock表示：2024年用于生成式AI的支出将略高于 200 亿美元，占全球 IT 支出总额的 0.5%。而且IT 买家在安全方面的支出也将是原来的五倍。

总而言之，此类成本问题意味着，至少在短期内，新的人工智能产品和服务对科技公司收入和利润的提升可能会减弱。

乐观者的言论也不少。

Theory Ventures 创始人 Tomasz Tunguz表示：

2024 年将是企业通过 AI 实现生产力实质性提高的一年，每名员工的ARR有机会增加10-15%。

Rubrik 首席产品官Anneka Gupta表示：2024年的一大趋势是大型传统企业终于意识到生成式AI在提升生产力方面的优势，并找到了在组织内大规模采用这项技术的方式。

Chapter One 创始人Jeff Morris Jr表示：2024 年将是我们如何设计、编程、质量保证、A/B 测试和部署软件最大变革的一年，这些工作最终由 AI 实现。随着 2023 年 AI 软件工具的激增，我们将记住 2024 年是世界一流的设计、产品和工程团队将这些新的 AI 超级能力有效集成到日常工作流程各个方面的一年，而这还没有发生（大多数团队仍在进行试验）。2024 将被铭记为软件构建发生巨变的一年。

Spark Capital 普通合伙人Natalie Sandman认为：2024 年，真正原生的 AI 应用开始出现。目前，Claude 和 ChatGPT 这类LLM仍然处于 AI 版本的“Excel”阶段。

在这些模型基础上，未来将会出现专门针对复杂工作流程设计的原生AI SaaS应用。这些应用从第一天开始就以 AI 为核心构建，可以将当前复杂的专业化工作流进行解耦和重组，使得工作流程的 AI 化变得更加轻松高效。

德国GenAI初创企业Nyonic的CEO兼联合创始人Vanessa Cann也表示：采用人工智能的公司将脱颖而出。随着基础模型能力的巨大飞跃，公司可以显著提高其生产力、效率和创新速度——根据麦肯锡最新研究，采用人工智能最高可提升70%的生产力。

相比之下，Meta研究员Martin Signoux的观点比较中肯，他表示：虽然没有重大突破，但各方面都有改进。

一方面，新模型不会带来真正的突破（GPT-5)，LLM在本质上仍然有限，而且容易产生幻觉。我们不会看到任何飞跃，使它们在2024年可靠到足以“解决基本的AGI”。

但另一方面，随着在RAG、数据整理、更好的微调、量化等方面的改进，LLM将在许多用例中变得足够强大/有用，从而推动各行各业各类服务的采用。

03 模型：是LLMs还是SLMs？

基于Signoux的观点，我们进而提出一个设想：2024年，是否有更多企业和消费者采用效率更高、成本更低、可定制的小模型SLM，并在一些应用场景中替代 LLM ？

例如Mistral 的混合专家模型 Mixtral 8x7B在一些基准测试上甚至超过了 GPT-3.5；微软的 Phi-2只有 27 亿参数，可以在手机上运行，并在大多数常识推理、语言理解、数学和编码任务上超越了 Llama2 7B、Llama2 13B、Mistral 7B，与 Llama2 70B 的差距也在缩小（甚至更好）。

Snorkel AI曾做过一个试验，分别用GPT-3微调和自己搭建的小模型来训练一个法律领域的垂直模型。GPT-3的微调和搭建成本是7418美元，1万次推理花费173美元，而自己搭建的小模型成本仅为1915美元，1万次推理也只花费0.26美元。

从正确率来看，GPT-3微调的垂直模型正确率为71.4%，小模型则为71.3%。而GPT-3的参数量是该小模型的1400倍。

这是“参数越大，性能越好”失效了吗？当然不是。但有些时候，正如《华尔街日报》的那句玩笑：用GPT-4总结电子邮件就像“让兰博基尼送披萨”。毕竟，在很多场景下，用户需要的可能仅仅是写个总结。

也就是说，规模较小的模型可以极大拓宽生成式AI的应用范围。

在这种情况下，Lightning AI的创始人William Falcon提出：2024年，1B模型性能将优于70B。

Signoux也进一步总结：SLM已经出现，成本效益和可持续发展将加速这一趋势。量化技术也将大大提高，从而推动消费服务的设备集成浪潮。

在此，我们可以展望一下：2023年是大模型之年，2024年会将是“小模型“之年吗？而小模型+终端设备会不会成为2024年的一大看点？

04 硬件：是苹果还是其他？

说到“将模型塞进进手机里”，你想到的大概率是“小模型”，但如果是将“大模型”塞进手机里呢？

这不得不提2024年AI硬件的竞争格局。

根据The Information的2024年预测，微软和Amazon将推出AI硬件设备，改变苹果、三星双巨头垄断局面。

文章指出：微软可能会开发一款以Copilot为核心的设备。如果产品受到市场欢迎，微软将在2025年前打造一款成熟的智能手机。与此同时，就像毫无长进的Siri，苹果在iPhone中改进AI功能的尝试将让人失望。尽管彭博社报道称苹果正在紧锣密鼓地开发一系列生成式AI产品，但由于在隐私问题上的强硬立场，苹果将掉队最先进的、在云端运行的人工智能模型步伐。

不过，适道对此预言持保留意见。一方面，正如我们在此前文章《收尾2023年，苹果AI“图穷匕见”：将大模型塞进iPhone里》所言，苹果在2023年即将结束之时，放出了两篇爆炸性论文。其中一篇论文显示，在Flash-LLM技术加持下，速度和大小将实现双突破，或许很快可以让大模型在iPhone、iPad和其他移动设备上流畅运行。

另一方面，苹果的“保护隐私”更像是“以退为进”。根据Radical Ventures在Forbes上发表的2024年预言：至少有一家美国法庭将宣布其主要的生成式AI模型违反版权法，这一争议可能会在未来几年内上升到最高法院。

无论是GPT-4或Claude 2创作的诗歌，DALL-E 3或Midjourney描绘的图像，还是Pika或Runway制作的视频，这些生成式AI模型都得益于对世界大部分数字数据的学习与训练。而这些AI公司通常是拿了数据直接训练。

这会带来法律风险，例如最近纽约时报对OpenAI和微软的指控，而此案可能是人工智能使用知识版权纠纷的分水岭。

苹果的做法先取得授权，再拿数据来进行训练。但苹果似乎也没有因此而慢下太多。根据分析师报告，苹果可能在2023年已经建造了几百台AI服务器，而2024年将会显著增加。

当然，AI硬件不只是智能手机。根据Martin Signoux的2024预测：AI智能眼镜将蔚然成风。随着多模态技术的兴起，领先的人工智能公司将加倍努力开发人工智能可穿戴设备。还有什么比眼镜外形更适合承载人工智能助手呢？

这就不得不提Vision Pro。据苹果资深分析师 Mark Gurman 爆料，2024年苹果的精力会重点放在可穿戴产品上（Vision Pro、AirPods、Apple Watch），一向占据大头的 iPhone 或将让位。

另外，根据a16z的2024年预测，在“文生文、文生视频、文生图像”等技术无限降低游戏组成元素的边际成本时，一条游戏行业“降本增效——UGC——XR头显”的路径变得更加清晰。Andrew Chen认为：“下一代头显最好加倍下注”，并在此过程中会吸引数百万消费者，而不是想着跳到需求低迷的生产力工具上。

而上述苹果发表的两篇论文中的另外一篇，则详细介绍了一项名为 HUGS的生成式 AI 技术，该技术仅仅需要一个约50-100帧的原始视频，相当于2到4秒24fps的视频，就能在30分钟内生成一个“数字人分身”。

不得不说，比起“AI Pin”的小打小闹，苹果的技术准备更像是步步为营。所以，在2024年的AI硬件突破上，适道先站队苹果。

05 监管：是威胁还是机会？

接着苹果的隐私保护，继续说AI监管。

一方面，AI监管的压力越来越大。例如，Adobe 因监管压力终止了对 Figma 的收购。

Felt 的CTO Can Duruk表示：2024 年，我们可能会首次遇到由人工智能引起的“Wow”时刻。这可能是一些引人注目的丑闻：比方说 Midjourney + Elevenlabs 生成的假新闻引发了动荡，或者某位名人声称一张尴尬的“真实照片”实际上是由AI生成的。即将到来的 2024 年美国选举将成为这一切的“有趣”背景。

另外，想必大家都看过ChatGPT费水的新闻：“到2027年，全球范围内的AI需求可能会需要消耗掉66亿立方米的水资源，几乎相当于美国华盛顿州全年的取水量。”

Merantix的联合创始人Rasmus Rothe从AI和环境的角度提出了预测：AI对环境的影响将成为主导话题。在2024年，人工智能界的爆炸性增长将与社会对气候变化和能源消耗的担忧形成对立。这将对人工智能系统造成经济和政治压力，要求它们创造出更好的模型架构——意味着用更少的数据和能源训练和使用人工智能模型。我们不仅需要更高的效率来减轻环境影响，也需要降低客户的成本。

但另一方面，AI安全也将成为投资新机遇。Speedinvest投资人Rick Hao表示：2023年，AI安全已进入公众讨论的视野。随着企业急于采纳最新的人工智能技术，透明度、信任、治理成为越来越多人关注的焦点。然而，我们预测，与技术能力相比，AI安全领域的投资将继续不足。我们已经在这方面进行了一次投资，并将在2024年进一步加码。

06 结语

篇幅关系，适道不能对2024的AI预言一一铺开，而是采取总结脉络的方式进行大致梳理。

总而言之，生成式AI到底是史诗级的技术革命，还是仅仅成为企业IT武器库中的一个有力的补充，一切答案都会在2024年见分晓。

对于初创公司而言，“寻找需求”远大于“死磕大模型”。目前阶段要求生成式AI必须具备解决问题的能力。“高度变现的杀手级应用”是生成式AI从模型变为巨大印钞机的关键。

至于如何抓住应用层机遇，欢迎参考适道此前文章，或许有你想找的答案。

文章来自于微信公众号 “适道”(ID：survivalbiz)，作者 “适道AI组，”

关键词: 小模型 , AI , 生成式AI

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目，该项目可以帮你实现“线上线下的数字人销售员”，
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址：https://github.com/xszyou/Fay

AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址：https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装：https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体，能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址：https://github.com/hitsz-ids/airda

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。
项目地址：https://github.com/Henry-23/VideoChat
在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址：https://github.com/PeterH0323/Streamer-Sales