Liquid AI:端侧 AI 独角兽的美国往事

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Liquid AI:端侧 AI 独角兽的美国往事
8247点击    2026-06-03 10:11

想象一个再普通不过的工作场景:


你的电脑里存放着两份合同、一堆客户资料、几个项目文件夹,以及一份不知何时遗留的 .env 文件。你希望 AI 协助完成三项任务:排查潜在泄露的 API Key、对比合同差异并生成报告,以及自动生成一份审计日志。


如果调用云端大模型,这些任务自然不在话下。但隐患也显而易见:你需要将本地文件、客户隐私、目录结构甚至系统状态,全盘托付给第三方服务。对个人而言,这或许只是体验上的妥协;但对企业来说,这直接触及了安全、合规以及部署边界的红线。


Liquid AI 近期推出的 LocalCowork,正是直面这一矛盾的产物:单台笔记本,无需云端 API,数据绝不离机。凭借 67 个本地工具、13 个 MCP Servers,配合最新发布的 LFM2.5-8B-A1B 模型,它通过本地调用工具、解释结果以及可审计的工作流,解决了上述难题。


Liquid AI:端侧 AI 独角兽的美国往事


图:LocalCowork 界面,用本地模型调度工具完成私有工作流。


2026年,Liquid AI 或许不该仅仅被看作是又一家发布小模型的公司。


如果用国内读者更熟悉的语境来类比,它有些像“美国版的面壁智能”。过去两年,面壁智能的MiniCPM系列最深入人心的标签是端侧运行与强多模态——让小参数模型在手机上也能跑出惊艳的体验。乍看之下,Liquid AI 的 LFM2.5-8B-A1B 也踩在相似的叙事里:8B MoE 架构、1.5B 激活参数、128K 上下文、纯本地部署与工具调用。


面壁智能是源自清华的端侧模型独角兽,而 Liquid AI 的起点同样耀眼——孵化自顶级的 MIT CSAIL 实验室。此后,它走出了一条截然不同的路径:先是引入有别于纯 Transformer 暴力 Scaling 的全新架构,接着发布一系列 Foundation Models,随后迅速补齐开发者工具与端侧入口,最终切入 Shopify、奔驰等真实的商业级应用。


这正是 Liquid AI 故事的迷人之处。当整个行业习惯于在云端数据中心讨论 AI 的能力上限时,智能已经悄然向边缘渗透。当 AI 真正进入手机、PC、汽车、机器人和企业内网,核心命题就变成了:模型该如何适应真实的设备算力、隐私边界与业务流程? Liquid AI 过去几年的战略选择,几乎全是围绕这一底层变化展开的。


逆流而上:当行业在疯狂 Scaling,Liquid AI 选择重构架构


Liquid AI 的故事始于 2023 年底。


彼时,大模型行业的共识已然固化:GPT-4 验证了 Scaling Law 的统治力,资本、算力和顶尖人才都在向更大的集群与更长的训练周期聚拢。牌桌上的玩家们只关心谁能抢到更多 GPU,谁能训出更大的模型。


Liquid AI 却选择切入另一个盲区:如果 AI 终将落地于真实的物理世界与企业内网,我们的模型难道还要继续只为数据中心而设计吗?


这家公司的名字“Liquid”,源自创始团队在 MIT 的核心研究——液态神经网络(Liquid Neural Network)。这是一种极具“动态性”的架构,当模型面对连续变化的信号与环境时,其内部状态能够实时自适应调整。这种特性天然契合自动驾驶、机器人、传感器序列等真实世界场景。因此,Liquid AI 从一开始就将内存、延迟、能耗、硬件适配与可解释性置于核心位置。


Liquid AI:端侧 AI 独角兽的美国往事


图: LFM 架构。


彼时的 Liquid AI 没有卷入“谁来训练下一个万亿参数 Transformer”的军备竞赛,而是沿着动力学系统和信号处理的底层研究,重新思考基础模型的形态。


这条路充满传播优势,却也背负着极高的信任成本。优势在于差异化足够锐利——在人人争抢“最大模型”的时代,它独占了“最高效架构”的叙事;而成本在于,外界不可避免会质疑:模型在哪?评测在哪?实验室里的论文,真的能转化为工业级产品吗?


2023 年 12 月,Liquid AI 宣布完成 4660 万美元种子轮融资。值得玩味的是它的投资人阵容:除了 OSS Capital、Samsung Next,还赫然出现了 Shopify 创始人 Tobias Lutke 和 Notion 联合创始人 Chris Prucha。


这释放了一个强烈的信号:Liquid AI 的野心不仅在学术界,它要将高效模型生根于真实的商业系统与设备生态中。


第一代 LFM:从学术概念到可验证的模型


2024 年 9 月,Liquid AI 发布了第一代 Liquid Foundation Models (LFMs)。当时的外部环境正处于微妙的转折期:大模型能力固然在涨,但企业算起了经济账——云端 API 的调用成本、网络延迟以及私有化部署的安全顾虑开始凸显。AI PC、手机 NPU 与车载 AI 的普及,让离线运行成为刚需。


第一代 LFM 包含了 1.3B Dense、3.1B Dense 和 40.3B MoE。它们向外界展示更优的 性能/尺寸 权衡、更低的内存占用,以及面向 NVIDIA、AMD、高通、苹果等异构硬件的优化潜力。


这一步,让 Liquid AI 从“贩卖新架构概念”正式蜕变为“交付可用模型”的企业。社区关于端侧AI的话题,也开始从概念争论,进入了真刀真枪的可行性与能力边界验证。


LFM2、LEAP 与 Apollo:端侧 AI 走向工作流


进入 2025 年,端侧 AI 渐渐告别边缘地位。面壁的 MiniCPM 证明了小参数的多模态能力;微软 Phi 将推理无缝接入 Windows 与 Copilot+ PC;Google Gemini Nano 深入 Android 系统底层。Liquid AI 也在 2024 年底拿下了 AMD 领投的大额融资,深度绑定芯片与推理栈生态。


此时行业也逐渐觉醒,训练出小模型只是入场券,分发、运行权限与生态闭环,才是决定其能否存活的关键。


2025 年 7 月,Liquid AI 推出 LFM2,主打混合架构与 CPU 上极速的 Decode/Prefill 效率,并释出了 350M、700M、1.2B 这类极度端侧友好的权重。


Liquid AI:端侧 AI 独角兽的美国往事


图:LFM2 端侧模型的速度与效率。


同月,两大基础设施的发布,将Liquid AI产品化向前推进了一大步:


  • LEAP (Liquid Edge AI Platform):定位为端侧中间件,将模型的发现、测试、微调、量化打包与部署串联成完整的工作流(Workflow)。解决了开发者如何为特定设备挑选合适模型的痛点。
  • Apollo:移动端原生入口。不仅让普通用户在手机上直观体验本地模型,也为 Liquid AI 收集了真实设备在延迟、内存、发热与交互边界上的第一手数据。


Liquid AI:端侧 AI 独角兽的美国往事


图:LEAP 试图把模型发现、测试、定制和部署串成端侧 AI 工作流。


这是 Liquid AI 的关键拐点:它不再仅仅是一个发布模型的机构,而是演变成了一个提供端侧部署解决方案的平台。


扩张模型族:拒绝“万能模型”的迷思


从 2025 下半年到 2026 年,Liquid AI 迎来了爆发式的产品矩阵扩张。除了文本模型,它迅速补齐了视觉语言(VL)、音频、MoE、Embedding、RAG、工具调用(Tool Use)等细分方向。LFM2-VL、LFM2.5-1.2B-Thinking、LFM2-24B-A2B 等型号相继亮相,形成了一个庞大的“端侧模型货架”。


这背后的商业逻辑极其直白:没有任何一个模型能够吞噬所有场景。手机的离线翻译、车机的语音助手、电商搜索的极速推荐,对参数大小、延迟限制和多模态能力的要求截然不同。


在这里,它与面壁智能的差异开始显现:面壁的故事更加聚焦——手机端的极致多模态;而 Liquid AI 铺设了一条极长的战线——从底层架构、模型族群,一路贯穿到部署平台与垂直行业。


走向真实业务:从 Benchmark 到落地 Showcase


2026 年前后,Liquid AI 终于在应用层交出了答卷。它跳出了写诗、翻译的常规 Demo,直接切入了高价值的业务腹地:


  • LocalCowork (本地 Agent):正如开篇所述,它击中了企业数据资产(代码、合同、内部文档)无法上云的痛点,将 Agent Loop 拉回本地,由端侧模型可靠地调度工具链。
  • Mercedes-Benz (车载智能):2026 年 4 月,双方宣布在北美开展多年合作,为第三/四代 MBUX 系统提供嵌入式车载智能。汽车是端侧 AI 的终极试验田——它要求严苛的低延迟、断网鲁棒性以及长期的系统稳定性。


Liquid AI:端侧 AI 独角兽的美国往事


图:Mercedes-Benz 与 Liquid AI 合作,将嵌入式智能带入车载场景。


  • Shopify (商业系统):首个生产环境部署强调了低于 20 毫秒(sub-20ms)的文本模型,专门服务于电商搜索与交易流。这证明了高效模型即便在云端,也能极大削减成本并突破吞吐瓶颈。


Liquid AI:端侧 AI 独角兽的美国往事


图:Liquid AI 与 Shopify 合作,把高效模型用于核心 commerce workflow。


这三个切面,勾勒出了 Liquid AI 真正的靶心:那些云端千亿大模型进不去、跑不快、不合规的广阔“缝隙”。


LFM2.5-8B-A1B:端侧潜力的阶段性样本


作为最新力作,LFM2.5-8B-A1B 将这条路线推向了新的高度。总参数 8.3B,激活参数仅 1.5B,训练数据量却高达 38T Tokens(与 DeepSeek V4 系列处于同一量级);支持 128K 超长上下文,专为工具调用与 Agent 工作流优化,且全面拥抱 llama.cpp、vLLM 等开源生态。


Liquid AI:端侧 AI 独角兽的美国往事


图:LFM2.5-8B-A1B benchmark,强调端侧工具调用。


它的发布,让社区的关注点从空泛的“参数规模”落到了实处:消费级 GPU 能否流畅运行?量化后是否会破坏 MoE 路由的稳定性?长上下文是否会出现注意力漂移?这说明,开发者已经开始用衡量生产力工具的标准(Tokens/s、内存占用、量化损耗)来审视它。


这个模型不必被神化,它的历史定位更像是一个极具价值的阶段性样本:它证明了在消费级硬件的算力与延迟边界内,本地 Agent、超长上下文与高难度工具调用,已经成为现实。


尾声:一场部署范式的底层变革


所以,Liquid AI 究竟是不是美国版的“面壁智能”?


答案是:是,也不是。


“是”的一面在于,它们并肩站立在同一股不可逆转的浪潮之巅。它们都在用行动宣告:模型的价值不只由参数量决定。在严苛的成本与算力约束下,提供有效的智能,同样是一种价值。


但如果我们尝试自顶向下地理解端侧机器学习系统,就会发现 Liquid AI 的路线是在打造一套硬件原生的基础模型技术栈。它始于 MIT 实验室里的学术狂想,穿越了 LFM 的技术自证与平台化阵痛,最终在汽车与电商的工业齿轮中咬合。它尝试证明,基础模型需要被具体的设备、隐私边界和产业场景重新重塑。


而这场关于端侧 AI 的探索远未盖棺定论。Liquid AI 仍需面对漫长的考验:新架构的护城河到底有多深?资源受限场景下的 Tool Calling 能否保持绝对的可靠?更重要的是,微软 Phi、Google Gemini Nano 与苹果 Apple Intelligence 体系背后都有操作系统、芯片和分发入口加持,Liquid AI 必须证明自己在这些平台级玩家的夹击下,仍然能靠架构效率、部署工具链和行业场景占住位置。


但至少,它撕开了一个极具想象力的切口。


过去两年的 AI 叙事,聚光灯始终打在云端大模型的能力穹顶上;而接下来的时代暗流,将属于智能如何挣脱数据中心的引力,下沉到手机、PC、汽车、机器人与每一个本地工作流之中。


无论 Liquid AI 的结果如何,都将是这部宏大史诗中的重要一章。




文章来自于微信公众号 "Vinci叽里呱啦",作者 "Vinci叽里呱啦"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

4
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner