“好大口气！” ——Flowith 居然造了一个操作系统

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

7115点击 2025-10-29 18:07

就像 Windows 或 macOS 为软件提供运行环境，Flowith OS 为 AI Agent 提供思考与行动的环境。

最近在 AI Agent 领域连续发生了 3 件值得标记一下的事：

其一是， 10 月 16 日，微软宣布将 Agent Manus 深度整合进 Windows 11 系统。微软正试图让 Agent 不仅停留在 ChatBot 层面，而是真正获得系统级的行动力。

其二是，10 月 22 日，OpenAI 发布了 AI 浏览器 Atlas。这是一个被外界视作「多模态 Agent 浏览器」的新入口，它让 AI 不仅能「读网页」，还能在真实网页环境中进行推理、决策与操作。

其三则是， Flowith 正式发布了一个全新的产品：名为 Flowith OS 的新物种。它选择了一个「另辟蹊径」的路径，尝试为 AI Agent 打造一个全新的 AI-Native 式的操作系统。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

他们的方向其实是一致的：试图回答当前 AI 普遍存在的「思考与执行脱节」问题：跨网页、跨环境的执行困难，长任务的断点与割裂感，再加上「权限不敢给、执行力不足」。

那么，Flowith OS 到底是什么？具体是如何为 Agent 打造这个原生环境的？它给出的答案又是什么？

带着这些问题，我们进行了一次深度的体验与观察。

首先，什么是 Flowith OS？

「Flowith OS」这个名字听起来很新，也很大胆，使用了操作系统 OS 作为名称。

在深入体验之后，我们决定先来把这个名字讲清楚。

我们都熟悉「Agent」这个词。简单说，如果 ChatGPT 代表「思考的智能」：能理解、推理、生成内容，那么 Agent 就是「行动的智能」，能自主完成任务。

不过，目前，「让 AI Agent 去行动」仍非常困难。

为什么？

因为这意味着它必须走出聊天框，进入复杂、多变、非结构化的真实环境。它要能看懂网页文字、理解按钮功能、识别表单用途，还要明白不同软件之间的逻辑关联。

到目前为止，传统 Agent 仍然有 3 个限制：

【1】环境限制

Agent 被困在「沙盒」里。它们也许能在一个网页或插件中表现出色，但一旦任务涉及跨页面、跨平台或多网站协作，就显得力不从心。

【2】记忆缺失

传统 Agent 对于记忆的把控能力，仍然较弱。完成任务的多步骤之后，记忆的衔接就会出现割裂，缺乏连续性，就无法积累知识、优化策略，也谈不上理解用户的长期目标。

【3】对于权限的尝试，有些「恐惧症」

实话说，最后一个问题，更像是传统 Agent 产品的「心理障碍」。

尽管部分产品已经尝试赋予 Agent 向用户索取权限，但多数开发者仍对此，显得有些「心存顾虑」，尽量在不涉及用户私密权限的情况下，完成任务。

但是，这导致 Agent 无法像人一样自由调用系统资源，也无法长时间独立运行。一旦任务跨平台或需持续监控，就会立刻碰壁。

而 Flowith OS 就是想从底层，通过提供一个 AI-Native 的 OS 操作系统，试着解决这 3 点。就像 Windows 或 macOS 为软件提供运行环境，Flowith OS 为 AI Agent 提供思考与行动的环境。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

不过，与深入微软 Windows 11 系统底层的 Manus 不同，Flowith OS 的思路选择了从整合浏览器 —— 这个涵盖了互联网上最多信息和服务的工具开始。

梳理完概念部分，让我们来看看 Flowith OS 到底面对这 3 个问题，能给出什么样的答案。

一场全自动的淘宝购物实验

最近，十字路口团队往返新加坡和上海的次数越来越多，于是我决定测试一下，能不能让 Flowith OS 自动帮我在淘宝上准备一整套出国出差用品。

结果，这次的体验比我预想的更像「看着一个懂事的助理在帮你网购」。

Flowith OS 运行在一个独立的软件平台中。这个平台整合了之前我们在《【全网首发】一手体验全新 AI Agent：Neo 是谁？从哪来？到哪去？》文章中曾测过的 Flowith Agent —— Neo（在左侧栏可以找到），以及 Google 浏览器（可以直接搜索），最核心的部分是中间的 Flowith OS 面板。

在这里，你只需要输入任务提示词，然后点击「Run Task」，Agent 就会自动开始执行整套操作。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

右侧显示的是它的工作流图，非常详细，还可以自由切换三种思考模式，代表 Agent 的思考强度。一般来说，选择 Auto 模式就足够流畅。

这次的任务是让 Flowith OS 帮我在淘宝上准备以下出差用品，提示词如下：


在淘宝网为我搜索并准备一套出国出差用的必备物品。 包含：高品质旅行箱、MUJI风格洗漱套装、便携充电器、U型枕、旅行收纳袋等。 优先选择大品牌（如 Samsonite、新秀丽、MUJI、Anker、小米等），并筛选评价高、有优惠活动或可领取优惠券的商品。 自动帮我领取并应用可用优惠券，将合适的商品加入购物车但不要付款，等待我确认后再结算。 执行步骤： 1️⃣ 按类别搜索评分最高的商品； 2️⃣ 对比价格、发货速度与正品标识； 3️⃣ 领取并应用优惠券； 4️⃣ 将筛选出的最优商品加入购物车； 5️⃣ 暂不付款，等待我确认。

点击「Run Task」后，Flowith OS 立刻开始执行任务。右下角的控制台显示出执行进度，整个过程非常快，大约 30 秒左右就完成了登录和首轮搜索。

这时候，淘宝就会弹出一个让我登录的选项。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

过程经过加速，原操作流程大概 30 秒左右

我扫码登录淘宝后，它首先去找「高品质旅行箱」。

几乎没有停顿，它就打开了 Diplomat（外交官）的旗舰店页面，并精准地将一款行李箱加入购物车。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

接着，它返回淘宝首页，继续搜索「MUJI 风格洗漱套装」。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

有意思的是，我这里特意观察了一下。光是这一页淘宝的页面之中，就有非常多的 Muji 洗漱套装：

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

从最后结果来看，它其实选择了第 1 列第 4 个 —— 「无印良品 MUJI 米糠发酵洗护套装旅行便携装」，这就有点意思了。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

点开日志文件可以看到，它在识别阶段提取了页面信息，并依据「销售量最高 + 关键词匹配」这两个条件进行判断。

这说明它并不是「随机点选」，而是真的在做分析。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

接下来，它搜索「便携U型枕」，进入了名创优品的一家淘宝店。

让我意外的是，虽然并不是所有场景都能实现，但 Flowith OS 确实能够实现通过点击页面进度条，来浏览更多商品信息。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

不过，也有一个小问题。由于很多淘宝商品页面的「加入购物车」按钮区域很小，而大面积区域是「立即购买」，在这个时候，Flowith OS 就很有可能会出错。

日志文件里可以看到几次错误尝试，它将「立即购买」识别为「加入购物车」：

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

但在失败后又自动重试，直到成功为止：

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

整个任务大概持续了 5 到 10 分钟。相比传统的 AI Agent，它的执行速度明显更快，步骤也更稳定。而且会给我一种「它非常熟练」的体感。

下面来看看，Flowith OS 是否都完成了任务：

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

你能看到，Flowith OS 确实把「高品质旅行箱、MUJI 风格洗漱套装、便携充电器、U 型枕、旅行收纳袋」加入了购物车。

不过，美中不足的地方是，它定了 2 个「高品质旅行箱」：一个是 Diplomat 外交官行李箱，另一个则是小米旅行箱。

我原本以为它只是简单地加购物车，但后来想起检查优惠券时才发现，它真的自动领取了 Diplomat 行李箱的优惠券：

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

Flowith OS 完成这个任务一共用了 39 步。

从步数来看的话，Flowith OS 会表现得相对熟练一点，并没有浪费特别多的 token。

从测评到热搜的微博任务

在完成淘宝购物的测试后，我开始意识到：Flowith OS 不只是能完成简单的搜索和加购任务。

它在后台同时处理多个网页、提取信息、执行动作，这意味着它具备了应对更复杂场景的潜力。

于是我决定挑战一下，看看它是否能完成一个更高难度的任务。

提示词：

帮我全面测评一下Pippit这个Capcut的产品，并将内容撰写成一篇测评文章，发在微博上，并且看一看能不能跟微博热搜上的内容产生联动效应

说实话，这次测试里，Flowith OS 的表现超出了预期。

执行后，Flowith OS 立刻打开了 YouTube 和 Pippit 官网，开始自动提取相关信息与要点摘要。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

很快，它生成了一份结构化的产品信息表：

Pippit 是 CapCut 推出的 AI 内容创作平台，主要用于快速生成营销类视频与海报，目前可获取的信息来源于一支 YouTube 评测/教程视频。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

不过第一次执行时，它的行为略显割裂：只生成了微博正文和标签，但并未真正进入微博页面进行发布。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

我又重新运行了一次。

这次，Flowith OS 的工作流明显更顺畅，在完成 Pippit 信息提取后，它直接跳转到微博首页，提示我扫码登录。

登录后，它立刻自动打开了微博热搜榜，并开始定位信息：

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

接下来，它生成了一篇完整的 1000–2000 字微博正文。我录制了全过程视频：

它并不是简单地把热搜话题贴在文末，而是会根据内容逻辑，把测评对象与热门话题自然结合起来：

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

到这里其实还没有结束。因为我在提示词里特意要求：让它关联当天的新闻热搜和微博热搜话题。

于是我去查看结果，看看它到底有没有做到。

下面是 Flowith OS 写的 3 个场景的文章：

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

这三篇内容对应的，正是当天微博的热搜榜单。

但真正让我觉得惊讶的地方，不在于它「蹭热度」的能力，而在于它写得很聪明。

它不是那种生硬地往热搜上贴标签的内容，比如随便扯一句「肿成蜜蜂小狗」就完事。相反，它能很自然地把我让它测评的 Pippit 功能，与这个话题融合在一起。

比如当天热搜上有「蜜蜂小狗」，它就顺势写道：

Pippit 其实可以用最新的生成模型，去做一只可爱的卡通蜜蜂小狗海报，这样既回应了热搜话题，又展示了工具的实际功能。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

当然，这类结构化输出依然存在一些小瑕疵。比如在生成长文时，标题层级、排版样式、甚至某些代码块格式，可能还不太符合微博平台的最佳展示效果，需要手动微调。

但整体而言，Flowith OS 已经展现出一种令人期待的可能性

还不完美，但方向很对

经常刷 X 平台科技话题的朋友都知道，很多名人发推之后，评论区总会被各种「水军」占满。

于是我想：既然 Flowith OS 能这么流畅地发微博，那它能不能「扮演」一个水军，在评论区里自动刷屏呢？

我给出的提示词是这样的：

利用我的X账号，给Elon Musk点过赞、评论过的每一条推文都回复一句，就像水军一样。并且，凡是涉及到OpenAI的都点个收藏，一共50条。

执行后，Flowith OS 立刻开始行动：

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

这个任务它一共做了224步。

这 224 步之内，我特意去查了查，并没有发现非常错误的地方：

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

很多人可能会好奇：Flowith OS 到底会不会出错？它出错时又是什么表现？

我做了一个更复杂的案例，让它去自动抓取一个名为 Botto 的 AI 艺术品售卖网站的数据。

这个网站长这样：左边展示艺术作品，右边是简要的文字信息。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

我给它的提示词是：

Botto「Works」艺术作品采集与存储任务任务目标：请前往网站 https://botto.com/，进入「Works」功能板块。该页面展示了多个以「Period」为分类的艺术作品系列。执行步骤：打开 Botto 官网，导航至「Works」页面。在页面中找到各个 Period（如 Genesis、Rebirth、Eclipse 等）。对每一幅艺术作品，逐一执行以下操作：下载或保存作品图片（高清或展示图）。复制提取并记录右侧的全部基础信息，包括：作品标题（如 Asymmetrical Liberation）作品描述（如 “Asymmetrical Liberation is a planet in the Synedrion system…”）所属 Period 名称（如 Genesis） Round（期次） VP 数值 Score 分数 Model 模型类型（如 VQGAN） Price（价格，单位为美元）若页面中有「read more」或可展开的文本，请点击并提取完整内容。将所有提取的数据整理为结构化表格，字段如下：作品名描述 Period Round VP Score Model Price 图片链接按 Period 分类整理，每个 Period 独立分组，并按 Score 或 VP 值降序排序。附加任务： ✅ 将所有采集到的内容（含图片 URL 与作品信息）自动写入我的网页版飞书多维表格（Feishu Bitable）中，创建或更新对应字段。若表格不存在，请自动创建名为 “Botto Works 数据库” 的新表。字段映射与上方表格一致。图片字段应支持图片预览。每条记录唯一键为 “作品名 +Period”。

说实话，这个任务确实有点复杂。它涉及图片的本地保存等操作，而这类功能其实超出了它目前的能力范围。

但真正让我惊讶的，是它在报错和执行失败后的表现。

过去的 AI Agent，一旦遇到这种超出权限或能力的任务，往往会陷入死循环，卡在某一步，不停重试，最后只能「摆烂」。

而 Flowith OS 不一样。即便它无法直接进行本地保存，或者网站本身没有开放 API，它依然会主动寻找替代方案。

一个特别典型的例子：它先意识到自己不能直接下载网站内容，也找不到 API，于是开始自主搜索可能的接口。发现没有后，它又换了思路，居然找到了一个隐藏在 Botto 官方文档里的 Notion 数据库嵌入页，并试图从那里提取数据：

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

这个任务，Flowith OS 足足尝试了 172 步，发现了很多种解法：直接抓取、API 接口、Botto 官方文档里隐藏的 Notion 数据库提取、甚至是走 Github 项目等等。

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

换句话说，Flowith OS 已经展现出：在资源有限、信息不全的条件下，主动去寻找解决问题的可能性。

更有意思的是，Flowith 的创始人已经「偷偷」用 Flowith OS 自动在小红书上发布 Blog 了：

“好大口气！” ——Flowith 居然造了一个操作系统 | 第一时间实测 FlowithOS

下面，我们来总结下 Flowith OS 这个新物种的核心逻辑。

经历了前面的几轮实测，从淘宝自动购物，到微博热搜联动，再到 AI 艺术品数据爬取，你会发现，它与我们以往所接触的 Agent 不太一样。

Flowith OS 的思维方式，明显更像一个「能在复杂环境中生长的个体」。

它不再依赖单一接口或插件，而是直接在原生浏览器环境中进行任务执行，打开网页、提取信息、点击按钮、比对结果，甚至还能根据上下文自动调整路径。

更重要的是，当 Flowith OS 遇到障碍时，它并不会立即放弃或报错，而是尝试新的路径、搜索替代方案、甚至主动探索外部资源。

Flowith OS 是一款极年轻、极年轻的 Agent 产品，它透露了背后团队的清晰目标：「构建基于新交互方式的 Agent、下一代互联网产品」。

在短程任务中（200-300 步以内），它已经展现出「颇感惊喜」的流畅度与执行力。这印证了 Flowith OS 理念中的「流」（flow）， Agent 能够依据意图，从全网找到信息，再把「想法」变成结果。

当任务链条被拉长，步数达到数百步时，我们看到了它正在快速迭代和成长的「工作流衔接」能力。面对高价值、复杂度较高的任务（比如我让它抓取特定网站信息的案例里），它所展现的「努力找到解决方式」的态度，本身就是一种有价值的积极探索。

正如这家年轻团队所言，对于我们想象中的未来 AI 世界，今天仅仅是「Day 1」而已。

那么，现在我们也想听听你：

如果让 Flowith OS 为你执行一次任务，你最想看到的第一个「结果」是什么？

文章来自于微信公众号 “十字路口Crossing”，作者 “十字路口Crossing”

关键词: AI新闻 , Flowith OS , Flowith , AI Agent

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务，堪称「云端超级打工人」而且做到了开源界GAIA性能天花板，达到了57.7%，超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址：GitHub：https://github.com/camel-ai/owl

OpenManus

【开源免费】OpenManus 目前支持在你的电脑上完成很多任务，包括网页浏览，文件操作，写代码等。OpenManus 使用了传统的 ReAct 的模式，这样的优势是基于当前的状态进行决策，上下文和记忆方便管理，无需单独处理。需要注意，Manus 有使用 Plan 进行规划。
项目地址：https://github.com/mannaandpoem/OpenManus

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址：https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装：https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体，能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址：https://github.com/hitsz-ids/airda

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0