背景信息:Fellou 又发新版了
来讲讲:Fellou 最近的探索
先说新东西,叫 Fellou CE(Concept Edition),为表诚意:
从体感很丝滑,人机交互一绝
从品牌说法上...这东西叫「首款智能代理浏览器」...
哎...我换个方法,来给仔细说说...
一句话总结:同时给人和 Agent 用的浏览器
这东西,平时就是个浏览器,你可以拿去刷 B 站
需要干活了,就喊一声:“帮我把英伟达最近的财报扒一下,整理成 PPT”
然后 Fellou 就自己开了套后台窗口,默默干活去了
然后你该干嘛干嘛,继续刷B站;而 Fellou 在后台给你吭哧吭哧地整理资料
过程中,你能随时“探个头”看看进度,觉得它跑偏了就踹一脚让它改,或者干脆直接叫停。整个体验很丝滑,其背后是 Fellou 在两个方向上动了真格:
讲道理,有点 Agent OS 的味儿了(这个说法并不来自官方)
下面,咱们就掰开揉碎了看看:Fellou 到底想干嘛
这是我现在的屏幕,正在码这篇文章
当然...这只是一屏...
作为 AI 的深度用户,浏览器上日常开着 GPT + Claude + Gemini
同时还有这 10+ tab 的信息资料,以及bilibili、游民星空、知乎、twitter...
于是,这样的屏幕,我有11个...用了两个显示器
我的码字日常 belike
再打开一个 ChatGPT,开了第 27 个标签上,它刷刷刷输出一堆文字,再手动复制粘贴到第 22 个标签页的文档里
Hhhh 场面总是极为混乱
人和 AI,总在同一个平面上抢地盘,非常的乱七八糟
混乱的桌面hhhh
Fellou 做的第一件事,就是物理隔离:给浏览器加了个深度,一个透明的“后台办公室”,来解决一个核心问题:互不干扰,但随时可控
你随时可以查看 Agent 的工作进度,如果发现他在贴吧上开始吵架了,可以立刻暂停它(或者围观他)
你拥有绝对的控制权,这就是所谓的 影子空间
在这里:人是老板,坐 VIP 席,Agent 后台小黑屋干活,但小黑屋是全透明的,老板你随时能视察
现在的 AI,本质上还是个高级对话机器人:你让它干嘛,它干嘛
之前忘了在哪看的,说 AI 是个完美的实习生:啥都懂,就是你得把任务拆解得很细
Fellou 的调度系统,想解决的就是这个问题。它追求的不是“指令-响应”,而是 “意图-执行”
你不用跟它说:“第一步,打开 X 网站;第二步,搜索‘AI Agent’;第三步...”
你直接下达一个总目标:“帮我找到 10 个适合我 LinkedIn 资料的工作,并用我的简历去申请”
这就是它的核心能力:深度行动(Deep Action)
Fellou 的调度引擎会把你的这个“意图”,自动分解成一个任务树,然后派出不同的 Agent 去执行:登录 Agent、搜索 Agent、填表 Agent、投递 Agent... 它们并行工作,互相协作
对此,在 Web Bench 基准测试的成绩单上,在最麻烦的“写入”任务(登录、填表)中,Fellou 取得了相当可以的成绩
Web Bench 跑分,来自 Fellou 官方
当然,这么大的权限必须有约束:
一是本地优先,敏感操作在你电脑上跑,不上传
二是成本透明,干活前先报价,童叟无欺
这里的 sparks,对应 tokens
搞明白了上面两个核心思路,在让我们看看 Fellou 官方给的节奏图
...哎,还是看我写的吧
第一阶段:交付成果(现在)
你是老板,AI 是你手下最强的执行者
你说:“调研英伟达 50 系显卡”,它交付一份完整报告
你要什么,它给你什么,纯粹的执行力
比如,作为一个魔兽老玩家,经常需要做一些宏
宏这东西,跟正则一样,写一次学一次
写一个魔兽世界宏,鼠标指向友方施放恢复;指向敌方施放暗言术:痛;无目标时对当前目标施放,否则对自己施放
第二阶段:交付解决能力(即将)
从给鱼,到给你渔具
你说:“我需要每天监控竞品动态,并分析它们的定价策略。”
Fellou 不会只给你一份静态的报告,它会量身打造一个可重复使用的能力
(其实我觉得...现在已经部分完成了)
我让他给我做了一个生成器,方便我去弄
第三阶段:交付一切(未来)
喂到你嘴里。AI 不再等你提需求,它开始预判你的需求
早上醒来,今日简报已经备好;开会前,相关资料已经整理完毕
这里 AI 所给到的不再是固定界面,而是实时变化的信息
最后扯几句
和谢扬认识很久了,这哥们从 Authing 一路杀到 Fellou,以浏览器为基础,撬开更大的工作/生活场景,野心很大
我的酒吧开业时,谢扬送来的花
说实话,即便是按 72% 的成功率,也有 28% 的翻车,路还很长;但也确实拿出了一套完全的玩法,而且路子很清晰
大家可以趁着这波无需邀请码,体验看看 ➡️ fellou.ai
文章来自于“赛博禅心”,作者“金色传说大聪明”。
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md