时隔一个多月,进化版Fellou 2.0出世,正式开启了AI批量化生产的时代。它可以像「贾维斯」一样,7x24小时一键完成从调研到Logo设计等复杂任务,成为每个人真正的智能伙伴。
Fellou浏览器2.0:比以往更快、更惊人、更可靠。
唯一可比的,是昨天的Fellou。
在漫威电影宇宙中,Jarvis是钢铁侠托尼·斯塔克的私人人工智能助手,几乎无处不在,随时随地为托尼提供支持和帮助。
Jarvis不仅仅是一个简单的语音助手,它深入融入了托尼的生活,管理他的日常事务,控制他的高科技设备,甚至在战斗中提供实时的战术建议。Jarvis的存在让托尼能够专注于更重要的事情,因为他知道有一个可靠的助手在背后支持他。
在过去的一个月里,我们对Fellou浏览器进行了深层次的架构调整和全面优化。这一系列的改进不仅提升了性能和稳定性,还为用户带来了更流畅的体验。
今天,我们非常自豪地宣布,Fellou 2.0已经向我们梦想中的类Jarvis通用智能体迈出了重要的一步。
我们希望Fellou不仅仅是一个工具,而是一个可以融入用户日常生活的智能伙伴。我们的愿景是让Fellou成为用户生活中不可或缺的一部分,随时随地为用户提供帮助和支持,而不仅仅是一个飘在云端的虚拟助手。
从这篇文章中,你将了解:
Agentic Browser代表一种以浏览器为载体的通用智能体,不仅能访问互联网,更能够理解用户的需求,并自动拆解复杂的任务。其设计初衷是为了让智能体在拥有用户完整上下文的前提下为用户交付更好的结果,我们希望彻底改变用户与网络和计算机互动的方式。
Fellou依赖其独特的Browser + Workflow + Agent架构,开创了Agentic Browser这一新品类,打造了一个像「自动驾驶汽车」一样可以「自动冲浪」的浏览器智能体。
想象一下,你不再需要在多个应用程序之间切换来完成一项任务。Fellou可以为你自动化整个流程,从信息收集、数据分析,到最终的任务执行和结果交付。无论是进行市场调研、报告生成,还是制作音乐、生成3D设计环境、制作Logo,Fellou都能为你提供端到端的解决方案。
Fellou的目标是让用户能因为Fellou的存在而找到幸福,这种幸福是释放双手的幸福,解放重复劳动的幸福,脱困于格子间、电脑前和写字楼的幸福——但并非不劳动。人们会从劳动中获得满足感,Fellou的存在是让人们去做有更多多巴胺的工作,而那些消磨精神、耐心和体力的工作都可以留给Fellou。
时间对于每个人来说都是不可再生资源,让人有时间且有做自己的自由——是Fellou的初心。
这也是我们设计开发Fellou,以及坚持Agentic Browser方向的最基础原因——我们相信AI的发展会加速更多人的创造需求,而不是减少人们的工作机会,人类和AI是协作与成就的关系而非对立的关系,而Fellou作为一个浏览器客户端,在用户本地的设备里,就是那个有人们最多记忆、最多偏好、最了解用户、无处不在、有求必应的、融入用户生活的通用智能体。
我们带着这份期许,为了给用户交付更多更好的结果,完成了Fellou 2.0的升级。
总结下2.0的升级概要为:
更快:减少等待,多任务并行,交付更多
得益于大量、全面、多维度优化,Fellou 2.0在速度上取得了突破性进展,相比Fellou 1.x的版本,Fellou在不同任务的执行速度上提升了1.2 - 1.5倍,相比较某些通用Agent,我们在不同任务上皆有非常大的速度优势,如:
· 任务1
生成一个3D minecraft的场景,里面有埃菲尔铁塔。
Fellou耗时:1分20秒
Fellou交付物:https://chat.fellou.ai/sites/3d-minecraft-eiffel-tower-NdSWZGi_
某通用Agent耗时:4分30秒
· 任务2
把「Fellou是世界首个Agentic Browser」转化成摩斯密码,然后生成一个音频,用MP3格式。
Fellou耗时:1分30秒
Fellou交付物:
某通用Agent耗时:2分30秒
· 任务3
用HTML做一个贪吃蛇游戏
Fellou耗时:1分20秒
Fellou交付物:https://chat.fellou.ai/sites/snake-game-classic-retro-fun-aiz5HkaM
某通用Agent耗时:6分钟
· Marketing任务(跨应用生产力Workflow)
搜索Reddit/Twitter/Youtube/Tiktok上近1个星期发布的关于浏览器的帖子,在帖子下发布评论安利Fellou AI。
Fellou成功执行。
某些通用Agent执行失败,没有能将生成的推广信息分别发布到Twitter、Linkedin、等平台中,只生成了推广信息。
同时,我们优化了多任务并行的功能,使得用户能同时给Fellou下达多个任务,大大提升用户的多线程工作能力:
任务A:根据{@Youtube AI相关视频},创建为一个网站,网站内总结这段视频的核心知识,内容包括视频的主要观点、他是如何解释AI Agents和Agentic Reasoning的,以及这在AI发展的意义和应用趋势。网站最后需要出几个考题,来检验是否习得了这些知识。
任务B:将这个{@Google Sheet账单}作为数据源,并生成一个账单分析网站。网站需要可以从各个维度做自定义筛选。
注:并行任务目前仍处于Alpha阶段,在正式版本中会大不一样
更惊人:多样任务交付,7x24全天候执行
通过提供多样化Agent (如Browser Agent、Coding Agent、File Agent、Shell Agent、Computer-use Agent等)协作,提供除跨应用生产力Workflow之外的文本、图片、网站、PPT、CSV、Excel、Word、MP3、视频转语音、Logo生成以及总结Youtube视频等多样化的交付物。
· 音乐交付任务
今天晚上我们要开Party,大家想唱周杰伦的歌,所以帮我找几首他的热门歌曲,然后在中间写点串联和弦之类的,把这些歌串起来,最后返回串好的完整伴奏。需要钢琴版。加点复杂音效,我喜欢实验性音效比如Pink Floyd,或者Nujabes喜欢用的那些。
· 音频交付任务
为智能家居设备生成整一套反馈音效。
(因公众号限制原因此任务不提供视频)
· Logo交付任务
搜索尤溪县的建筑风格、文化和形象,帮我做一个logo,文字:尤溪县城市文旅,元素包含朱熹的形象,金柑的造型,八山一水一分田的山水风光形象,最好的是一个元素里体现三个意思。元素要少,避免复杂像徽章,背景白色扁平简洁。中文的占比是2x,英文是1x,图形是6x。颜色严格控制在2色以内,矢量,扁平,美观,产出10个陈幼坚的设计风格,其中一个要有尤溪县的文化底蕴和形象在其中,另外一个要有刘伯温故居的logo设计风格,再有一个把朱熹的头像融入进去。
Fellou交付物:https://chat.fellou.ai/sites/youxi-county-urban-tourism-logo-design-bLN_gEIw
除此之外,Fellou 2.0还提供了超长上下文管理,特别是监听类任务(如:Slack、Discord新消息监听、邮件监听、网页内容变化监听)实现了无限步长,真正解决长流程和复杂场景的问题。
· 监控Gmail任务
监控我的gmail,当有用户产品反馈相关的邮件时,用友好的方式回复邮件表达感谢。同时拆解用户邮件中提到的需求和Bug,并填充在 {airtable 的反馈表} 中。
· 跨境电商监控谈价任务
监控SalesSmartly,回答用户的问题,引导用户完成下单,当用户询问价格的时候,按价格表给到报价,当用户询问物流时间的时候,根据物流时间表给到预计的配送时间,当用户砍价的时候,不能低于我们的底价,预计低价持续的和用户沟通,用户确认订单后立刻生成一个下单的csv表(包含:商品名称 + 商品数量 + 商品的单价)。
更可靠:生产级场景覆盖,成功率大幅提升
生产级的意思是更加贴近用户的实际需求,更加端到端,更加无人化,更贴近「现实」,比如:信息填报、信息搬运、社媒运营、招聘流程闭环、跨境电商自动谈单等多样化场景应用。
· 找人任务
找到我上传的PDF里面前五个的Author,再帮我找到他们的全部背景信息和联系方式,背景信息包括Homepage、GoogleScholar链接、Github链接,联系方式包括邮箱以及电话,你可以通过他们的Github Repo提交历史URL和 .patch拼接后找他们的提交Email,以及在contact out(www.contactout.com)上找他们的Email和电话,所有的链接要求是完整的URL。
受限于公众号,以下案例无法提供视频或GIF,可供参考:
· Marketing任务
找到Twitter/Instragram/Youtube/Tiktok上分别找到粉丝数量在10k+的20个宠物博主,同时私信询问她们是否可以合作推广A品牌猫粮。YouTube无法私信忽略。把博主信息整理成网页报告。
· 找工作任务
在BOSS直聘上找到最新发布的前端工程师的岗位,结合对应的岗位描述和我上传的简历内容写一段自我介绍,并通过「立即沟通」将自我介绍发送给招聘者,发送10次。
以上任务还只是冰山一角,更多任务等待发现,这来自于Eko 2.0的新架构,在Online-mind2web榜单中,任务完成率从31%提升到了80%。
基于全新Eko 2.0架构,任务成功率由31%提升至80%(在Online-Mind2web基准测试中实现SOTA表现)。
Eko的定位是一个Browseruse和Computeruse的框架,在Eko 2.0中,我们提供了Multi Agent,DOM状态变化监听、Loop Tasks管理、Workflow规划等多项必须的基建能力,开源Eko 2.0给社区的决定深深植根于我们的技术信仰,这种信仰不仅仅是对技术本身的热爱,更是对更好的塑造GUI Agent未来的坚定信念。
Fellou正在加速变得更加聪明。
如果以少量总结,则是:
1. Fellou很快会推出Windows版本;
2. Fellou很快会取消邀请码机制;
3. Fellou的模型智能会飞快提升,将会有更丰富的交付物;
4. Fellou将持续优化用户体验,体现在:
a. 更快的速度,Agentic Workflow和浏览器性能两者兼备;
b. 更好的交互,更完整的对话上下文感知/理解/记忆/多轮对话,以及更好融合AI能力的交互界面;
c. 更多大家期待功能的补齐,比如迁移工具、密码管理器等;
关于你的下一步:
1. 对于未使用过Fellou的用户,可访问fellou.ai申请使用Fellou,我们会持续发放邀请码;
2. 对于Fellou的老用户:
a. 本次升级架构更新较大,2.0以下的版本已不可用,打开已经安装好的Fellou将收到我们逐步推送的更新,也可以到官网(fellou.ai/download)手动下载最新版本;
b. 目前Fellou 2.0仍处于内测阶段,在对话框中可使用「Use Workflow: 」启用最新版能力;
c. 在执行长任务时,推荐提示Fellou进行搜索,搜索的东西越多、提示词越精确产出效果会越好;
谢扬 · 好事不怕晚
2025年06月03日
文章来自于“新智元”,作者“桃子 犀牛”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0