Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口
7619点击    2026-05-13 15:29

我们要做消灭软件的软件。


Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口


事情开始变得有意思了。一个95后天体物理学家正在让人类“双手离开键盘”,他还把公司命名为Afk——Away from keyboard。


他是Enther,1997年出生,从马普引力物理研究所走出来,他本该去追寻引力波,却一头扎进了 Palo Alto 的 AI 战场。他创办的 Afk.Inc 目前只有 9 个人,却跑着 900 个 agent;第一款产品 Bridge 宣称自己是“everything agentic AI”——一个可以在任何地方、替你完成任何工作的“Agent 秘书处”。


他对上班族的劝告只有一句话:你去跳舞,AI 来干活。


这听起来像是又一个被 hype 裹挟的 AI 故事。但 Enther 不是追风的人。此前他用 Affine 做到了 700 万用户、Product Hunt 年度第四,却在巅峰时亲手砍掉它。他判断,“AI 正在消灭软件。如果你注定要被颠覆,那不如自己来。”


于是,Bridge 诞生了(域名bridge.surf)。它让你“一句话就能复刻任意 AI 应用”。


Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口


今年4月,Bridge 启动了首批200位用户的内测,内测期,涌现出大量意想不到的用法——从半导体工程师到设计师,都在用它完成“自己看不懂”的工作。5月13日,它将正式发布。


在这次与十字路口的对谈中,Enther 聊了9个人如何撑起一个“消灭软件”的野心,Bridge 是如何做到让你“一句话复刻任意 AI 应用”的?同时,他也复盘了两个月前因为产品太超前、被OpenClaw抢占先机的遗憾与不甘…… 


当有人还在争论 agent 是不是下一个噱头时, Bridge 已经做到让 AI 替你退机票、写代码、开周会。It feels like magic.


这是 Bridge 首次对外发声。以下是十字路口与Afk创始人 Enther 的完整对话实录。


快问快答


首先用几个快问快答,让大家快速认识你。


🚥 十字路口


年龄?


🧑🏻‍💻 Enther


1997 年生人。


🚥 十字路口


毕业院校?


🧑🏻‍💻 Enther


从本科开始:香港科技大学 / 格拉斯哥大学 / 马克斯·普朗克引力物理研究所。天体物理出身。


🚥 十字路口


 MBTI 和星座?


🧑🏻‍💻 Enther


 INFJ,双鱼。


🚥 十字路口


一句话介绍现在的公司和产品?


🧑🏻‍💻 Enther


公司 Afk.Inc,一家在 Palo Alto 致力于构建 self-evolving thinking machine 的公司。让人类双手离开键盘,让 AI 替人上网。


产品 Bridge.surf,一个可以在任何地方随时访问、完成任意工作的 everything agentic AI。


🚥 十字路口


融资情况?


🧑🏻‍💻 Enther


 4M pre-seed,来自北美的知名 Angels。


🚥 十字路口


收入和利润?


🧑🏻‍💻 Enther


还未公开发布。


🚥 十字路口


 团队规模?


🧑🏻‍💻 Enther


9 人。


🚥 十字路口


创业前在做什么?


🧑🏻‍💻 Enther


Astrophysics 天体物理。


一句话复刻一切


🚥 十字路口


如果你面前坐着一位对 AI 感兴趣但不是技术专家的上班族,他为什么要放下正在用的软件,来试一试 Bridge? 


🧑🏻‍💻 Enther


 我会告诉他:现在最好的 AI 已经像一个完整的人了——人能用的工具它都能用。


真实的上班族有很多 AI 焦虑,但其实没用过什么豆包或 GPT 以外的 AI。 我会告诉他,你把 Bridge 下载下来,不用在意它是浏览器、云上还是本地、有没有哪些功能。


你想干什么,就和它说,它就能做完。


甚至你看到某个视频说别的 AI 能做什么,想试一试,和Bridge 讲,它也能给你复刻出来。


🚥 十字路口


听起来很有意思。Bridge 到底是什么?你们如何定义它?  


🧑🏻‍💻 Enther


我们的 slogan 是 Bridge intent and done。


Bridge,一个 Everything App。你可以把你的任何工作流,都转交给 agent。


你可以双手离开键盘,让AI替你工作,你只需要告诉他你想要什么。


今天,工程师能在 AI 写代码时去喝茶、跳舞,我们希望这件事发生在更多行业里。


🚥 十字路口


整个产品里,你自己最满意哪个设计?  


🧑🏻‍💻 Enther


最满意的功能叫 Books,产品正式上市后你会看到。  


它可以实现的是,Bridge 装在我电脑客户端上,只要电脑开着,我在任何地方登录网页都能让它接管我的电脑。Books 能做到:一句话复刻任意 AI 应用


比如,做一个动态生成剧情的游戏,或者把你读过的小说自动变成漫画,再一键部署成网站。视频模型、API、token、环境,什么都不用你配。  


我们团队内部有个群叫 demos,每天看 Bridge 能整出什么活。Runway 说他们能让 AI 跟人视频开会,我们直接把链接扔给 Bridge,它 one-shot 复刻了一个。


Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口


我们想改变一件事:以后你不需要再去找工具或软件。一句话,你想要什么,Bridge 就做一个出来,开箱即用,还能分发。


你可以自己用,也可以把链接发给别人,对方打开就能用,甚至做成多人实时游戏。  


🚥 十字路口


还有哪个设计让你很骄傲?  


🧑🏻‍💻 Enther


Notch——一个给 macOS 做的灵动岛。


Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口


当 agent 并发做多个任务时,无论你切到哪个屏幕,顶部都有进度条,告诉你它每一步在干嘛。你可以随时用快捷键收起或展开,也能在任何地方唤起它打开新任务。


它可以做到在不打扰你的同时,让你想看就看。而且这个动画,是我们一帧一帧抠出来的。


🚥 十字路口


还有哪些亮点设计?  


🧑🏻‍💻 Enther


极简输入 + 推荐行动。我们讨厌那种一堆按钮的复杂控制台,Bridge 默认只有一个最简单的输入框,复杂功能实时推荐。


我们做了前台、后台两套模式的 computer use。


当 Agent 接管你的电脑操作时,你可以选择后台模式:这样它就会在后台开一堆应用然后在你看不到的地方把活干完。


当然,你也可以选择前台模式,这种模式,你可以看 AI 是怎么干活的,还可以对 AI 指指点点,甚至让 AI 教你怎么使用某个复杂软件。


还有一个被砍掉的故事。


我花了两个通宵写了一个砍价 bot,想让 agent 更有人格、更有趣一点。但内测发现,用户看完三个酷炫动画后已经迫不及待要用产品了,此时不适合弹出 bot,所以我们下掉了。


特别可惜,以后合适时机我再放出来。


🚥 十字路口


Bridge 宣称「在任何地方使用,接管任何设备」,这在实际工作和生活中意味着什么?  


🧑🏻‍💻 Enther


其实,我们对它的想象一直没变,是一个超级秘书。


你给他发语音、发消息,拉着他一起开会做事,他就默默变成你的分身,最终一个眼神他就把活干了。  


只是今天, Bridge 把它真的实现了。


你可以通过客户端、网页、IM、邮件访问它,甚至可以像跟人开会一样和它开会。脑暴结束它就干活。


现在,它每天轮训我们所有人所有任务的进展,在 Slack 总结。我平时干的事也让盯着。它不光替你干活,还替你操心。  


现在大家都变成 vibe working 了。你放假了,但AI正在替你工作。


Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口


Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口


就像 iOS 干掉塞班,AI 正在消灭软件


🚥 十字路口


你在 Affine 已经做到了 700 万用户、Product Hunt 年度第四。为什么要砍掉它,从头做 Bridge?  


🧑🏻‍💻 Enther


Affine 给了我很深的 knowhow。


它是一个协作工具,也是 AI 协同知识库里 star 最多的。我们花了很长时间,探索人类与人类、人类与 AI 应该如何协作。  


但我也逐渐看清一件事:AI 本身会重新发明和定义软件。就像 iOS 干掉塞班,AI 正在消灭软件。它不会跟任何软件好好相处。  


所以,与其继续做一个限制 AI 的脚手架,不如直接去做 AI 本身。如果你注定要被颠覆,那就自己来。  


于是 Afk.Inc 诞生了——我和来自 Deno、OpenAI 的朋友,一起把 Bridge 作为第一个正式产品。


🚥 十字路口


为什么取名 Bridge?  


🧑🏻‍💻 Enther


AGI 甚至 ASI 已经来了。在我们的 benchmark 里,很少再有 AI 不如人的地方。以后建设 AI 的任务也只能交给 AI。我们做的就是桥接。  


一个 Agentic AI 是独立但互相关联的三部分:runtime(模型)、harness(工具)、memory(状态与存储)。


我们要连接的是:环境与模型、经验与训练、intent and done(意念与完成)、一个想法与 ship 出去的产品。


另外,我们上一个产品叫 Affine。做完 A,该做 B 了。


🚥 十字路口


你认为一个通用 agent 应该具备怎样的气质?  


🧑🏻‍💻 Enther


most of the time,agent 只有最小的打扰。


我们不是主打 AI 人格化。我们的 AI 也有 soul,但一个专业的秘书就是让人感觉非常靠谱,你不一定要了解它的 persona。  


我们想做的是少打扰:信息和复杂度被 AI 藏到看不见的地方。


所谓 vibe working,就是 AI 干活的时候不要影响我的 vibe,我可以去跳舞。


我认为,好的东西是简洁有效的,没有任何多余的信息,但它是全能的。  


而且,AI 不会局限在某个界面里,interface 都是暂时的。你开会时,它就在会议软件里;在信息产生的源头,你可以把所有想给它的东西无损地传递过去,它会给到你一个满意的结果。


🚥 十字路口


「一句话复刻任意 AI 应用」背后,实际发生了什么?  


🧑🏻‍💻 Enther


好的 harness 只需要少数几种能力:OAuth、存储、网络、AI provider。如果你有一套好的 harness engineering,任何人都可以复刻软件。  


AI 做完一个软件,它需要有能力自己去安装、使用、发现问题、替你迭代,直到给到你手上时是对的。


比如,你让 Bridge 做个网页,它会用自己云上的浏览器截图、自己用、看对不对,把截图给你。这本质上是一种 in-context 的 RL——与环境交互并训练自己。  


这种 AI 自我改进,让我们觉得 multi-agent system 会是未来一种非常本质的东西。所有需要人类的环节,除了消费结果以外,都可以由 AI 实现。


It feels like magic.


🚥 十字路口


有没有哪个用户的使用方式让你觉得「这也能行」?  


🧑🏻‍💻 Enther


太多了。每天都被震惊。  


比如,推特上有个用户让 Bridge 做了一个 AI 和自己打德州扑克的游戏,会互喷、互相 bluff。  


Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口


比如,一位半导体工程师,他用某种很旧的、没有 API 的芯片仿真平台,我一眼都看不懂的东西,但是Bridge 就能替他操作这个平台来干活了。  


Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口


最夸张的是一位设计师。


他为了看 3D 狗狗,用 Bridge 做了一个 2D 转 3D 的「3D 相片」,你输入一张照片,它会随人的视角运动,而且是完全在本地运行。


而且 Bridge 在构建过程中,甚至给他训练了一个专门检测景深和人脸位置的模型。实在太夸张了……


Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口


还有,我们现在好多工具都是自己生成的,比如,用来做“把产品截图变成像是拍摄屏幕一样的效果”的这个滤镜,就是 bridge 自己 vibe 的。


Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口


🚥 十字路口


还有什么印象深刻的事情吗?  


🧑🏻‍💻 Enther


有两个很有意思的事。  


一个是用户启发的。


有个用户把自己的账号密码给了 Bridge,让它去退机票。我本来以为 trip.com 很麻烦,没想到扯皮几轮之后,真的把票退了。


这件事让我们意识到,用户隔着 agent 登录网站很麻烦。于是我们做了一个专门保存密钥、但不给其他 agent 读的小产品Droppass[1]——替你输密码,端到端加密,Bridge 也看不到。  


Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口


另一个是内部协作。


我们日常主力使用 Codex 开发,本来各干各的。后来由于测试集群只有一个,大家把 Codex bot 接到 Bridge 里,然后在 Slack 里 @ 它聊天。结果生产力暴增。


除了自动化测试,我们发现 Agent Engineer 到了群聊里变成很好的胶水角色——它激发了人类协作。


通常,产品设计师和研发对齐是很难的,但 AI 比任何人都能理解两边的语言,大家又很方便随时和它聊,所以自然形成了“两边一起喷一喷,最后 AI 做出超出两边期待的东西”。


Bridge 串联了上下文,把不同人的 common sense 拉齐了。  


Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口


Bridge 首次发声:AI 正在消灭软件,我们要做 Agent 时代的入口


现在,我经常只需要和大家脑暴时拉上 Bridge,开完会后 @ 它「照着刚刚的搞」,就结束了。


真的是 vibe 口喷 working


三个技术难点与一座Willow


🚥 十字路口


做 Bridge 的技术门槛有多大?你们攻克的最大难题是什么?  


🧑🏻‍💻 Enther


非常大。


我们开始做的时候,业内还没有意识到 agent 的 harness、记忆和 runtime 是三件应该隔离的事——即便今天,这也不是共识。大多数人找台电脑装个模型,就说这是 agent 了。  


第一个难点:沙箱。


AI 误删文件或改错东西时,能不能有一个比 Git 更适合普通人的版本控制系统?我们做了可备份、可回滚的沙箱。 


第二个难点:多环境调度。


AI 既可以用云上的浏览器访问 Gmail、Notion、Linear,也可以直接操作你的本地电脑——比如帮你整理桌面。我们做了一个 Enviroment orchestrating system,让 agent 统一调度本地和云端。  


第三个难点:模型的自进化训练。


一年前 Claude Code 第一个做了 multiagent,今天多模型已经变成了必选项,比如 GPT5.4 干活很强。但是,跟人说话时,黑话连篇,体验并不友好。


那我们只让他干活,另一个 agent 替他说话就行。


所以,我们反其道而行——先训练一个专门负责聊天、像秘书一样的人格化 agent,由它去调度 GPT-5.4、Gemini、Claude、DeepSeek 做不同领域的任务。我们自己做了 model classification。  


这三块加起来,就是现在的 Bridge。


市面上任何别的 agent 能做到的事,我们都能做到,而且一句话就能复刻它的全部功能。


🚥 十字路口


为什么不直接用全能模型,一定要自建多模型?  


🧑🏻‍💻 Enther


我们也用所有全能模型,但 multi-agent 是对的。  


第一,智力与响应时间拮抗——要结果好,必须思考更久、试错更多,所以又好又快必须并发。  


第二,上下文管理要做减法,不是加法。review agent 不能看到所有实现细节,否则会犯和 worker 一样的错误。我们有一个专门的 safeguard agent,只判断当前操作是否危险,然后上报。  


全能模型要做很多事情,但你需要不同模型、不同上下文配置的 agent 来组成系统。


🚥 十字路口


在基础设施上,你们做了哪些自研的优化?  


🧑🏻‍💻 Enther


我们自建了一套方案,叫 Willow


在推理与训练场景下,我们的 harness 比基于 k8s 的沙箱集群快两个数量级以上,而且更经济。


每个 agent 每个 session 都开一台电脑的话,账单会光速爆炸——但传统方案就是这么设计的。想做 agent-native,就得自己搞。  


Agent 访问互联网基础设施的效率与频率,将超过人类的一百万倍。但今天的 infra 还是为人类设计的。


🚥 十字路口


在Harness层面做了什么设计?  


🧑🏻‍💻 Enther


首先,肯定是突出一个“全”:云上电脑、本地电脑,多操作系统都需要可以调度。只有这样, AI 才能做到任何产物它自己都能检查。


另外,还有比较不一样的地方是,我们做了一套 localVM——即便你在本地使用 Bridge、操作本地文件,也是先起沙箱、备份,然后可以回滚任意操作。


去年看到 computer use 的时候觉得太吓人了,它可以把我电脑删干净。


人类操作系统有 ctrl+z、回收站,但 agent 的 CLI 里一概没有。


🚥 十字路口


接口权限如何打通?


🧑🏻‍💻 Enther


微信最简单,因为龙虾已经把协议打通了,扫个码就绑上。  


真正麻烦的是 API、token、credential。普通用户不知道什么叫密钥 token,更别提怎么贴 key、租服务器。


我们做了一个本地 agent——Roco,就像《拯救计划》里的 Rocky,替你做好一切本地配置。


比如,你从未登录过 Notion,Roco 会自己起一台虚拟电脑,打开 Notion 网页版,弹 OAuth 授权给你。你感知到的就是点一下授权,完事。


其实, Bridge 里并不是一个单一agent,而是有一个你的秘书处。


你以为自己在和一个万能 agent 打交道,但这个 agent 背后有自己的团队。


比如你做个前端网页,实际上是 image2 在画原型,同时 GPT-5.5 或 Gemini 在写代码。  


🚥 十字路口


回顾产品时间线,是如何一步步走过来的?  


🧑🏻‍💻 Enther


2024 年 4 月,我们在 Affine 里做了第一个多模态 agent workspace——文字、视频、语音的解锁与生成,那时 Manus 还没影。  


2025 年,我们意识到画布和编辑器越来越不重要,agent runtime 才是核心。10 月发布开源项目 Open Agent(Pipo 框架),首次实现多沙箱和多环境编排——相当于用自己的基建复刻了一个更强版本的 Manus。  


2025 年底开始做 Bridge,同时组建 Afk.Inc。  


🚥 十字路口


听说你们比 OpenClaw 更早做了出来,但当时外界不理解?  


🧑🏻‍💻 Enther


是的,那是一段很尴尬的时间。


去年 12 月,我们比龙虾更早做出 proactive agent——cron job 和 soul,人格化的主动任务,到今天完成度也比他们高。


但当时我们跟别人讲,没人听得懂。你说「温度高了自动开空调」,大家就觉得「不就是定时发消息吗?」有劲儿使不出的感觉。


我们 went too far, 有点 beyond our time 了。产品太超前,解释成本太高。  


然后 2 月,一个完成度只有我们 50% 的产品 OpenClaw 突然爆了。火到大厂疯狂抄、海量投广告,一夜之间大家对 agent 的观感从「好酷」变成「不过如此」。


我心情特别复杂:要是我们早发就好了,但是我们不会开源,开源自带流量那套我们没有。现在再发又晚了,风评已经下来了……


🚥 十字路口


后来怎么复盘的?  


🧑🏻‍💻 Enther


我们的教训是:不要和同行还有投资人聊太多,大家看得多用得少,信息茧房太严重。


我们当时没敢发,就是因为我们当时不觉得人格化和 cron job 有多牛。结果龙虾大爆。所以说,实际用的人和天天看的人,是脱节的。  


现在依然是。


KOL 们看到 proactive agent 都腻了,但大多数人其实还配不明白这个虾那个虾。这恰恰说明 personal agent 的 killer app 还没出现。现在显然门槛太高,完成度太低。  


但确定的是,managed agent 会变成 the next big thing。


只是这一次,我们不会等别人替我们爆了。


九个人,九百个agent


🚥 十字路口


你们的团队规模是怎样的?核心成员来自哪里?  


🧑🏻‍💻 Enther


团队一共 9 人,全部全职。


我们有6 位工程师,其中两位是 designer engineer。我们的核心成员来自 Deno、Vercel、字节、Google、OpenAI。


我们 9个人,跑着 900 个 agent


🚥 十字路口


9 个人,怎么支撑起这么庞大的一个产品?  


🧑🏻‍💻 Enther


我们每个人 own 一个大的切面:infra、agent framework、大前端(包括 design)。


基本上没有一个功能或业务需要两个人。


唯一横向的是 Designer,他负责把我们所有人做的丑东西变好看,或者把我们做的好看的东西变好用。


🚥 十字路口


目前的融资情况?


🧑🏻‍💻 Enther


2025 年底,我们 close 了 400 多万美金 pre-seed。投资方来自硅谷一些知名品牌大 Angel,以及微软、Meta等硅谷很多大厂的高管都投了。


我们计划产品发布之后到 5 月底,开放下一轮融资。


🚥 十字路口


从 Affine 到 Bridge,你对「AI 会如何改变软件行业」的判断发生了什么变化吗?  


🧑🏻‍💻 Enther


大趋势没有变,但速度和阶段超过了预期。  


2025 年,我们还认为 agent 是「高级打字机」而不是「高级决策机器」。但到 2025 年 11 月,我们最强、最挑剔的架构师也不手写代码了。


到 2026 年 2 月,连 review 都是带着 AI 一起做,而不是人类逐行看,编辑器打开频率降低了 100 倍。  


有一个巨大的 pivoting 是「小模型训练」。


2025 年,我们的思路是用 leading agent 拆任务,让更快更便宜的小模型去执行。但这一步被模型的 agentic reasoning 与超强工具调用吃掉了。


现在我们是反过来:我们做了一些和用户聊天用嘴甜的、人格化的模型,做越难的事才去叫大哥模型。


所以我们不搞小模型训练了,但还在做 RL,只是方式很不一样。


🚥 十字路口


后续商业计划怎么安排? 


🧑🏻‍💻 Enther


我们已经完成了第一波用户测试。


现在,有200 个早期用户,评价很高。4 月中旬,我给了朋友和 跨界的KOL 试用,找了产品经理、工程师、甚至 FPGA 硬件半导体工程师,去跑真实场景。 


Bridge, 5 月 13 日正式发布


后面,我们计划扶持不同垂直领域的内容创作者和核心用户群,做面向个人生产力的订阅制 AI 产品。


🚥 十字路口


如果微软或谷歌明天推出一个和 Bridge 一模一样的产品,你会恐慌吗?  


🧑🏻‍💻 Enther


并不担心。


我们的独特设计太多了,很多东西是美学追求决定的,是「私货」。假如一模一样,我肯定要告他们。


如果是定位一样,其实还好。因为自己下场做大模型的大厂,做不好模型中立的产品。Manus、Cursor、Lovable 的历史也都说明,能跑出来的第三方产品,一定都是模型中立的。


🚥 十字路口


你们选择做“消灭软件的软件”,是一个非常大胆的定位。5年后,软件会消失成什么样子?Bridge 在其中是什么角色?  


🧑🏻‍💻 Enther


工具会变成动态的,信息平台还会存续。


我现在已经很少想象 5 年以后是什么样子,因为 AI 左脚踩右脚的发展,本身有着加速度。


在可见的一两年里,我们希望 Bridge 成为构建、管理与运行 agent 的入口——一个 agent for agents。它不会替代操作系统,没必要。


它可能有点像十年前的安卓桌面启动器。只不过这次启动的是,动态构建的任何东西。


🚥 十字路口


如果有投资人问「Bridge 的市场空间有多大」,你怎么回答?  


🧑🏻‍💻 Enther


从 web 到移动互联网,PC 被手机取代。门户和电脑应用变成手机 app 商店,推荐系统取代搜索。2000 年 bubble 破灭后,20 年疯狂价值创造,万亿级公司从无到有。  


这一次,习以为常的一切应用入口都会变成 agent 驱动。未来的世界,token 成本比网费便宜,每个人有 1000 个 agent 替他消费 10000 个手机等效的屏幕时间。


我们只评估数量级:下一个占据所有人的 personal agent 会占据信息的分发与消费,会出现 十万亿美元 的公司。


文章来自于"十字路口Crossing",作者 "壹小姐"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
OpenManus

【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。

项目地址:https://github.com/mannaandpoem/OpenManus


3
AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。

项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file

在线使用:https://aicomicfactory.app/

4
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

5
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

6
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT