Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页
6145点击    2025-03-24 16:10

AI智能体可能还没有一个大家都认可的定义,但这并不妨碍一大堆创业公司争相打造智能体工具,来自动化处理各种任务。


其中一家名为Browser Use的公司尤其吸引开发者与投资人的关注,因为他们的工具能使智能体更容易地「读懂」网站。


据最新报道,Browser Use刚融了一笔1700万美元的种子轮资金,由Felicis的Astasia Myers领投,Paul Graham、A Capital和Nexus Venture Partners跟投。


此次融资之前还没被报道过。


Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页


网站地址:https://browser-use.com


Browser Use是Y Combinator 2025冬季班的一员,最近几个月随着智能体的爆火而名声大噪。


尤其是火出圈的Manus也用了Browser Use工具,一下子就把它的知名度推到了新高。


Browser Use的创办人是Magnus Müller和Gregor Zunic,他们去年通过苏黎世联邦理工学院的创业加速器创办了这个项目。


Müller多年来一直在研究网页抓取工具,2024年他在读数据科学硕士时认识了Zunic。


Müller说,他们俩一块儿琢磨出了把网页抓取和数据科学结合起来的想法,打算让浏览器自己完成任务。


Müller和Zunic花了五周时间做出了个Browser Use的demo,结果一炮而红。后来,他们干脆把Browser Use开源了。


Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页


简单说,Browser Use是把网站上的按钮和元素拆解成一种更容易理解、更像「文本」的格式给智能体用。


这能帮助AI智能体搞清楚网页有哪些选项,然后自主做出决策。


「好多智能体靠的是视觉系统,通过截图来浏览网站,但这过程中老出问题。」


Müller说,「我们把网站转化成智能体可以理解的东西,这种方法能让我们以更低的成本反复运行相同的任务。」


随着越来越多的AI公司想让他们的智能体跟网站交互得更顺畅,Müller觉得Browser Use能成为满足这些需求的「底层技术」。


他还表示,现在Y Combinator冬季班里有20多家公司都在用Browser Use满足自己的需求。


有些公司还跑来问他们,怎样才能使得智能体更容易地浏览自己的网站?


Müller说,「像LinkedIn这样的网站,总是改变网站的功能,智能体在这种情况就经常出错。」


Felicis的Myers说,他们过去几年一直在关注AI智能体领域,而Browser Use就是一个很好的投资机会。


她说,Browser Use的创始团队——以及他们开源为先的策略——彻底打动了自己。


「我们觉得网页AI智能体是下一个前沿技术,能真正使得人类任务实现端到端的自动化,」


Myers对TechCrunch说,「网页AI智能体就像是一座动态桥梁,连接着静态预训练模型与不断变化的数字世界,而这些静态模型往往只专注于文本。」


Browser Use:让智能体简单地浏览网页


Browser Use可以使AI智能体简单地浏览网页。


它在GitHub上开源,许多项目都使用了它的功能,目前已经获得超过47k个Star了。


Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页


项目地址:https://github.com/browser-use/browser-use


Browser Use通过提取网站的交互元素(如按钮、表单等),使AI能够自动化执行浏览器操作,例如填写表单、搜索信息或导航网页。


这对于开发AI驱动的网络智能体非常有用。


比如,它可以将商品添加到你的购物车,并完成结账。


Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页


甚至是阅读你的简历,然后帮你找工作!中途如果有需要,还会停下来等待你的指示。


Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页


它也可以帮你干活儿。


比如,让它在Hugging Face上查找具有cc-by-sa-4.0许可证的模型,然后按点赞数排序,将排名前5的模型保存到文件中。


Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页


从MCP到Browser Use的爆火


Browser Use是随着智能体的快速发展而爆火起来的。


去11月,Anthropic首次提出「模型上下文协议」,即MCP,赋予了Claude模型超级能力,一次构建,让AI与工作流深度集成。


用通俗的话讲,MCP就像是专为AI应用设计的通用接口,类似我们日常使用的USB-C。


正如USB-C简化了不同设备与计算机的连接方式,MCP简化了AI模型与数据、工具和服务之间的交互方式。


通过MCP,AI助手不仅能够「读懂」代码,还能「理解」团队讨论、涉及文档等外部信息,提供更加精准的回答。


Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页


今年1月,OpenAI推出了Operator,能够自主执行网络任务,如规划假期、填写表单或预订餐厅 (OpenAI Launches Operator)。


Operator使用名为Computer-Using Agent (CUA)的AI智能体,通过视觉界面控制网页浏览器,模拟人类点击、输入和滚动的操作。


这一工具展示了AI智能体在网络任务自动化中的潜力,但也需要用户在遇到复杂界面或验证码时介入。


Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页


差不多同一时间,Browser Use也开源了,它被Manus团队集成到了Manus智能体中。


Manus因其综合能力和友好的用户界面(如实时显示思考过程)而迅速走红,吸引了大量关注。


这直接推动了Browser Use知名度的提升。


参考资料:


https://techcrunch.com/2025/03/23/browser-use-the-tool-making-it-easier-for-ai-agents-to-navigate-websites-raises-17m/


文章来自于微信公众号 “新智元”,作者 :犀牛


Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页

关键词: AI , AI创业 , Browser Use , Manus
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


3
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

4
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md