Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页
Manus爆火的秘密武器Browser Use融资1700万美元!让AI「读懂」网页随着AI智能体的爆发,Browser Use异军突起,刚刚融资1700万美元。它能让AI智能体轻松地「读懂」网站并自动完成复杂任务,引领了一波AI应用热潮。
随着AI智能体的爆发,Browser Use异军突起,刚刚融资1700万美元。它能让AI智能体轻松地「读懂」网站并自动完成复杂任务,引领了一波AI应用热潮。
3D 视觉定位(3D Visual Grounding, 3DVG)是智能体理解和交互三维世界的重要任务,旨在让 AI 根据自然语言描述在 3D 场景中找到指定物体。
我最近一段时间,除了处理项目上的一些问题,我将我的大部分时间都在体验目前的MCP成果上,我也在和不同的朋友进行交流,其实交流下来,只要是自己亲身使用过目前的MCP工具的基本上都有一些共同的认知:
谷歌Gemini迈出关键一步:「睁眼看世界」。用户发现Gemini新增实时屏幕共享功能,能准确识别屏幕上的内容并实时互动;并且可以打开摄像头与物理世界交互,帮用户给釉陶「上色」。
进入2025年,AI Agent迎来了蓬勃发展的新阶段。
3 月份发布的 Manus,让大众第一次感受到了 Agent 的强大。
自 2023年OpenAI发布函数调用功能以来,我一直在思考如何开启智能体和工具使用的生态系统。随着基础模型变得越来越智能,智能体与外部工具、数据和API交互的能力却日益碎片化:开发人员需要为智能体运行和集成的每个系统都实现具有特殊业务逻辑的智能体。
知名 AI 工程师、Pleias 的联合创始人 Alexander Doria 最近针对 DeepResearch、Agent 以及 Claude Sonnet 3.7 发表了两篇文章,颇为值得一读,尤其是 Agent 智能体的部分。
日前,北京市教委出台《北京市推进中小学人工智能教育工作方案(2025—2027年)》(简称《方案》),计划从今年起,通过创新培育“京娃”系列智能体、全覆盖开展中小学人工智能通识教育、打造一批“助教、助学、助育、助评、助研、助管”应用场景等系列举措,全方位推动人工智能赋能首都基础教育改革发展。
中国科学院大学团队在这篇论文中,提出了一个崭新观点:智能体不但是AI领域的核心,更可能是构成宇宙的基本单元,或许还将引发21世纪科学范式的重大变革!