
传闻许久的 OpenAI AI Agent 浏览器,如今这个靴子终于正式落地。
和往常一样,在真正的直播开始之前,大家都已经知道了这次要发布的是什么,上一次是 Sora,这次是名为 Atlas 的浏览器。
但 AI 浏览器已经是巨头新贵正在不断涌入的赛道,OpenAI 还未正式下场,就已经有了十足的火药味:预热推文评论区最高赞的评论,就是一名用户表示自己已经卸载了 Chrome,等待 Atlas,颇有点「打扫卫生再请客」的感觉。

在今天凌晨的直播活动中,OpenAI 正式发布了其首款桌面浏览器——ChatGPT Atlas。在将搜索、AI 聊天、智能体(Agent)等一系列能力整合进 ChatGPT 后,OpenAI 终于要打造一个完整的闭环,将所有体验都收归到一个统一的入口中,向 Google 的核心腹地发起了最直接的挑战。
和 Sam Altman 的许多其他产品一样,这个名字也起得颇有深意。Atlas 在英语中代表泰坦巨人,这某种程度上也暗示着浏览器在现代人上网冲浪日常生活中举足轻重的地位; 而 OpenAI 的野心,显然是要用 AI 重新定义这个地位。
OpenAI 员工在介绍时,也毫不掩饰其颠覆的意图,直接用「确保 Atlas 体验不会像你之前用过的任何一款浏览器」「这是一款全新物种的浏览器」等华丽的词藻来形容 Atlas 浏览器 —— 当然这也是 OpenAI 发布会一贯的风格。
那么,这款浏览器究竟新在哪里?它真的能撬动被 Chrome 主宰了十余年的浏览器市场吗?
首先,和市面上许多恨不得把所有功能都塞进主页的 AI 浏览器不同,Atlas 在一众「花里胡哨」的 AI 浏览器中堪称一股极致清流;默认主页就是你现在已经很熟悉的 ChatGPT 交互界面。,也可以在这里一键进入智能体模式。

你可以直接开始对话,就像使用 ChatGPT 的 web 版或桌面应用一样。它没有繁杂的书签栏和插件市场,一切都围绕着与 AI 的交互展开。
不出意外,Agent 能力是 OpenAI 在 Atlas 浏览器中塞入的重点;这一点与此前 perplexity 推出的 Comet 浏览器类似。 OpenAI CEO Sam Altman 在直播中表示,这才是他们希望人们未来使用互联网的方式——从「搜索信息」转向「完成任务」。
简单来说,Atlas 的核心是围绕一个无处不在的 AI 助手展开的。
首当其冲的是它的绝对杀手锏——智能体模式(Agent Mode)。激活后,ChatGPT 可以完全接管网页控制,帮你完成预订航班、餐厅、编辑在线文档等复杂任务。
比如,你只需要告诉它「帮我预订下周五晚上7点,在市中心附近一家评价好的意大利餐厅,两个人」,Agent 就能理解你的意图,浏览点评网站、查询空位、甚至跳转到预订页面帮你填好信息。

这也不算是特别新鲜的事,同样是此前在 Comet 浏览器乃至更早的 Manus 上已经出现过的技能;甚至 OpenAI 自家的 ChatGPT Agent 都已经能实现其绝大部分能力。
不过,将其作为浏览器的原生核心功能,体验无疑会更加丝滑。目前该功能仅限 ChatGPT Plus 和 Pro 用户使用。
其次是名为光标聊天(Cursor Chat)的实用微创新。它将 AI 的能力「注入」到了每一个输入框里。在任何网页,无论是写邮件还是填表格,你都可以选中一段文字,然后呼出 ChatGPT 进行润色、修改或扩写,直接以 vibe coding 的方式帮你 vibe 写邮件。 这个功能的核心在于「在场」,它消除了切换标签页、复制粘贴的繁琐步骤,让 AI 辅助写作变得前所未有的流畅。

为了让体验更具个性化,Atlas 还引入了记忆(Memory)功能。它会学习你的偏好和习惯,比如你喜欢的写作风格、常用的代码库、或是你正在研究的某个特定领域。你用的越多,下方的建议就会越贴近你的实际需求。 为了解决隐私顾虑,OpenAI 强调用户可以在设置中随时查看、编辑甚至删除这些「记忆」,当然也可以随时开启无痕模式,不留下任何痕迹。
此外,分屏伴侣(Split-Screen Companion)功能将「阅读」和「探讨」两个动作合二为一。默认情况下,当你从搜索结果点击一个链接时,Atlas 会自动进入分屏模式,左边是网页,右边是你的 ChatGPT 对话流。这个设计的意图是让 AI 助手随时待命,在你阅读长文或研究复杂主题时,可以随时帮你总结页面、解释术语、或者基于当前内容进行更深入的追问。这本质上是将「阅读」和「探讨」两个动作合二为一。当然,如果你不喜欢也可以随时关闭。

和其他 AI 浏览器一样,通过侧边栏随时与 LLM 交互同样是卖点之一。
靠着这些卖点,Altman 在直播中夸耀 Atlas 是一款「全面优秀的浏览器——它流畅、快速,非常好用」。这句话的背后,是来自OpenAI 今年在浏览器领域大举招兵买马,将 Google Chrome 和 Mozilla Firefox 的前核心开发成员 Ben Goodger 收入麾下确保的技术支持,保证了其作为一款浏览器的基本功足够扎实。

但 Atlas 的诞生,也标志着 AI 浏览器领域的竞争进入了白热化阶段。
今年夏天,Perplexity 推出的 Comet 浏览器已经凭借其强大的「答案引擎」和多样的 Agent 技能惊艳了市场。而 Google 也在不久前宣布,将把 Gemini 模型更深度地集成到 Chrome 中,实现类似的自动化任务处理能力。微软的 Edge 浏览器早已集成了 Copilot,成为了 AI 浏览器的先行者之一。

从目前公布的功能来看,Atlas 像是 Perplexity Comet 和原生 ChatGPT 功能的结合体。它足够简洁、专注,并且背靠 OpenAI 强大的模型能力。但它能否真正改变用户的浏览习惯,从 Chrome 和 Edge 的巨大市场份额中分一杯羹,还需要时间的检验。
尽管前景诱人,但 Atlas 依然面临不小的挑战。首先是用户习惯的惯性,大部分用户已经被锁定在 Chrome 的生态系统中,书签、密码、扩展程序的迁移成本不容小觑。其次,Agent 的可靠性也是一个关键问题,当 AI 代理出错,订错了机票或误删了文档,责任该如何界定?
但无论如何,Atlas 的发布,还是代表这 OpenAI 自己下场做浏览器这件事,最终已经尘埃落定,如今已经没人会在怀疑浏览器成为一个主动为你解决问题、处理任务的智能伙伴的前景。
它或许不会在朝夕之间取代 Chrome,但它和它的竞争者们,正在共同开启一个属于「AI 原生」的全新上网时代。
目前,ChatGPT Atlas 已在全球范围内登陆 macOS 平台;你现在就可以在 chatgpt.com/atlas 下载到这款浏览器的 macOS 版本; Windows、iOS 和 Android 版本也将「很快到来」。
你会尝试从 Chrome 切换到 Atlas 吗?

文章来自于微信公众号 “极客公园”,作者 “极客公园”
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。
项目地址:https://github.com/mannaandpoem/OpenManus
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales