AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」
5321点击    2025-08-13 17:12

AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」


Edge 最大的敌人,不是 Chrome,而是它自己。


最近 AI 界的大新闻是 GPT-5 和谷歌的世界模型 Genie 3。然而,在无人在意的角落里,微软悄悄把 Edge 进化成了了 AI 浏览器。


上一次听到 Edge 的消息还是 IE 正式关停的时候,Edge 作为 IE 的继任者难免会被拿出来讨论,通常没有什么好话。


再上一次是 Edge 加入 sidebar 功能的时候,罕见地抢了一批 Chrome 的用户。


时至今日,Edge 的风评似乎没有比曾经的 IE 好到哪里去。


都 2025 年了,居然还有浏览器的首页充斥着闪烁的 MSN 资讯、天气卡片、股市小窗口,以及永远关不掉的「热门故事」。与此同时,微软不断地在给 Edge 加入「无用的新功能」,让系统变得越来越臃肿。


AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」


MSN,原来你没死透|图片来源:Edge 浏览器截图


但如果你愿意再给 Edge 一次机会的话,一键开启 Copilot 模式,Edge 就变成了神似 Dia 的样子:


干净得不像微软出品


AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」


这个首页就正常多了|图片来源:Edge 浏览器截图


栏目作者召集


极客公园的新栏目「AI 上新」,将带大家体验最新的 AI 应用和硬件,让你成为 AI 时代「最靓的仔」!


现在,我们也向所有喜欢尝鲜和体验 AI 的同学发出召集,只要你发现并体验了新的 AI 应用或者功能,按照格式(参考案例:AI 上新|不会用 PS 的我,却敢去小红书上接「设计单」了)向栏目投稿,在极客公园公众号发布,不仅能获得相应稿费,且会为你「报销」AI 应用的订阅费用。


同时,优秀作者还有机会进入极客公园 AI 体验群,获得最新 AI 应用和工具的内测资格,参加极客公园专属相关 AI 活动,和 AI 应用创始人一对一沟通。


AGI 太久,只争朝夕,让一部分人先 AI 起来吧!投稿、进群请扫描下方二维码添加极客小助手微信


AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」


01

微软,再造一遍浏览器


要让 Edge 变成 AI 浏览器,除了要更新到最新版本之外,还需要掌握一些小小的「魔法」。然后在设置的「AI 创新」一栏,就可以开启 Copilot 模式。


Copilot 模式的形态介于谷歌在 Chrome 有限 Gemini 集成,和 Manus 这样完全的 AI 浏览器之间。


在 Copilot 模式下,首页就变成了一个对话框,你可以直接用搜索引擎搜索、询问 Copilot 或者让它深度思考。这一点和其他主流的 AI 浏览器差别不大。


Copilot 的第二个入口在地址栏左侧,一颗小药丸形状的图标,单击就可以呼出,或者让它固定在右侧。


AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」


Copilot 的第二个入口在地址栏左侧|图片来源:Edge 浏览器截图


官方说它可以「感知所有标签页」。于是我打开了一篇论文、一份财报,以及一个亚马逊相机的搜索页面。随后我告诉 Copilot:「帮我总结特斯拉的财报,还有这篇论文的大纲,以及我想选购一款性价比高的相机。」


一分钟后,Copilot 分别概括了财报和论文,附上了各个价位的最佳相机,并暗示了我给出的需求并不精准


这一瞬间,我确实有一种错觉,有另外一颗大脑正在替我工作。


AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」


Copilot 同时分析财报和论文,并给出选购建议|图片来源:Edge 浏览器截图


这种总结能力也能迁移到视频上。当你在 Edge 中打开 YouTube 视频时,只要呼出 Copilot 并指示「总结视频」,它就会给出总结。


美中不足的是,Copilot 的这种感知并非全自动的,需要你手动 @ 标签栏,它才能替你工作


不过,最能让我产生「幻觉」,是 Copilot Vision。这是一个交互方式上非常新鲜的功能,Copilot 可以直接看到你的屏幕,并以此为基础和你用语音交互,就像你和朋友共享屏幕一样。


AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」


Vision 读取屏幕,并给出建议|图片来源:Edge 浏览器截图


例如在一个典型的购物场景,Copilot Vission 就可以直接看到屏幕上的备选产品,并给出选购建议。打开 Copilot Vission,一个带着浓郁广普口音的中年女声就会很热情地和你打招呼:「嗨~我可以看到你屏幕啦!」,很像在 Panda Express 或者 Jade Dragon Restaurant 碰到的那种广东阿姨。


不得不说,现在的 AI 语音已经做得非常自然,已经不太分辨得出 AI 味。碰到 AI 验证的时候,它还会主动安慰你:


「是不是挺烦人的」。


这我还是第一次在 AI 身上感受到了人味,语音交互带来的情感浓度的确要比文字强很多


但是就功能性来说,Vission 还算不上实用。一方面是它的图像识别速度跟不上我的浏览速度。另一方面,它在图像和语音识别的准确率上也有待提升。例如它会把「IPX6」识别成「IPX4」,我用语音纠正了它,它马上道歉,但是听成了「IPX7」。


目前的 Vision 有一点像家里的女性长辈,不懂科技,聊天信息密度不高,但是非常包容,情绪价值拉满


以上就是 Edge 最主要的功能了。还有一些功能微软表示正在开发中,例如 Agent 能力、智能标签分组或者是动态的 AI 助手。


实际上,很多功能微软已经开发完毕、处于测试阶段了,出于大公司的保守,它没有集成到 Edge 中。但是没有关系,进入单独 Copilot 主页,打开「实验室」,你可以看到,微软确实在开发一些好玩的东西。


AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」


Copilot 实验室|图片来源:Edge 浏览器截图


  • Copilot 3D,可以一键将图像转换为 3D 模型。上传自己的照片,你就可以轻松得到一个「逼真」的 3D 头像。


AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」


做得很好,下次别做了|图片来源:Edge 浏览器截图


  • Copilot 游戏,体验原汁原味的上古 FPS 大作《雷神之锤 2》,并且每一帧都是由 AI 实时生成的,同时画面非常卡顿。


AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」


AI 生成游戏的《雷神之锤2》|图片来源:Edge 浏览器截图


Copilot Actions 是微软最接近「Agent」野心的功能。我试着让它预订了一张 8 月 10 号从上海飞北京的机票。Copilot 大概跑了 20 分钟,完成了点点鼠标一分钟就能做完的工作。


但奇妙之处在于:它允许我随时「抢方向盘」


当它差点给我选了个中转航班时,我可以随时接管浏览器权限,把航线拉回直飞。这种「人机共驾」的体验,比那些一路黑箱跑到底的竞品要安心得多。


实际上,这样操作之后,跑任务的效率会大大提升,最终的出品也可控得多。我觉得这才是目前 Agent 最实用、最可靠的人机协作形态。正如它的名字 Copilot 一样,这是一种副驾驶员的哲学。


AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」


用户可以随时暂停,接管浏览器 | 图片来源:Edge 浏览器截图


02

微软的历史包袱


总的来说,Edge 浏览器的 AI 进化给到了不错的体验,基础功能不逊色于主流工具的同时,也有一些自身的亮点,例如标签感知和 Vision。


但与此同时,这还不是一款可以成熟到覆盖所有 Edge 用户的产品。很多宣传的功能并没有完全兑现,各个功能的入口也分散在四处。最明显的就是,地址栏旁 Copilot 入口支持附件上传和语音交互,而主入口的 Copilot 反而不支持这些功能。


更大的割裂感在于 Edge 浏览器本身和 Copilot 模式上。


单就视觉而言,传统功能区延续了 Win11 的 Fluent 圆角玻璃;AI 面板则是现代极简的风格,仿佛两代人共用一张办公桌。


AI 上新|在 Edge 浏览器里,我第一次感受到了 AI 的「人味」


两种设计风格同时共存在一个页面


更重要的功能性上,Edge 团队背负着沉重的历史包袱:兼容模式、IE 模式、企业策略、臃肿的 PDF 阅读器……而 Copilot 团队显然想再造一个「AI 优先」的物种。两股力量在同一具身体里拉扯,导致入口分散、菜单嵌套、选项重名。


于是,Edge 就像是一座仍在施工的跨河大桥:桥这头,是微软多年堆出来的旧公路,坑洼却熟悉;桥那头,是闪着霓虹的 AI 新大陆,诱人却断续。


用户站在桥中间,有一些迷茫。


文章来自于微信公众号“极客公园”,作者是“汤一涛”。


AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
OpenManus

【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。

项目地址:https://github.com/mannaandpoem/OpenManus


3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/