你的浏览器,从今天起进化成免费智能体。
谷歌Chrome推出Gemini Skills,一键生成可复用的技能。

举个栗子:你在刷到一个食谱,想让AI分析营养价值。
以前每次都要手动复制一长串prompt,现在保存一次就行,以后在任何食谱页面上敲个斜杠键,直接跑。

免费,默认内置在Chrome里,不需要买任何订阅。
如果你没有收到更新,试试把语言改为“英语(美国)”。

Skills,在AI时代的地位相当于手机时代的APP。
但以前要在龙虾或者Claude Code里用,还让人望而生畏。
来到浏览器里,门槛彻底为0了。

以前想让AI重复干同一件事,总结文章也好,分析产品成分也好,对比价格也好,都得重新输入或者复制粘贴一遍prompt。
提示词多了,还得找个地存着。
能忍,但很烦。

现在的解法是把这些prompt存成Skill。
在Gemini聊天框里敲斜杠(/),或者点旁边的加号按钮,选你保存过的技能,一键就跑。

Google还预置了一个技能库,50多个现成的技能,涵盖食谱营养计算、护肤品成分分析、YouTube视频总结等场景。觉得不顺手可以自己改,改完存下来下次接着用。
跨设备也能同步。登录Google账号,你在公司电脑上保存的技能,回家打开Chrome一样能用。
还有一个杀手级能力:一个技能可以同时读取多个标签页。
比如你想对比两个产品的参数,打开两个标签页,跑一个技能,并排对比表就出来了。

But!
凡是涉及日历、邮件这类会产生实际动作的操作,Gemini会先找你确认再执行。
总的来说,这些功能并不新,在Gemini里都能使用,但是整合到浏览器里,离使用场景总归是更近了。
先是专用的AI浏览器出场。
从Perplextiy的Comet到ChatGPT Atlas。
国内美团旗下光年之外也推出了AI浏览器Tabbit。

现在传统浏览器也坐不住了,纷纷往Agent方向走。
核心变化就是从“帮你展示网页的工具”,变成了“替你完成任务的助手”。
老牌浏览器Opera的Neon版搞了个叫Cards的功能,跟Chrome的Skills几乎一个思路:
把prompt保存下来复用。热门场景包括任务优先级排序、规划电影之夜、找便宜机票。

微软更是被抓包,所谓新出的Copilot App,其实就是Edge套壳,浏览器三个字都快不好意思写在脸上了。

虽然现阶段AI浏览器多多少少都有些不完善,但一定是未来的大趋势没跑了。
仿佛回到了上个世纪90年代的浏览器大战。
上一次,决定了谁掌握互联网的入口。这一次,改变的是人和互联网交互的方式。
只不过问题是:谁是新的Netscape,谁是新的Firefox,Chrome还会是最后赢家吗?
参考链接:
[1]https://blog.google/products-and-platforms/products/chrome/skills-in-chrome/
[2]https://x.com/TheBobPony/status/2041112541909205001
文章来自于微信公众号 "量子位",作者 "量子位"
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0