每天 9 点,我的数据平台会多出一条粉丝增长记录。
Codex 会去看小红书、抖音、B 站、X 的粉丝数据,判断有没有增长,再把结果写回数据平台。
我打开结果时,最想看的就一件事:今天哪个平台涨了,涨了多少。

(隐私数据已隐藏)
这就够了。每天先看一眼增长,异常的再打开后台细查。
整个数据分析的功能,都是用 codex 的Computer Use 来实现的。

AI 一出来我就在试后台数据巡检。
第一代是 Python——自己写(或让 Codex 写)程序去整理 B 站、抖音这些地方公开的内容数据,免得一个个看。但很多平台对程序化访问限制很严,写出来要么跑不通,要么很快受限。
第二代是 MCP / Chrome 扩展(也叫 Chrome MCP)——让 AI 通过浏览器扩展去操作页面。MCP 跑起来慢,一个多步任务等几分钟才回,烦得不行;Chrome 扩展操控弱,稍微复杂一点的交互(折叠面板、分页加载、富文本框)插件读不到,跑两步就卡。
这两代卡的不是同一个点:Python 卡在平台限制,Chrome 扩展卡在复杂页面。
真正缺的是:当数据只出现在屏幕上时,AI 能不能像人一样看懂当前页面。
Computer Use 接上的就是这一段。
Codex 跨过去的门槛,是模型开始能读懂一个正在运行的电脑界面。
这张截图在模型眼里,会被拆成一组可操作对象:按钮、输入框、菜单、弹窗、加载状态。模型要判断:当前任务下一步该点哪里、输什么、等不等页面加载。
Computer Use 的一轮动作,其实就是这个闭环:

OpenAI 公开介绍 Computer-Using Agent 时,讲的也是这个方向:模型针对图形界面交互做过训练,能把屏幕理解、任务目标和鼠标键盘动作接起来。
鼠标会动只是表面。遇到按钮位置变化、弹窗多一层、页面慢一点时,它还能重新看屏幕,继续判断下一步。
脚本卡在规则里,插件卡在页面变化里;Codex 能一轮一轮看结果、改动作。
配合定时触发,它就能每天到点巡一圈后台:查粉丝增长、记增量、生成报告。
旧自动化是按点跑脚本,新 Codex 自动化是按点让 AI 接手一段电脑操作。
全程跟 Codex 对话。但先把两件 Codex App 设置打开,否则定时任务跑不通——这两件是 Codex 真在你本地电脑上操作(不是云端跑)的必要授权,正好印证上一节说的 Computer Use。
Codex App → 设置 → 常规,打开「运行时防止系统休眠」。否则定时到点了电脑还在睡着,根本起不来。

Codex App → 设置 → 电脑操控,打开「任意应用」和「锁屏操作」。第一次让 Codex 操作 Chrome 时,它还会自动往 Chrome 装一个扩展。

所有的自动化任务,都在下图的入口。

设置开好,下面两步走。
打开 Codex App,跟它说:
帮我装 codex-auto-report 这个 Skill。安装命令是 npx codex-auto-report-skill install。跑前给我确认一下,装完告诉我结果。

整个过程你不用打开终端。
codex-auto-report 是我做的一个辅助 Skill——其实就是我懒得每次都跟 Codex 重新解释一遍"反问 6 件事 + 出 HTML 报告",干脆做成 Skill。开头这种后台巡检报告,就是它适合承接的任务类型。
比如:
用 codex-auto-report,帮我建一个定时任务:每天早上 9 点巡检抖音、B 站、X 和数据平台,记录关键数据变化,跑完出一份 HTML 报告。

Codex 会用白话反问 6 件事,逐项确认:
你回完,Codex 自己去创建定时任务。下一天早上 9 点,它就开始跑。

全程就是和 Codex 说话——装 Skill 是说话,布置任务也是说话。
它像个不下班的实习生:每天到点上班、跑完发报告。
Computer Use 实际用起来还有不少技巧,遇到问题可以在评论区告诉我——后续我会专门出一篇(或一个视频)展开讲。

不是所有事都该交给 Codex。适合交的事有 4 条标准。
适合交的 4 条标准
只把可观察、低风险的事交给 Codex,其他的人来做。
这场拉锯还在继续——下一代工具出现之前,Codex Computer Use 够用了。
文章来自于微信公众号 "AI产品自由",作者 "AI产品自由"
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md