Hello 大家好啊,
Codex APP 这一个多月以来真是疯狂更新,加了不少的功能,大有一种成为新时代的All-in-One的产品的趋势。
那之前写过一篇关于我认为好用的使用Codex 的一些技巧,分享几个我觉得好用的codex技巧给你,但好像还没真正写过一篇从0到1的教程,那这不就来了嘛!
那废话少说,我们直接开始。
P.S. 开始之前,我们先准备好一个GPT Plus 或者Pro的会员账号。
安装&登录
我们先从最简单的安装开始,直接去网站上下载就好;
网址我贴在这儿了:
https://developers.openai.com/codex/app

如果你是macos和Windows的用户,就直接点击我框出来的地方的连接进行下载就好了。
在下载好之后,我们开始登录。

我们直接点击用ChatGPT 账号登录就好

然后选择你的账号登录codex就可以。

之后看到Codex APP 弹出这个界面,就算登录成功了。可以开始愉快使用了。
界面介绍
在开始之前,我们先来看看整个Codex APP的布局是怎么样的。

整体上看,分为左、中、右三栏布局。现在大部分的agent 客户端,都是这么布局的。
左侧其实分为上、中、下三个部分。上面是一些功能,比如新卡对话、搜索、插件、自动化。中间部分是基于项目文件的消息对话记录,最下面是纯对话,不用选择项目路径。
中间部分就是主要的聊天对话窗口,也是我们主要的工作界面。在这里你可以选择对话的模型、项目工作目录、agent的权限等等。
右侧界面主要是展示agent 操作文件之后的diff、summary、浏览器、还有commit & push等等都在右侧。
当然,在Codex APP 里同样也有终端。

点击顶部这个按钮,终端就会出现在下方。
所以你可以同时在Codex APP里解锁使用Codex + Claude Code 的体验。
好用的技巧
其实到这儿,最基本的已经讲完了。你已经可以直接开始上手进行创造,试着做一个简单的、自己喜欢的网页、游戏或者是有用的小工具。
但,还是有一些东西我希望正在看文章的你能够了解。
毕竟掌握它们,能够帮你最大化的用好Codex。
Agents.md
如果你用过Claude Code,那你肯定对Claude.md 不陌生。那Agents.md 是一个某种程度上可以被认为和Claude.md 等价的东西。
简单说,Agents.md 就是一个给Agent看的Readme文件。我们在里面定义一套让Agent 遵守的规则,比如代码规范、回答的语言风格、测试标准等等。
一个Agents.md的示例长下面这样:
# AGENTS.md
这个文件是给 AI 编程助手看的。
在修改代码前,请先阅读并遵守下面的规则。
## 项目简介
这是一个 Web 应用项目。
请优先理解现有代码结构,不要一上来就重构。
## 技术栈
- React / Next.js
- TypeScript
- Tailwind CSS
- pnpm
如果不确定,请先看 `package.json`、`README.md` 和现有代码,不要凭空猜。
## 常用命令
```bash
pnpm install
pnpm dev
pnpm lint
pnpm typecheck
pnpm test
pnpm build
```
当然,要强调的是这个文件不是必须的。
你完全可以不编写配置这个文件,做出一堆有意思的东西。我自己其实就不太专门编写配置这个文件。
但随着开发过程的一步步深入,代码越来越复杂,为了让Agent 行为不偏离,请还记得这个东西,关键时刻它还是有点用处。
整个Agents.md 其实分为三层。
一层是全局路径,默认放在路径:
~/.codex/AGENTS.md
还有一个是项目根目录,放在你当前的工作的项目根目录下。
再细一点,就是放在项目中的子目录下。
如果这三层中,存在着冲突,那会依照离Agent 修改的文件近的那个Agents.md来算。
浏览器
为什么要把浏览器单独拿出来讲,是因为我认为它的重要性被大大低估了。
有了内置的浏览器之后,从此你可以做很多事情。
比如我们编写一个网页之后,再也不用打开自己机器上的浏览器进行预览调试。

直接点击文件名,然后右侧内置浏览器会帮我打开。然后如果我们看到哪里不爽了,不得劲了,直接使用评论模式,框出要修改的点,然后进行说明。
Codex 会自动把你的评论附带要修改的点同步到对话框中。

这是你使用各种CLI无法体会到的交互丝滑感。
甚至,OpenAI在Codex APP里专门放了一个Browser Use 插件。

它天然的就适配操作Codex APP里的内置浏览器。 可以帮你来和浏览器进行各种交互,比如截图、点击、测试网页端的应用等等。
插件
既然我们说到了Browser Use,那就不得不专门来说下插件了。
插件绝对是Codex APP里值得说的一大亮点。

OpenAI 在这里打造了一大堆非常有用的插件。

从Coding 领域的Huggingface、Vercel、Netlify再到设计以及工作中常用的生产力工具,Canvas、Figma、Gmail、Slack、Linear 因有尽有。
现在懂为什么我觉得Codex APP就是新时代的All-IN-One产品了吧,因为它真的特么什么都能干。
配置的过程非常简单,找到你想要的插件,点击“+”号就行。
我拿日常大家都会用的Gmail来举个简单的例子。

安装绑定好Gmail 这个插件之后,我们就可以在Codex里用了。比如让它帮忙看看最近两天的新邮件。

甚至也可以让它起草一份邮件,发给别人。

操作丝滑且速度巨快。
同样的操作,也可以搭配在其他的插件上。你可以点进每个插件的详情,看看它支持什么样的操作。
比如,这是Notion的。

可以很清楚的看到这个Notion 插件支持在Notion里进行文档、任务、数据库创建。还有各种其他的操作,比如会议、研究等等。
还有一个非常牛逼的插件,在Codex里,名字是Computer Use。

这绝对是Codex APP 能成为All-In-One的一大杀器。
简单来说,配置了这个插件之后,Codex APP可以操作你电脑上的任意应用。比如你可以让它播放音乐里的歌单。
之所以说它牛逼,是因为和我们过往看到的computer use 插件不同,Codex APP里的computer use 插件是在后台执行任务。
以前我们看到的很多computer use功能,在执行任务的时候,通常会直接把应用界面弹出来:鼠标在你屏幕上飞来飞去,窗口一个接一个打开,页面不断跳转。
你看着它操作,确实有一种AI 在替你用电脑的感觉,但问题也很明显:
它会占用你的屏幕、打断你的工作流,甚至有时候你还得在旁边盯着它,像看一个实习生第一次上手操作软件。
而Codex APP里的computer use,它是在后台悄悄执行任务。你可以继续做自己的事情。它在另一边跑代码、读文件、改文档、执行命令、检查结果。

它更像是一个真正被塞进工作流里的后台工程助理。它会独立执行它的任务,不打扰你自己的工作流,只有在完成了之后,才会告诉你。
我甚至在网上看到大佬们比较骚操作的一个玩法是:
用computer use 打开xcode、ios 模拟器这些进行测试,然后主聊天界面进行移动端应用开发。
这样你终于不用为xcode里那极其难用的AI功能而烦恼了。。。
自动化流程
另一个非常好用的是自动化功能。

如果每天都要做一些重复的事情,这个功能能帮你大忙了。
点击创建一条新的自动化工作流;

输入你的需求,选择项目路径,以及每日运行的时间。
这个比较牛逼的是,
这个自动化虽然也是工作流性质的,但它完全不需要你去一个画布上拖拽那些节点。只需要你描述清楚你的需求是什么就行!
就光这一点,比Dify、n8n这些强太多了。以前我看到这种画布上一条工作流,节点和节点之间各种连线,真的头都大了!!

我自己有一条自动化流程是每天3点钟,让Agent 给我去用Codex内置的图像生成Skill 去批量生成图像。

这比自己一张张去生成,速度快多了!感觉一个是走路,另一个简直是坐火箭。
认领一只宠物
现在你也可以在Codex APP里认领一只宠物了!
这是OpenAI最新给Codex 加的功能。
打开你的Codex APP,找到Settings 进入到外观,也就是Appearance里,

OpenAI 内置了八种不同的电子宠物,可以任意选择。
当然,这不是最牛逼的。最牛逼的是它可以自己定制属于你自己的电子宠物。
这一切都基于这个叫Hatch Pet的Skill。

最简单自己定制一个宠物的方法就是,拿着这个Skill,让Codex 帮你一步步照着实现就行。

根据这个Skill的设定,Codex会启用Subagent来生成一整行的动画帧。

在生成好之后,可以从我们刚刚提到的过的Settings里的Appearance 看到,如果没有的话,刷新或者退出重启一下应用就能看到了。

启用之后,会发现这个小小的电子宠物会浮在任何的应用界面之上。
甚至,如果你有任务正在让Codex运行,

你会看到你的宠物这儿,会有一个任务进度的展示。真的不得不说,OpenAI 把Codex APP的交互视觉这块打磨的真的细节。
我还在网上已经看到有大佬们专门做了一个各类宠物的收集网站。

里面有各种各样非常有意思的宠物,大家可以多去看看。
只能说,当年QQ宠物那么火是有原因的!人类真的天生就喜欢各种各样的小宠物,管它属性是电子的,还是AI的。
这个网站的链接我放在这儿啦:
https://petdex.crafter.run/
最后写点
好啦,终于把这篇一直想写的Codex从0到1的指南写完了;
我知道内容肯定还不够全面,还有一些遗漏,毕竟短短几千字的文章就想将整个Codex App 的使用方法技巧都涵盖完整,这基本是一个不可能的事儿。
但我还是希望这篇文章会有一些抛砖引玉的作用,
让正在看这篇文章的你,能够产生一种最原始的冲动,
“卧槽,这好有趣,让我下载来试试”。
我自己一直有个暴论,
AI时代,再好、再详细的教程都比不上自己亲自动手做一遍。
毕竟,
纸上得来终觉浅,绝知此事要躬行。
我相信这句话无论在哪个时代,都是亘古不变的真理。
那就让我们在这个特殊的时代,
尽情创造吧。
文章来自于微信公众号 "BubbleBrain",作者 "BubbleBrain"
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md