OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。
8343点击    2026-05-05 11:24

Hello 大家好啊,


Codex APP 这一个多月以来真是疯狂更新,加了不少的功能,大有一种成为新时代的All-in-One的产品的趋势。 


那之前写过一篇关于我认为好用的使用Codex 的一些技巧,分享几个我觉得好用的codex技巧给你,但好像还没真正写过一篇从0到1的教程,那这不就来了嘛! 


那废话少说,我们直接开始。  


P.S. 开始之前,我们先准备好一个GPT Plus 或者Pro的会员账号。 


安装&登录


我们先从最简单的安装开始,直接去网站上下载就好;


网址我贴在这儿了: 


https://developers.openai.com/codex/app 


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


如果你是macos和Windows的用户,就直接点击我框出来的地方的连接进行下载就好了。   


在下载好之后,我们开始登录。  


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


我们直接点击用ChatGPT 账号登录就好


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


然后选择你的账号登录codex就可以。


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


之后看到Codex APP 弹出这个界面,就算登录成功了。可以开始愉快使用了。


界面介绍 


在开始之前,我们先来看看整个Codex APP的布局是怎么样的。


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


整体上看,分为左、中、右三栏布局。现在大部分的agent 客户端,都是这么布局的。


左侧其实分为上、中、下三个部分。上面是一些功能,比如新卡对话、搜索、插件、自动化。中间部分是基于项目文件的消息对话记录,最下面是纯对话,不用选择项目路径。 


中间部分就是主要的聊天对话窗口,也是我们主要的工作界面。在这里你可以选择对话的模型、项目工作目录、agent的权限等等。 


右侧界面主要是展示agent 操作文件之后的diff、summary、浏览器、还有commit & push等等都在右侧。


当然,在Codex APP 里同样也有终端。  


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


点击顶部这个按钮,终端就会出现在下方。 


所以你可以同时在Codex APP里解锁使用Codex + Claude Code 的体验。 


好用的技巧 


其实到这儿,最基本的已经讲完了。你已经可以直接开始上手进行创造,试着做一个简单的、自己喜欢的网页、游戏或者是有用的小工具。 


但,还是有一些东西我希望正在看文章的你能够了解。


毕竟掌握它们,能够帮你最大化的用好Codex。 


Agents.md 


如果你用过Claude Code,那你肯定对Claude.md 不陌生。那Agents.md 是一个某种程度上可以被认为和Claude.md 等价的东西。 


简单说,Agents.md 就是一个给Agent看的Readme文件。我们在里面定义一套让Agent 遵守的规则,比如代码规范、回答的语言风格、测试标准等等。 


一个Agents.md的示例长下面这样:    


# AGENTS.md

这个文件是给 AI 编程助手看的。 
在修改代码前,请先阅读并遵守下面的规则。

## 项目简介

这是一个 Web 应用项目。 
请优先理解现有代码结构,不要一上来就重构。

## 技术栈

- React / Next.js
- TypeScript
- Tailwind CSS
- pnpm

如果不确定,请先看 `package.json`、`README.md` 和现有代码,不要凭空猜。

## 常用命令

```bash
pnpm install
pnpm dev
pnpm lint
pnpm typecheck
pnpm test
pnpm build
``` 


当然,要强调的是这个文件不是必须的。 


你完全可以不编写配置这个文件,做出一堆有意思的东西。我自己其实就不太专门编写配置这个文件。


但随着开发过程的一步步深入,代码越来越复杂,为了让Agent 行为不偏离,请还记得这个东西,关键时刻它还是有点用处。 


整个Agents.md 其实分为三层。 


一层是全局路径,默认放在路径: 


~/.codex/AGENTS.md


还有一个是项目根目录,放在你当前的工作的项目根目录下。  


再细一点,就是放在项目中的子目录下。 


如果这三层中,存在着冲突,那会依照离Agent 修改的文件近的那个Agents.md来算。  


浏览器 


为什么要把浏览器单独拿出来讲,是因为我认为它的重要性被大大低估了。 


有了内置的浏览器之后,从此你可以做很多事情。 


比如我们编写一个网页之后,再也不用打开自己机器上的浏览器进行预览调试。  


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


直接点击文件名,然后右侧内置浏览器会帮我打开。然后如果我们看到哪里不爽了,不得劲了,直接使用评论模式,框出要修改的点,然后进行说明。


Codex 会自动把你的评论附带要修改的点同步到对话框中。 


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


这是你使用各种CLI无法体会到的交互丝滑感。  


甚至,OpenAI在Codex APP里专门放了一个Browser Use 插件。  


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。

它天然的就适配操作Codex APP里的内置浏览器。 可以帮你来和浏览器进行各种交互,比如截图、点击、测试网页端的应用等等。 


插件 


既然我们说到了Browser Use,那就不得不专门来说下插件了。


插件绝对是Codex APP里值得说的一大亮点。 


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


OpenAI 在这里打造了一大堆非常有用的插件。  


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


从Coding 领域的Huggingface、Vercel、Netlify再到设计以及工作中常用的生产力工具,Canvas、Figma、Gmail、Slack、Linear 因有尽有。 


现在懂为什么我觉得Codex APP就是新时代的All-IN-One产品了吧,因为它真的特么什么都能干。


配置的过程非常简单,找到你想要的插件,点击“+”号就行。 


我拿日常大家都会用的Gmail来举个简单的例子。 


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


安装绑定好Gmail 这个插件之后,我们就可以在Codex里用了。比如让它帮忙看看最近两天的新邮件。 


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


甚至也可以让它起草一份邮件,发给别人。  

OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


操作丝滑且速度巨快。 


同样的操作,也可以搭配在其他的插件上。你可以点进每个插件的详情,看看它支持什么样的操作。


比如,这是Notion的。 


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


可以很清楚的看到这个Notion 插件支持在Notion里进行文档、任务、数据库创建。还有各种其他的操作,比如会议、研究等等。 


还有一个非常牛逼的插件,在Codex里,名字是Computer Use。  


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


这绝对是Codex APP 能成为All-In-One的一大杀器。 


简单来说,配置了这个插件之后,Codex APP可以操作你电脑上的任意应用。比如你可以让它播放音乐里的歌单。 


之所以说它牛逼,是因为和我们过往看到的computer use 插件不同,Codex APP里的computer use 插件是在后台执行任务。


以前我们看到的很多computer use功能,在执行任务的时候,通常会直接把应用界面弹出来:鼠标在你屏幕上飞来飞去,窗口一个接一个打开,页面不断跳转。


你看着它操作,确实有一种AI 在替你用电脑的感觉,但问题也很明显:


它会占用你的屏幕、打断你的工作流,甚至有时候你还得在旁边盯着它,像看一个实习生第一次上手操作软件。 


而Codex APP里的computer use,它是在后台悄悄执行任务。你可以继续做自己的事情。它在另一边跑代码、读文件、改文档、执行命令、检查结果。


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


它更像是一个真正被塞进工作流里的后台工程助理。它会独立执行它的任务,不打扰你自己的工作流,只有在完成了之后,才会告诉你。 


我甚至在网上看到大佬们比较骚操作的一个玩法是:


用computer use 打开xcode、ios 模拟器这些进行测试,然后主聊天界面进行移动端应用开发。


这样你终于不用为xcode里那极其难用的AI功能而烦恼了。。。


自动化流程 


另一个非常好用的是自动化功能。  


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


如果每天都要做一些重复的事情,这个功能能帮你大忙了。 


点击创建一条新的自动化工作流; 


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


输入你的需求,选择项目路径,以及每日运行的时间。 


这个比较牛逼的是,


这个自动化虽然也是工作流性质的,但它完全不需要你去一个画布上拖拽那些节点。只需要你描述清楚你的需求是什么就行! 


就光这一点,比Dify、n8n这些强太多了。以前我看到这种画布上一条工作流,节点和节点之间各种连线,真的头都大了!! 


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


我自己有一条自动化流程是每天3点钟,让Agent 给我去用Codex内置的图像生成Skill 去批量生成图像。 


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。

这比自己一张张去生成,速度快多了!感觉一个是走路,另一个简直是坐火箭。


认领一只宠物 


现在你也可以在Codex APP里认领一只宠物了! 


这是OpenAI最新给Codex 加的功能。


打开你的Codex APP,找到Settings 进入到外观,也就是Appearance里,


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


OpenAI 内置了八种不同的电子宠物,可以任意选择。


当然,这不是最牛逼的。最牛逼的是它可以自己定制属于你自己的电子宠物。 


这一切都基于这个叫Hatch Pet的Skill。 


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。

最简单自己定制一个宠物的方法就是,拿着这个Skill,让Codex 帮你一步步照着实现就行。  

OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。

根据这个Skill的设定,Codex会启用Subagent来生成一整行的动画帧。  

OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


在生成好之后,可以从我们刚刚提到的过的Settings里的Appearance 看到,如果没有的话,刷新或者退出重启一下应用就能看到了。 


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


启用之后,会发现这个小小的电子宠物会浮在任何的应用界面之上。 


甚至,如果你有任务正在让Codex运行, 

OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


你会看到你的宠物这儿,会有一个任务进度的展示。真的不得不说,OpenAI 把Codex APP的交互视觉这块打磨的真的细节。  


我还在网上已经看到有大佬们专门做了一个各类宠物的收集网站。


OpenAI超级应用Codex 的纯小白入门指南,我奶奶看了都说好。


里面有各种各样非常有意思的宠物,大家可以多去看看。 


只能说,当年QQ宠物那么火是有原因的!人类真的天生就喜欢各种各样的小宠物,管它属性是电子的,还是AI的。


这个网站的链接我放在这儿啦: 


https://petdex.crafter.run/   


最后写点 


好啦,终于把这篇一直想写的Codex从0到1的指南写完了; 


我知道内容肯定还不够全面,还有一些遗漏,毕竟短短几千字的文章就想将整个Codex App 的使用方法技巧都涵盖完整,这基本是一个不可能的事儿。


但我还是希望这篇文章会有一些抛砖引玉的作用,


让正在看这篇文章的你,能够产生一种最原始的冲动,


“卧槽,这好有趣,让我下载来试试”。 


我自己一直有个暴论,


AI时代,再好、再详细的教程都比不上自己亲自动手做一遍。 


毕竟,


纸上得来终觉浅,绝知此事要躬行。 


我相信这句话无论在哪个时代,都是亘古不变的真理。 


那就让我们在这个特殊的时代,


尽情创造吧。 



文章来自于微信公众号 "BubbleBrain",作者 "BubbleBrain"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md