你以为是 AI 在干活,其实那个循环一直是你——一个 OpenAI 员工聊 loop engineering

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
你以为是 AI 在干活,其实那个循环一直是你——一个 OpenAI 员工聊 loop engineering
7077点击    2026-06-21 10:59

你以为是 AI 在干活,其实那个循环一直是你——一个 OpenAI 员工聊 loop engineering


Beyond the Prompt: What Loop Engineering Actually Means —— tevfik / OpenAI


01 那个循环,一直是你


:::


OpenAI 的 tevfik 写了篇关于 loop engineering 的文章,开头那句我读完顿了一下。


他说,他和 coding agent 协作,到现在大多还是同一个流程:我解释一个任务,等结果,审一遍,再发下一条指令。代码是 agent 写的,但我在后台还干着另一份活——我记着发生了什么、决定下一步做什么、判断这事到底完成没。


换句话说,我就是那个循环。


(说实话这已经是我这阵子聊的第六篇 loop 文了,大半是对前几篇的综合。但这篇有一个我之前没见人这么讲的角度,值得单拎出来——后面第三节。)


你以为是 AI 在干活,其实那个循环一直是你——一个 OpenAI 员工聊 loop engineering


今天:你坐在循环里手动跑每一圈;目标是让系统自己转


02 真正的转变:从交一步,到交一整件事


:::


tevfik 把 loop engineering 的核心,落在"委托"这两个字上。


到目前为止,我们能把一个任务交给 agent,但还得自己推着它走:检查结果、补上缺的上下文、选下一步、判断什么时候算完。


而一个设计好的循环,能让你把"持续推进"这件事本身交出去。你给系统一个结果(outcome),它来管中间步骤、调用该用的技能、检查自己的进度,做完了或卡住了才回来找你。


转变是从委托一个步骤,到委托持续的工作。


至于用什么去触发这个循环——目标驱动(跑到测试全绿)、定时(每十分钟看一眼)、还是事件驱动(CI 一挂就启动)——他说那只是执行模式,不是重点。重点是每一轮里那几个雷打不动的判断:目标是什么、现在的状态是什么、下一步做什么、怎么验、该继续还是停下还是叫人。


你以为是 AI 在干活,其实那个循环一直是你——一个 OpenAI 员工聊 loop engineering


从委托一个步骤,到委托整件事的持续推进——给系统结果,不是下一条指令


03 一整家公司,可以是一组循环


:::


这是全篇最让我眼前一亮的地方。


tevfik 让你想象开一家新的电商公司。但别把它想成"一个网站 + 几个挂在上面的 agent",而是想成——一门由循环组成的生意。


采购是一个循环:每天醒来,看库存、看销售速度、比供应商,决定要不要补货。低于阈值就在预算内下单,价格波动太大或供应商风险不明,就叫人。


营销是另一个循环。注意它的目标不是"投广告",而是"在预算内、把获客成本(CAC)压在目标线以下"。只要 CAC 没超、预算没花完,它就一直测、一直测量、一直重新分配投放。


客服、bug、产品分析,都能是循环。尤其那个产品分析循环,他说得很到位:它不只是报告数字,而是改文案、调漏斗、跑 A/B、再测一遍、留下更好的那个版本。


而每个循环,可以有不同的自主度:采购能自动补便宜低风险的货,营销只能在每日预算内花,客服能直接答常见问题但退款和愤怒客户要上交,产品分析能自己跑小实验、大改动还得人批。


一门生意,可以装着许多循环,每个有自己的目标、工具、记忆和上报规则。


你以为是 AI 在干活,其实那个循环一直是你——一个 OpenAI 员工聊 loop engineering


把公司想成一组循环:采购/营销/客服/bug/分析,各有各的自主度


04 但循环跑得比你懂得快


:::


听着很爽,但 tevfik 自己也按了几下刹车,而且按在对的地方。


一个 agent 写完代码、自己检查、自己宣布成功,不是一个可靠的循环。系统里必须有个东西,有权说"不"——有时是确定性的(测试挂了、类型检查报错、预算烧完),有时是另一个 agent 对着原始目标审查,高风险的改动,还是得人。这一点,和我前面几篇里反复出现的"验证才是难点",是同一句话。


他还点了一个我很在意的风险:循环产出代码的速度,可能比团队理解它的速度更快。这叫"理解力债"(comprehension debt)——系统在往前跑,你的心智模型在掉队。


答案不是把自主度拉满,而是匹配你检查能力和理解程度的那个自主度。


到这儿我得说两句保留。tevfik 是 OpenAI 员工,文章结尾顺势变成了一则 Codex 广告("你需要的只是 Codex,打开 app……"),这层滤镜得戴上。


更要紧的是那个"公司即循环"的图景——它很美,但也太整齐了。他举的每一个循环,恰好都有一个干净的数字裁判:CAC、库存、CI 绿灯。可一家真实公司里那些湿乎乎的部分——判断、关系、品味、那些没法量化的东西——是不循环的,而公司活下来还是死掉,偏偏常常就在那儿。能画成循环的,是 PPT;公司本身,不是。


你以为是 AI 在干活,其实那个循环一直是你——一个 OpenAI 员工聊 loop engineering


自主度的旋钮,只能拧到你的检查能力允许的那一格


05 从一个循环开始


:::


抛开那层广告,他最后那条上手建议很实在,我也认:别一上来就搭一个庞大的自主系统。


挑一件你重复在做、而且有清晰结果的小事。写下目标和停止条件,列出系统需要的状态,定义检查方式,然后盯着头几轮跑。某一步开始重复、或者需要花力气才学会的知识,就把它变成一个技能。等行为变得可预测了,再往上调自主度。


还有那个我会单独记住的角度:这里的"工程师"不必是软件工程师。它是那个对结果负责、并为它设计系统的人——可能在运营、研究、销售、客服、财务。他的工作往上挪了一级:少花时间发"下一条显而易见的指令",多花时间定义目标、边界、检查、记忆和上报路径。


但全篇我最想划下来的,是这一句——


完全的委托,应该减少的是你的注意力,不是你的责任。


系统可以拥有"持续干活"那一部分。但那个结果,始终是你的。


• 来源:tevfik (@aloglute, OpenAI) — Beyond the Prompt: What Loop Engineering Actually Means


文章来自于微信公众号 “深思SenseAI”,作者 “深思SenseAI”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0