作为腾讯 CodeBuddy 的第一位产品经理和现任 T12 级技术产品专家,我想分享近期对于 AI Coding 产品的深度思考和趋势洞察。本次分享不仅限于 AI Coding 本身,更希望提供一套通用的方法论——当你拿到任何 AI 产品命题时,应该如何系统性地思考和推进。
AI Coding 是“文生代码”赛道的代表,但这个领域远不止代码生成工具那么简单。在 AI 应用的大版图中,我们看到“文生文”(对话式 AI)、“文生应用”(轻量级应用生成)、“文生视频”(基于世界模型的创新)等多个方向。根据腾讯研究院发布的《AI Coding 非共识报告》,生成式 AI 应用分布中,51% 为“文生文”(写作、问答),47% 为“文生代码”,AI Coding 已经成为 AI 应用领域用户采用率最高的场景之一。每个方向都需要创意和创新,但产品经理不能只靠“胡思乱想”——现在对产品经理的要求比以往任何时候都更高。
本文将从四个维度展开:顶层思考(战略定位)、方法论(GENIUS AI 框架)、价值主张(Spec Coding 理念)以及未来趋势(AI Coding 演进)。

重新定义 AI Coding
在开始任何 AI 产品之前,必须回答一个本质问题:你的产品到底要解决什么问题?是简单的代码生成工具?是低代码/无代码平台的延伸?还是企业内的个人助手?
通过深度思辨,我们认为 AI Coding 是一个超越软件编程的范式革命。它不是替代低代码工具,而是重塑编码范式本身——从“人为主、机器为辅”转变为“机器为主、人做最后确认”。这是一场从辅助编码到自主编码的演进,让 AI 深度参与软件工程的全生命周期,而不仅仅是代码补全。
市场调研:数据驱动的战略判断
在做任何 AI 产品时,我的思考过程是:先看数据、再看行业、最后看用户群体。通过国内外诸多行业报告,我们发现:
这些数据支撑了一个关键判断:软件工程的 AI 化不是工具层面的优化,而是一场编程范式的革命。AI 代码工具已成为近期市场热点,由于大模型技术进步和智能体驱动,2024 年至今 AI 代码在全球范围进入爆发期,融资总额超过 10 亿美元。
竞品分析:从全球视野看演进路径
通过 Landscape 工具分析全球竞品,我们发现 AI Coding 已经形成清晰的演进层级:
L1 聊天机器人:GitHub Copilot 等代码补全工具,具有对话语言的 AI 聊天机器人;
L2 推理者:引入领域知识工程,具备人类水平的问题解决能力;
L3 代理者:多 Agent 角色协作(需求分析、架构设计、代码生成、测试),可以采取行动的系统;
L4 创新者:AI 团队/组织能力,可协助发明的 AI 创新者;
L5 组织者:AI 自适应创新与交付,能够完成组织工作的人工智能。
演进趋势预测:
随着模型和智能体技术进步,精度更高、上下文处理能力更强的工具将重塑开发行为。让开发者专注软件开发过程中的高阶任务,AI 则接管常规开发工作,软件工程即将迎来全新范式。
我们的目标是打造 L3 到 L4 层级的能力——一个由多个智能体协作的自主编码团队,甚至是能够成立程序员及不同角色的自主 AI 编码团队,而不仅仅是一个单点工具。
成本与营收:PLG 模式的可行性
AI 产品最大的成本在于模型调用。以 Cursor 为例,虽然 ARR 达到 5 亿美元,但因依赖第三方模型(如 Claude),边际成本居高不下。从主要参与者看,美国公司多采取 PLG 模式,ARR 均超过 1 亿美元,且付费同比增速几倍到几十倍;中国公司还在市场推广阶段。产品经理必须思考:
定价策略的核心原则:
1. 透明性:明确列出每档订阅对应的功能及 AI 模型调用额度,易理解、可控,避免隐藏收费;
2. 可预测性:多数开发者偏好包月/包年订阅 + 合理用量上限,超限后可灵活加购或降速,而不是纯按 token 计价(非技术用户易有焦虑);
3. 渐进版本:提供免费版/试用、入门版、专业版、团队/企业定制等分级套餐,不同用户场景差异化激励付费;
4. 成本锚定:套餐设计需考虑单次模型调用成本、云算力费用、推理复杂度波动,避免盲目定“无限制”导致亏损;
5. 差异化功能:企业版可引入协作/权限管理、私有部署、模型定制、数据安全等附加功能,提升溢价空间;
我们的判断是:当算力趋于便宜、国产模型越来越好时,边际效应会显著提升,企业级 AI Coding 将迎来爆发期。
为了便于记忆和实践,我总结了一个 GENIUS AI 框架(不是 GENUS),适用于任何 AI 产品的设计与落地:

G - Generation Quality(生成质量)
核心问题:AI 生成的内容质量如何保证?
AI 一定会带来幻觉,这是模型的本质特性,只能降低而无法消除。因此,生成质量是第一要务,也是 GENIUS 框架的首要核心。基于业界最权威的质量评估标准,我们建立了科学化的代码生成质量保障体系。
Pass@k 指标通过严格的单元测试验证生成代码的功能正确性,是评估 AI 代码生成模型的黄金标准:
SWE-bench 评测:基于真实 GitHub 问题的修复能力测试,验证模型在实际工程场景中的表现
场景化评测:模型的通用能力不等于场景能力。例如,电商场景的“模特换衣”需要专门的评测集来验证效果
正负反馈系统:建立用户反馈回路,持续监控生成质量并优化模型
关键洞察:产品经理必须与技术团队共同制定评测标准,生成质量是用户留存的决定性因素。
E - Efficiency Enhancement(效率提升)
核心问题:AI 如何真正提升效率,而不仅仅是“看起来酷炫”?
AI 的本质是效率工具,尤其在企业场景中。我们对腾讯内部开发者进行了 8 小时工作时间分析,发现:
基于此,我们在腾讯内部落地 CodeBuddy IDE 和 CodeBuddy 插件,并测算出 44% 的效率提升和缺陷率下降。这个数据不仅说服了内部团队,也成为对外销售的核心价值主张。
中国企业的特殊性:真正买单的是中层管理者,他们对“看板”和“可控性”的需求远高于个人用户。因此,企业级产品必须提供效率指标的可视化,而不仅仅是个性化配置,企业是效率提升的最终战场。
N - Neural Innovation(AI 驱动创新)
核心问题:AI 能带来哪些之前无法实现的创新功能?
产品经理必须跳出“工具优化”的思维,用 AI 做之前做不到、现在能做到的事情。我总结了 A.I.B.O.R.E. 原则(AI-driven Innovation 的完整框架):
CodeBuddy IDE 的每个功能都源于用户痛点,而不是“AI 能做什么就做什么”。
I - Intelligent Optimization(智能优化)
核心问题:如何实现全方位的性能和流程优化?
腾讯内部基于 CodeBuddy 完成了研发流程的智能化优化转型,覆盖了从需求规划到部署的全生命周期:
规划阶段:
设计阶段:
开发阶段:
测试与部署:
CodeBuddy 通过 MCP 协议调用企业内部工具,包括 TAPD(需求管理)、腾讯设计、CNB、TCA、腾讯地图知识引擎、CloudStudio 等,实现了真正的全流程智能化。
U - Unified Security(统一安全)
核心问题:如何保障 AI 生成内容的安全性?
AI 的不可解释性和幻觉问题带来安全挑战。企业级用户(尤其是银行、政府)绝不允许数据流出境外,这是私有化部署的核心驱动力。
我们的策略是建立一体化的安全保障和治理体系:
1. 传统工具预审:用静态分析工具扫描 AI 生成的代码,输出问题报告;
2. 特征规则判定:由人类专家编写规则,识别高风险模式;
3. AI 辅助修复:让 AI 根据报告进行针对性修复。
这种“人机协作”的安全机制既保证了合规性,又充分利用了 AI 的修复能力。
S - Smart Evolution(智能进化)
核心问题:如何让产品持续进化而不是一潭死水?
AI 产品的生命周期与传统软件截然不同。我们最初规划了一年半的路线图,结果半年就全部推翻——因为体验成为唯一的核心指标。
智能进化包括四个核心机制:
1. 持续学习循环:系统不断从新数据中学习,通过不断的反馈和自我调整,实现知识和能力的动态更新。每个用户的小反馈都可能成为巨大的粘性来源;
2. 自我改进算法:通过自身性能评估,系统能够自主发现并改进自身的算法结构,实现类“自举”的性能提升;
3. 递归优化机制:利用递归原理,自动在多个层级(如策略、元策略、元元策略等)进行性能优化,加速系统进化;
4. 自适应代码生成:建立评测系统,快速切换和对比不同模型(如 GPT-5 vs Claude 3.7)。系统根据自身目标和环境变化,自动生成、测试并集成最优代码片段,提高适应性和创造力。
Agentic Workflow:终极目标是让 AI 自己决定工作流编排,而不是人类预设规则。
关键洞察:做 AI 产品没有固定的路线图,只有持续的体验优化。
“氛围编程”的局限性
最近业界流行“Vibe Coding”(氛围编程),即用自然语言直接生成应用。这听起来很美好,但实际操作中存在明显问题:
我们测试了腾讯 CODING 官网的生成效果——它有动态地球、复杂动画,绝不是一句话能描述清楚的。问题的本质在于:自然语言是多模态的,包括文字、设计稿、已有代码等,而不仅仅是用户的口头描述。
Spec Coding:规约即代码
经过深度思考,我们提出了 Spec Coding(规约编程)的理念:
所有的业务逻辑都可以抽象为 Spec(规约),而这个 Spec 不仅给人看,更要给 AI 理解。
这与 AWS 高管在 2024 年 5 月提出的理念不谋而合。我们的实践路径是一个严谨的三阶段流程——Vibe Plan → Vibe Design → Vibe Coding:
为产品需求创建详细的问题蓝图,让 AI 先生成技术架构和产品规划。系统将简短提示转化为完整用户故事,涵盖所有相关操作场景,每个故事附带 EARS 语法(WHEN/IF/THEN)编写的验收标准,明确边界条件和异常处理。
精准理解需求,将创意和现有的产品设计变成功能性原型、网页应用程序和交互式用户界面。系统分析现有代码库与新建需求,输出数据流图、TypeScript 接口、数据库 Schema 及 API 端点设计,消除需求歧义。从设计稿中提取设计规范和 UI 组件要求。
自主完成代码开发,完成代码工程实现。基于设计稿生成带依赖关系的任务列表,每个任务包含单元测试、移动端适配、无障碍支持等子项,开发者可逐步触发任务,实时审计代码差异与日志。按照 Spec 逐一实现功能模块。
通过 MCP 协议连接腾讯云,自动发布上线。
核心优势:
案例:我们为合作伙伴开发了一个旅游电商网站,通过 Spec Coding 模式,AI 自动生成了前后端架构、技术选型文档,最后一键部署到腾讯云。整个过程中,用户只需要确认 Spec,无需关心底层实现。
Claude Code 的启示
Claude Code(Anthropic 推出的 AI 编程终端工具)验证了我们的方向:它让 AI 先生成 Plan(计划),再拆解成多个 Task(任务),然后在后台默默执行。用户只需要在最后验收结果,而不用盯着整个过程。
这种模式的本质是 Agentic Workflow——由 AI 智能体决定工作流,而不是人类预设的规则引擎。未来,AI Coding 将从“规则驱动”进化为“智能驱动”。
AI Coding 的金字塔结构
我们认为,AI Coding 市场将呈现金字塔分层,这也是产品布局的核心策略:

智能体团队的未来
我们的终极愿景是 AI Team——一个由多个智能体组成的编码团队:
这些 Agent 不是各自为战,而是通过智能体康威定律(Agent 的协作架构决定系统架构)有机协作。未来的软件开发,将是“人监督 Agent 团队”而不是“人直接写代码”。
商业模式的演进
AI Coding 产品必须平衡成本与营收,当前的主流模式包括:
关键洞察:模型太贵是当前最大的挑战。但我们预测:
届时,AI Coding 将从“烧钱工具”变为“盈利产品”。
多模态与海外市场策略
产品经理必须思考:
以 Manus 为例,它先在海外验证模式,再用数据反哺国内模型,最终实现平替。这是当前环境下的健康策略。
腾讯 CodeBuddy 是我们基于上述方法论打造的产品,是串联需求规划/设计/开发/调试/部署的基座。核心特性包括:
1. 需求到部署的全链路:从需求规划 → 设计 → 开发 → 调试 → 部署,形成闭环;
2. Spec Coding 理念:通过规约文档驱动多智能体协作;
3. MCP 协议支持:连接腾讯云及企业内部工具(TAPD、腾讯设计、CNB、TCA、腾讯地图知识引擎、CloudStudio);
4. 混合模型策略:海外版接入 Claude 3.7 / GPT-5,国内版使用混元 / DeepSeek;
5. 私有化部署能力:满足企业安全合规要求。
效果数据(基于腾讯内部实践):
AI 时代的产品经理,不能只靠“胡思乱想”。我们需要:
1. 顶层战略思考:明确产品是工具优化还是范式革命;
2. 系统化方法论:GENIUS AI 框架是可复用的思考工具;
3. 价值主张清晰:从 Vibe Coding 进化到 Spec Coding;
4. 拥抱模型演进:AI 产品没有固定路线图,只有持续迭代;
5. 关注商业闭环:成本、营收、用户留存缺一不可;
AI Coding 不仅是代码生成工具,而是软件工程的范式革命。我们正站在这场革命的起点,让我们一起见证并推动这场变革。
【作者简介】汪晟杰,腾讯云开发者 AI 产品负责人、CodeBuddy 首席产品经理、腾讯云产品专家。负责腾讯云开发者 CodeBuddy 产品,曾负责过 Cloud Studio、Coding Devops 等产品,曾任 Teambition、Autodesk BIM、SuccessFactors HCM、Sybase 数据库、PowerDesigner 等产品的负责人和核心开发,在软件架构设计、产品管理和项目工程管理、团队敏捷、AI 研发提效等方面拥有丰富的行业经验。
本文为汪晟杰在 2025 全球产品经理大会分享。
文章来自于“CSDN”,作者 “汪晟杰”。
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。
项目地址:https://github.com/mannaandpoem/OpenManus
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT