做AI产品两年,我得出的实操经验

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
做AI产品两年,我得出的实操经验
7631点击    2025-04-15 15:39

前段时间我去 QCon 北京全球软件大会分享了一个专题:


AI 时代的新范式:如何构建 AI 产品?


观众反响特别好,想着要不把分享的内容公开出来,所以整理了这篇文章。本篇内容是对我过去两年时间,做了无数个 AI 产品 demo 的一个阶段性的总结,主要聚焦这三个方面的经验:


为什么 AI 产品这么难做?


提示词工程被极大低估


AI 产品团队如何构建


做AI产品两年,我得出的实操经验


做AI产品两年,我得出的实操经验



谨小认知,仅供参考。写给所有 AI 路上的朋友们。


简单自我介绍,我是 ONE2X AI 全栈工程师,AI 视频剪辑效果负责人。负责 ONE2X 的 Medeo(AI 视频剪辑工具)的视频自动化制作工作流全流程搭建、工具产品的设计及创新 AI 应用场景探索。


22 年 11 月 GPT 刚出后,就开始尝试做各种各样的 AI 产品,23 年年中毕设做的是 AI 情感陪伴、暑假在做企业知识库 Chatbot 智能客服、23 年年底到 24 年年中在大厂做低代码编排 AI 工具和智能医疗、

24 年年中到现在在 AI 创业工作做 AI 自动剪辑。途中还做过大大小小的 project,包括 AI 写遗嘱、AI Agent 做动画等等……也算是积累了很多实操经验了。


做AI产品两年,我得出的实操经验


为什么 AI 产品这么难做?


让我们轻松的聊聊 AI 与产品


做AI产品两年,我得出的实操经验


A Joke:先从一个笑话开始,你能看懂吗?


做AI产品两年,我得出的实操经验


如果你知道每一条背后的原因,那么恭喜你上道了!


所以为什么 AI 产品这么难做?


AI 时代的产品和传统的产品不一样的是什么?


做AI产品两年,我得出的实操经验


做AI产品两年,我得出的实操经验



做AI产品两年,我得出的实操经验


基础流程是什么?


所有流程可枚举全部已知


做AI产品两年,我得出的实操经验


流程的自动化的定义是什么,什么流程可以被 SOP 化,就可以做成产品。那 AI 产品,首先肯定是产品,其次它还会完成以前人类才能完成的某种任务。这个任务如果需要 AI 完成,那就发生了范式转移


做AI产品两年,我得出的实操经验


做AI产品两年,我得出的实操经验


你得帮用户做出来这个任务。

做AI产品两年,我得出的实操经验


举个例子,Cursor


做AI产品两年,我得出的实操经验


Cursor 是我认为 2024 年最好的 AI 产品


它解决了三端关系。


做AI产品两年,我得出的实操经验



做AI产品两年,我得出的实操经验



做AI产品两年,我得出的实操经验


做AI产品两年,我得出的实操经验



Cursor Team 解决了如下问题:


  • 任务分级:根据给 AI 的执行权限不同的不同可控颗粒度的任务
  • 帮用户完成了任务:每个任务 / 功能在用户还没来之前就已知该任务如何完成(Coding,且无论语言,无论项目)
  • 交互方式:每个任务 / 功能与人协同的人机交互方式


做AI产品两年,我得出的实操经验


提示词工程被极大低估


认知一:Prompt 也是代码,所以要测试。


做AI产品两年,我得出的实操经验



尊重 prompt,同代码享受同等权利,需要 git diff


需要对 prompt 单独进行版本管理


Prompt 也是代码,但有区别?


做AI产品两年,我得出的实操经验


LLM 和函数很类似,它们都是实现某个“计算”的节点。


但它能提供比传统函数能做的更多的事情,提供“智慧类型”计算。


它可以接受非结构化的数据,经过推理,输出非结构化 / 结构化的数据。


Prompt 也是代码,如何测试……?


做AI产品两年,我得出的实操经验


函数,我们在运行前,通过 IDE 或者单测即可完成功能正确性校验


LLM 怎么测试呢?


做AI产品两年,我得出的实操经验


如果你只是让它完成传统函数的任务,也很好测试,可以使用 function call 加上单测。


比如加法任务,只让它输出结果,可以做正确性校验


但大概率你让 LLM 做的事情是非结构化的。


做AI产品两年,我得出的实操经验


所以 Prompt 的好坏怎么测?


一、格式正确性


使用 function call / Json mode 确保输出格式不出错


任何 LLM 相关的调用,都使用 pydantic 严格校验


做AI产品两年,我得出的实操经验


二、功能 Baseline


输出内容,通过 batch evaluation 进行校验。


做AI产品两年,我得出的实操经验


三、人工评测结果


做AI产品两年,我得出的实操经验


模型的上限,还是取决于人对于结果的要求有多高。


Baseline 只是保证功能正常运行,上限在于“人”


四、放权


模型可能比你想象中的更强,不要限制它的思考方向,思考内容,knowhow,把 prompt 当成一种容器,你只是为模型提供必要的信息,而不是教它如何思考。


总结一下,Prompt 也是代码,所以要测试。


做AI产品两年,我得出的实操经验


认知二:AI 产品就是基于


“给模型提供上下文”出发开始的


首先,不要发现模型做不对任务,就觉得它有问题。接下来以 Text2SQL 为例。

做AI产品两年,我得出的实操经验


做产品的人需要知道这个任务完成本身需要什么上下文,并且努力为模型提供出来。你并不需要那么多 Prompt 技巧,而是努力为模型提供更多的“必要信息”。


做AI产品两年,我得出的实操经验



你会发现跟人很像。把它当成实习生,你也需要给实习生上下文。


做AI产品两年,我得出的实操经验



对于大部分业务场景而言,你不需要“神级 Prompt”(如下图),你需要的是对业务的熟悉程度。把业务 knowhow 沉淀成 Prompt。


做AI产品两年,我得出的实操经验


一件事情上下文到底是啥?寻找 root 变量的过程。


做AI产品两年,我得出的实操经验


认知三:如何面向未来进行设计,避免被模型更新所冲击?


做AI产品两年,我得出的实操经验



Manus 画的 AI Model Timeline


模型每天都在更新,我怎么设计提示词和架构?


模型更新之后,提示词会不会失效了呢?


每个模型有什么不同的脾性?


模型越来越智能,未来还需要复杂的提示词吗?


……


Slow Down,别焦虑。


打不过就加入:用最好的模型的 API 创建应用。除非自己顺手能训练模型。


Flow Engineer:什么时候拆分任务,什么时候合并任务?


做AI产品两年,我得出的实操经验


我的体感(纯经验,没有数据支撑,knowledge 截至 20250321)


如果不知道用啥,就先试试 Claude


通用类型任务:Claude-3.5-Sonnet / Claude-3.7-Sonnet


强推理任务:Claude / Gemini 2.5 Pro


中文语言任务:DeepSeek


图片多模态任务:Claude / Gemini / 阶跃


视频多模态任务:Gemini


简单任务:Gemini Flash (省钱)


中文 B 端本地任务:Qwen


可能的 Bad Case:


DeepSeek 指令遵循弱


Gemini flash 幻觉严重


……


做AI产品两年,我得出的实操经验



当然 GPT4o 生图很好!


Flow Engineer


“Flow Engineering” 是一个最近越来越受欢迎的术语。它第一次被提及作为术语是在 CodiumAI 关于 AlphaCodium 的论文中,他们在论文中使用流工程来产生关于编码问题的最新结果。

推荐看一遍 Langgraph 的 ipynb examples


做AI产品两年,我得出的实操经验


Flow 强调的是用整体系统设计去完成任务


多节点设计,每个节点去实现单一任务。


单一任务简单可靠,一定在 LLM 可实现范围之内。


当一个任务太难的时候,就拆成两个任务去做。


做AI产品两年,我得出的实操经验


好像有点像 Dify/Coze 的意思?


对,但不全对。不要忘了传统代码的能效。


做AI产品两年,我得出的实操经验


你并不需要全部节点都是 LLM,你也可以组合 function 和 LLM。


所以推荐使用 Dify/Coze 验证原型,写代码用 LangGraph 搭建实际应用。


当模型更新后,就合并任务。


在设计 Flow 的时候,不需要拘泥于优化一个节点的 LLM Prompt。


因为模型推理能力不够,大概率三个月后就够了。不需要过度设计。


用几个小的 task 拆解后完成任务,等模型更新后把整个大任务交给新的模型。


做AI产品两年,我得出的实操经验


总结一下,Prompt Engineer 的认知


AI 产品团队如何构建


认知一,首先你得成为“创作者”


Cursor 很厉害,也最先落地:


懂 AI 的本来就是程序员。团队懂 Coding。


团队知道如何拆解任务,每一个任务如何写 Prompt 的 knowhow,团队很清楚。


模型 Coding 能力已经阶跃(Claude3.5) 文本模态 Coding 任务是最擅长的。但还有如此多的业务场景,等着创造


做AI产品两年,我得出的实操经验


认知二,快速做出 Demo 最重要


AI 产品最后长成什么样子,已经是无人定义清楚的事情了。


只有当把所有的要素及其,做出一个 demo,你才知道这是什么感觉的产品。


做AI产品两年,我得出的实操经验


我做的大大小小的 demo


认知三,产品 / 开发的界限模糊


以前的开发模式,是产品、研发。现在可能变成了一个紧密的团队一起调 prompt。


做AI产品两年,我得出的实操经验



做AI产品两年,我得出的实操经验


这是我在公司内部做的后台,支持任何人追溯每次 LLM 调用,并且重新调试 prompt。


做AI产品两年,我得出的实操经验


最好是产品 / 全栈能自己调试 prompt。


AI 产品需要紧密配合的团队,一起设计架构。


Prompt 需要沟通能力,业务能力。代码需要研发能力。


Prompt + 代码是团队之间才能做的事情。


一起创作。


写在最后


我们正在见证新范式的出现,很幸运。


做AI产品两年,我得出的实操经验


有了 AI,才有了年轻人的机会,所以我非常感激能在这个时代能有这么多有意思的事情。


谨小认知,仅供参考。


文章来自微信公众号 “ InfoQ ”,作者 宁晨然


做AI产品两年,我得出的实操经验


AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
OpenManus

【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。

项目地址:https://github.com/mannaandpoem/OpenManus


3
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

4
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

5
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

6
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0