在万圣节的前一晚上10月30日,一位运营朋友跟我说了个点子万圣节头像生成器,然后大概给我分析了下整体思路,于是我用扣子Coze平台(coze.cn)搭建了一个AI智能体整个过程花了一个小时就搞定了!我一键部署到了我的AI小程序上,第二天随便发了下小程序访问页面数据直接增长1000%,接下来我来拆解下这个全过程。
不了解扣子Coze平台可以这篇《教你 5 分钟搭建 AI 应用(无需编码)》
10月30日的晚上收到了朋友发来的消息
然后我整体体验了一下需要收集用户的头像、性别、绘画风格、万圣节元素,然后生成万圣节头像。
当我体验后,感觉效果挺不错,并且这位朋友还给我分析了整个实现的思路以及AI绘画的提示词。
我基于这个思路做了一些交互上的优化,比如她的案例是收集用户头像,然后让用户去选择性别和绘画风格以及元素,这种形式属于表单收集的方式,但是AI智能体是对话的形式,如果在对话形式中去收集这么多信息,对于用户来说非常麻烦,所以我改为只需要用户发送一个照片,性别从头像里面提取,然后绘画风格和元素进行随机。
这样做有两个好处:
外层逻辑确认后就开始搭建整个工作流,工作流非常简单,只有5个节点。
第一个消息节点
输出随机风格和元素+加载动画,让用户有期待让用户更容易等下去。
第二个「图片理解」插件节点
提取用户上传的照片特征为了后续生成图片提示词,使用的是「阶跃星辰」的视觉理解大模型,识别图片速度很快和准确度很高。
视觉理解大模型:https://platform.stepfun.com/docs/guide/image_chat
promptText:图片是一个人的照片,请你描述ta的肤色、头发、眼睛、鼻子、嘴巴、脸型、面部特征、国籍或种族特征、身高、体型、年龄、表情、妆容、眼镜、耳饰、动作、服饰特征、配饰。
输出内容参考案例格式:性别:女,脸型:瓜子脸,体型:微胖,年龄:40岁左右,面貌:亚洲女性,肤色:浅色 外貌:一头长长的黑发,戴着一顶黑色的报童帽 表情:很平静,嘴角微微上扬 妆容:化了淡妆 动作:伸出手轻轻抚摸马的鼻子 服饰:穿黄色长袖衬衫、深色长裤,斜挎黑色Champion品牌挎包
第三个「文本处理」节点
主要是组装AI绘画生成图片的提示词,结合随机的风格+元素+图片理解后的人物特征。
第四个「图片生成」插件节点
将上个组装好的提示词给到AI绘画进行图片生成,这里使用「阶跃星辰」的文生图大模型,生成图片速度很快,而且质量挺不错的。
文生图模型:https://platform.stepfun.com/docs/guide/image_generate
第五个消息节点
输出生成图片的结果显示,最后提示用户每次生成不一样,引导用户再次生成。
这个AI智能体搭建完成后,我们团队搭建了一套接入扣子API的小程序,只需要在后台通过BotId就能发布智能体到我们的AI小程序里面,无需开发和发版本。
扣子API:https://www.coze.cn/open
这次追热点让我想到了最近看的一本书《上瘾》里面提到的公式集合这个案例来看:
触发(节日热点引发)+行动(上传头像生成)+多变的酬赏(随机的组合结果)+投入(想再看看别的组合)=上瘾
还有一点,正如《我能写什么内容?》文中提到过一个观点:
我认为当你想做一个产品的时候,很多功能不一定要通过写代码的方式去解决,可以用智能体搭建平台的插件和工作流去解决。
用代码开发功能可能都需要一天时间才能完成,而在平台智能体搭建一个小时就搞定了,然后再暴露API出来就可以很快的完成这个产品了。
我认为AI智能体+AI小程序=MVP(最小可行性产品)王炸组合,它可以有效降低成本的试错,当你没有赚钱的时候省钱才是硬道理。
文章来自于微信公众号“码个蛋”,作者“陈宇明”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0