深度拆解产品：一款「可控」的AI生图工具该怎么设计?

6081点击 2025-07-05 19:18

Hi，周末早上好。

我是洛小山，和你一起深度拆解有意思的 AI 产品。

这篇文章，我会从几个真实的案例出发，深度拆解一下星流这款产品，以及聊聊：

为什么我认为「可控」才是真正的生产力？

星流到底如何做到「可控」？

以及，「可控性」为什么会是下一阶段 AIGC 的竞争关键?

全文大约 6500 字，完整阅读预计 15 分钟。

熟悉我的朋友们都知道，为了保持公众号头图风格一致，我一直在用 Lovart 生图。

下图是我在使用 Lovart 的工程界面。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

但认真讲，我用在 Lovart 的图像的掌控力是很弱的，最大的问题是英文不好，只能靠机翻。

机翻的痛苦大家都懂：同一种含义，不同的单词，生出来的效果千差万别，耗费了我不少算力和时间。

所以，Lovart 推出国内版「星流」之后，我立刻转投了它的怀抱。

用过一阵后，我逐渐觉得：

星流不仅仅只是 Lovart 的国内版，做了基本的语言优化，更是在产品交互层面做了深入到极致的设计。

我甚至想提一个暴论：

星流真正成为了 AIGC 创作者的生产力工具，是 AI 生图界的 Figma。

01｜一些实用的 Case

我用过不少 AI 生图工具，有个特别头疼的场景是，如果我需要基于某张图片裁剪成多种尺寸，常规的做法往往是：

1. 手动裁剪掉一部分，但很可能破坏画面构图；

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

2. 重新输入提示词重新生成，或者通过 Sora 进行图生图，但如果有多种格式，就需要提多条需求，如果你没法使用 Sora，许多产品还得面对完全随机、风格和细节难以复现的结果；

3. 使用其他 AI 工具「扩图」，但常常引入奇怪的细节，甚至完全偏离了原来的设计意图。

比如下图，添加的细节就偏离原图的设计

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

或者 PS 的内容识别，直接改坏了…

而 PS 的 AI 功能，国内正版无法使用…

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

无论哪种方式，都存在不小的效率损耗和不可控的风险。

但星流在这个方面，就完全刷新了我的体验。

比如下面这个「精灵」的插画需求：

我要在原有生成图片的基础上，扩展出三张尺寸不同但主题一致的插画。

三张图片分别为方形（1024×1024）、竖幅（1024×1536）和横幅（1536×1024），以适应不同平台与展示场景。

传统方式下，这意味着我可能要反复重新生成、裁剪、尝试扩展，花费不少精力。

而在星流中，我只需要：

1. 先上传这张图，然后简单地输入我的要求，明确风格、角色特征与场景细节。

2. 星流会自动理解我的需求，保持原图设计风格、角色与色调高度一致，并智能补充背景、细节，不需要我费力重新调整 Prompt 或者再重新生成。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

可以看到，星流不仅做到了相对完美的构图扩展和细节延续，而且生成的效果惊人的统一，生成不同尺寸的图便于我直接发布。

以及：

人物形象与场景细节的一致性非常高；

色调、光线、质感几乎完美延续；

不会出现无关元素，也没有突兀感。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

除了上面的 Case 以外，还有对海报的多尺寸调整，颜色、排版调整；

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

保持角色主体统一，进行更多场景泛化的…

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

可见：星流的强大之处，是它真正把 AI 生图变成了可以稳定复用、高效批量生产的创作流程，而不仅仅停留在做出好看的图片。

因为，做出好看的图片，在 Liblib 已经基本实现了。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

接下来，我们再深入聊聊，为什么我觉得「可控」才是真正的生产力，以及星流究竟是如何做到如此「可控」的？

02｜为什么说可控才是生产力？

你可能会觉得我会不会太纠结于「可控」这个词了，毕竟市面上的 AI 工具不少，随手输入一句话，就能生成一张挺不错的图，为什么非得强调「可控」不可呢？

因为在长期使用 AI 生图工具时，我逐渐觉得：

一次惊艳的生成不能称之真正的生产力。

真正的生产力，是要确保（几乎）每次结果稳定、调整成本低、效果可复制。

所谓「可控」，具体来说就是以下四点：

① 结果可预期，不能是随机抽卡。

使用 AI 生图最痛苦的经历莫过于不断重抽炼丹：

同一条提示词，每次生成的结果完全不同；

设计师的需求是明确而具体的，但随机生成的结果往往无法预期。

而「可控」意味着，工具能够稳定地输出用户预期中的风格、构图、色彩与细节，避免大量的反复试错与算力浪费。

对真实的创作者而言，稳定可复现的结果，才是真正有价值的。

这是汗青老师设计的 AI 歌手 Yuri尤栗，他在评论区里曾提到，为了做好这支视频，进行了 1.3 万次的抽卡…

虽然抽卡的原因不尽相同，但如果产物能够稳定输出，能大幅降低抽卡次数，那就能大幅提升效率。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

② 修改成本低，不用重头再来

如果每一次调整细节，都必须重新输入提示词、重新生成一整张图片，那生产效率就会大大降低。

我们真正需要的是能像 Photoshop 或者 Figma 一样，轻松进行局部调整的能力：

尺寸不合适，一键切换；

色彩风格不满意，一键调整；

局部细节不够好，可以精准修改。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

「可控」意味着，我们能以最低的成本进行调整与修改，而不是推倒重来。

③ 批量复用效率高，降低边际成本

如果每一张图片都是一次全新的随机生成，意味着当我需要一系列的视觉资产时，每张图片都要花费相同的精力与成本，这显然不可持续。

真正的生产场景是：

一次确定品牌视觉；

一次确定公众号头图风格；

一次确定插画模板；

此后，能持续以极低的边际成本批量生成同一风格的资产，这才是实际生产需求。

而「可控」正是确保了“规模化复用”成为可能。

比如，我一直在用的：

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

④ 上手简单，但也能满足高手需求

很多 AI 生图工具，要么新手难以掌控，要么高手无法精细调整，总难以兼顾两端。

真正的生产力工具，必须同时满足：

新手用自然语言简单输入即可得到理想结果；

高手用精细参数（如采样器、步数、CFG 等）实现更高级的掌控能力。

星流熟悉掌握 AI 生图技巧的设计师也提供了相对充分的自由度，

下面是我设定 1 - 16 个不同采样步数后生成的图。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

可见，「可控」不是只有一种交互方式，而是给用户提供了多种不同层次的交互途径，让所有人都能在同一款产品中找到适合自己的生产方式。

总结一下，对用户而言，真正的生产力来自于：

让每次结果都符合预期，避免多次重复抽卡；

让每次迭代都高效，避免推倒重来重复劳动；

让每次复用都简单，避免全新挑战重复开发；

让每类用户都受益，避免只服务单一群体。

这四点，就是我所理解的，为什么说只有「可控」才是真正的生产力。

有了明确的定义，我们接下来再详细拆解星流的产品设计，看看它是如何具体实现这些「可控」能力的。

03｜星流到底怎么做到「可控」？

前面讲了很多对「可控」的理解，但再好的概念，如果产品落不了地，也都是空谈。

我之所以这么认可星流，就是因为它的设计思路非常明确：将抽象的「可控」理念，实实在在地体现在产品界面的每一个细节当中。

具体来说，星流在产品设计层面，真正实现了以下三点：

① LUI（语言交互）和 GUI（图形交互）的深度融合

很多 AI 工具，要么纯粹靠 Prompt 生成，要么完全依赖 GUI 控件。

但星流厉害在于，它同时提供了两条完整交互路径，供不同类型的用户灵活选择。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

GUI 路径：左侧提供类似 Photoshop 的属性面板，用户可以精细调整：

采样器（Sampler）

生成步数（Steps）

提示词权重（CFG Scale）

Clip Skip 等细节

参数专业用户可以精准控制生成的每一个细节，达到精细调整效果。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

LUI 路径：右侧提供类似 ChatGPT 的对话式语言交互框，用户可以简单粗暴地表达需求：

一键改变配色风格；

一键调整构图比例；

一键切换整体风格模板。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

两种路径相互融合，能让用户根据需求自由切换：

对于新手，语言交互足够简单易用；

对于专业用户，图形参数面板提供了足够的控制空间；

对于熟练用户，两种方式配合使用，实现效率与精细控制的最佳平衡。

这种兼容性强的设计方式，是星流交互设计高明之处。

② Prompt 可结构化：多轮交互、模块拆解

星流采用了分步引导的结构化交互：

星流不完全依赖用户的表达（LUI），而是在使用上，以明确的单选按钮或选项卡逐步引导；

用户只需通过简单选择卡片或按钮，逐步确认自己想要的风格、尺寸、布局、色调；

每一次选择，都相当于构建了一段结构化的 Prompt 片段；

最终，多个片段组成一个完整清晰的设计脚本，让 AI 模型更加精准理解用户的设计意图。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

这种结构化的 Prompt 方式，彻底告别了传统 Prompt 生图中随机抽盲盒的痛苦：把用户与 AI 的提示词交互过程，变成明确的设计决策；让 Prompt 的编写过程，变成可回溯、可调整的可控流程。

因为，用户很难一次就提出完全准确的命题或者要求，

在这个过程中，需要 AI 帮助用户进行深入的引导，直到得出最终结论。

只有这样，才能真正得出用户认可的内容。

③ 完整可回溯的工作流机制

传统 AI 生图最大的问题之一，一旦生成图片，发现某处不满意，只能推倒重来；

生成就无法回滚…

然后，后续每一次调整都意味着重新消耗算力、重新消耗时间成本。

为了做到可控生图，市面上也出现了一些基于工作流的工具，比如大家熟悉的 ComfyUI。

但问题在于：

ComfyUI 虽然足够强大，但交互过于复杂、节点太过底层，对普通用户而言门槛极高；

使用 ComfyUI 往往需要具备一定的技术背景和深厚的 Prompt 调整经验，否则难以驾驭。

星流于把这种专业、复杂的工作流机制，变成了真正轻量、直观、适合所有人的产品体验。

具体来说：

1. 每一次操作（比如上传图片、抠图、去背景等）都会形成一个明确的「工作节点」，节点间以简单清晰的流程连线直观展示；

2. 用户可以随时在任意节点基础上回溯、修改或重新执行，不需要重新输入提示词；

3. 每一步的调整、操作与结果都是透明、可追溯的，用户能够清楚看到创作过程的每一个细节；

4. 支持单步运行或一键完整运行工作流，满足快速试验与批量复用需求。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

以上三点总结下来，星流在产品设计上做到：

LUI+GUI 深度融合，让用户能自由选择交互方式，满足不同创作需求；

Prompt 结构化交互，将提示词拆解成明确的模块化脚本，实现精准意图控制；

可回溯的工作流，让每一步生成过程都变成可追踪、可回滚、可低成本修改的过程。

这些具体的产品设计与交互机制，才是星流真正实现了抽象的「可控」理念，让它成为我认为真正具备生产力的 AI 工具。

04｜为什么「可控性」才是下一阶段 AIGC 真正的赛点？

当前的 AIGC 工具市场，绝大部分公司仍然把精力放在炼丹，也就是持续优化生成模型本身上。

但星流走的路线完全不同：

它在模型本身之外，更进一步建立了一套以「可控性」为核心的产品交互体系，并由此形成了竞争对手难以快速复制的深厚护城河。

但，为什么我觉得「可控性」才是下一阶段真正的竞争壁垒？

模型的优化终归会遇到瓶颈，而基于模型之上的「可控交互」与「工程化生产」能力，却具备极高的复用性与难以复制的长期壁垒。

具体来说：模型优化到一定阶段之后，彼此之间的差异会逐渐缩小，最终可能只剩下一些画风上的细微区别，而这些区别很可能也可以通过类似 Lora 的技术快速弥补。

就像大语言模型的发展历程一样，在很多日常对话场景中，我们已经很难分辨一段内容究竟出自 4o、Gemini 2.5 、 Claude 4，虽然 DeepSeek 依然是那么亮眼。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

因此，当模型本身的竞争逐渐趋同化之后，下一阶段 AIGC 工具的竞争焦点，

将势必从「哪家模型更强」，转向「谁的产品更可控、更好用、更能真正解决用户的实际问题」。

而星流之所以能迅速建立这样的护城河，核心优势主要来自于以下三点：

① Liblib 在生图工程化方面积累的深厚 KnowHow

事实上，Liblib 团队长期深耕于 AI 生图领域，已经积累了大量工程化的实践经验，

他们早已具备成熟的“大模型封装调用”工程框架，能够快速地把不同的大模型平滑接入自己的产品体系，

支持 SDXL、Star-3 等不同模型之间的灵活切换、组合、升级，而不需要在产品层面做出任何大规模调整，

即使外部模型有重大更新，星流也能在短时间内快速适配新模型，而不是被模型升级所取代。

也就是说，星流的底层工程能力，使它不再依赖于任何单一模型，虽然模型优化很重要，但它不再是决定这个产品长期价值的唯一因素；

星流真正的壁垒，是把模型能力稳定转化为高效的、稳定的用户端生产流程的能力。

② 大量风格 Lora 储备，让风格控制高度模块化

传统的 AI 生图中，风格控制是一项非常复杂的工程，往往需要用户自行调节权重，甚至手动管理多个不同的 Lora 模型。

但星流在这一点上的做法非常特别：

它拥有大量风格明确的 Lora 模型库，将复杂的风格控制能力封装成简单的图形按钮；

用户只需在界面上直接勾选想要的风格，星流即可自动应用对应的 Lora 风格，精准控制生成的细节效果；

用户不再需要了解底层复杂的权重关系与模型细节，极大降低了门槛与操作难度。

更关键的是，这种 Lora 风格控制的方式，是可以持续扩展的：

随着星流团队持续积累新的 Lora 模型，这种模块化的风格控制能力只会越来越强，越来越难被竞争对手复制；

星流以“风格即组件”的方式构建 Lora 体系，将“风格控制”彻底变成了一个高效、易用、低门槛的交互机制。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

光凭这么多 Lora 的管理和社区共建带来的持续积累，星流已经构筑了一道极高的壁垒，想要挑战它的产品恐怕很难在短期内追赶上来。

③ 精准的 Prompt 理解与操纵能力

最后也是最难复制的一点，就是星流基于长期的 Prompt 数据积累，已经形成了对自然语言指令极为精准的理解能力：

它依托 Liblib 平台大量真实用户生成的数据，精准理解各种复杂场景下的用户需求；

掌握了 Prompt 拆解、重构与模块组合的最佳实践经验，能迅速、精准地将用户的语言需求映射到具体生成结构上；

浅浅感受一下星流写出来的提示词，

这些提示词对我而言已经完全超纲了，我的脑回路里压根写不出这样的提示词…

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

所以，超出我认知而且效果好的产品，会激发我的付费欲望。

可能是另一个维度的…知识付费吧。

竞争对手要追上这套能力，不仅需要模型本身，更需要长期、大量、高质量的用户数据积累：

模型可以快速复制，但真实用户使用过程中积累的数据、经验与理解能力，却不是一朝一夕能获得的；

这些数据与经验，才是星流未来真正的长期壁垒。

纵观以上三点，我们可以清晰地看到：

星流真正的竞争壁垒，不再只是单纯套壳一个生图模型能力，而是基于模型之上，将模型能力稳定转化为用户可精准掌控、可规模化复用的生产流程。

因此，即便星流目前还没有推出完全自研的基础生成模型，也丝毫不会影响它在未来市场上的竞争优势。

反而，模型不断更新迭代之后，星流不但不会被淘汰，还能快速将更强的模型快速而平滑地纳入自己的交互体系，升级自己。

结语：AIGC 真正的未来，是比谁更可控?

用过这么多 AI 工具后，我越来越确信一件事：

单纯的模型优势，迟早会变成行业标配，

真正拉开下一阶段 AIGC 工具差距的，是模型之外的用户交互设计与工程化改造能力。

从我个人使用体验来说，星流带给我的惊喜就在于：

Liblib 是一家懂得把模型能力转化成生产力的工具公司；

它的「可控性」交互体系，把我之前用 Prompt 做随机生成的过程，彻底变成了一种精准可控、低成本复用的创作流程；

星流它真正做到了：从新手到高手，都能在同一款工具内找到适合自己的生产方式。

更重要的是，它建立的这种基于可控交互的壁垒：

靠长期积累的工程化能力、风格组件（Lora）库、用户数据理解能力；

这些能力的积累，才是竞争对手短期内难以复制的长期优势。

事实上，这种观点在行业内也得到了明确认可。

Liblib 的投资人之一、金沙江资本的朱啸虎，在前段时间中关村论坛的分享上也明确表达过类似的观点：

AI 创业者要勇于承认自己的产品没有技术壁垒，所有的 AI 应用都是套壳应用，真正的壁垒在于对用户的洞察，对产品力的把控。

本质上就是解决大模型不好解决、用户不好使用的问题。

深度拆解产品：一款「可控」的AI生图工具该怎么设计?

星流正是用实际行动在印证他们投资人的观点：

它深入理解用户需求、精准把握产品体验，真正让大模型变成了用户手中的生产力工具，而不仅仅是没有过度陷入模型炼丹的套壳。

也因此，我才越来越坚定地相信：

未来 AIGC 工具的竞争焦点，将从模型能力的炼丹，转向如何真正地、持续地解决用户的问题。

而星流，显然已经在这条路上抢占了先机。

文章来自于微信公众号“洛小山”，作者是“洛小山”。

关键词: AI , AI设计 , Lovart , 星流

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0