Hi,周末早上好。
我是洛小山,和你一起深度拆解有意思的 AI 产品。
这篇文章,我会从几个真实的案例出发,深度拆解一下星流这款产品,以及聊聊:
全文大约 6500 字,完整阅读预计 15 分钟。
熟悉我的朋友们都知道,为了保持公众号头图风格一致,我一直在用 Lovart 生图。
下图是我在使用 Lovart 的工程界面。
但认真讲,我用在 Lovart 的图像的掌控力是很弱的,最大的问题是英文不好,只能靠机翻。
机翻的痛苦大家都懂:同一种含义,不同的单词,生出来的效果千差万别,耗费了我不少算力和时间。
所以,Lovart 推出国内版「星流」之后,我立刻转投了它的怀抱。
用过一阵后,我逐渐觉得:
星流不仅仅只是 Lovart 的国内版,做了基本的语言优化,更是在产品交互层面做了深入到极致的设计。
我甚至想提一个暴论:
星流真正成为了 AIGC 创作者的生产力工具,是 AI 生图界的 Figma。
我用过不少 AI 生图工具,有个特别头疼的场景是,如果我需要基于某张图片裁剪成多种尺寸,常规的做法往往是:
1. 手动裁剪掉一部分,但很可能破坏画面构图;
2. 重新输入提示词重新生成,或者通过 Sora 进行图生图,但如果有多种格式,就需要提多条需求,如果你没法使用 Sora,许多产品还得面对完全随机、风格和细节难以复现的结果;
3. 使用其他 AI 工具「扩图」,但常常引入奇怪的细节,甚至完全偏离了原来的设计意图。
比如下图,添加的细节就偏离原图的设计
或者 PS 的内容识别,直接改坏了…
而 PS 的 AI 功能,国内正版无法使用…
无论哪种方式,都存在不小的效率损耗和不可控的风险。
但星流在这个方面,就完全刷新了我的体验。
比如下面这个「精灵」的插画需求:
传统方式下,这意味着我可能要反复重新生成、裁剪、尝试扩展,花费不少精力。
而在星流中,我只需要:
1. 先上传这张图,然后简单地输入我的要求,明确风格、角色特征与场景细节。
2. 星流会自动理解我的需求,保持原图设计风格、角色与色调高度一致,并智能补充背景、细节,不需要我费力重新调整 Prompt 或者再重新生成。
可以看到,星流不仅做到了相对完美的构图扩展和细节延续,而且生成的效果惊人的统一,生成不同尺寸的图便于我直接发布。
以及:
除了上面的 Case 以外,还有对海报的多尺寸调整,颜色、排版调整;
保持角色主体统一,进行更多场景泛化的…
可见:星流的强大之处,是它真正把 AI 生图变成了可以稳定复用、高效批量生产的创作流程,而不仅仅停留在做出好看的图片。
因为,做出好看的图片,在 Liblib 已经基本实现了。
接下来,我们再深入聊聊,为什么我觉得「可控」才是真正的生产力,以及星流究竟是如何做到如此「可控」的?
你可能会觉得我会不会太纠结于「可控」这个词了,毕竟市面上的 AI 工具不少,随手输入一句话,就能生成一张挺不错的图,为什么非得强调「可控」不可呢?
因为在长期使用 AI 生图工具时,我逐渐觉得:
所谓「可控」,具体来说就是以下四点:
① 结果可预期,不能是随机抽卡。
使用 AI 生图最痛苦的经历莫过于不断重抽炼丹:
而「可控」意味着,工具能够稳定地输出用户预期中的风格、构图、色彩与细节,避免大量的反复试错与算力浪费。
对真实的创作者而言,稳定可复现的结果,才是真正有价值的。
这是汗青老师设计的 AI 歌手 Yuri尤栗 ,他在评论区里曾提到,为了做好这支视频,进行了 1.3 万次的抽卡…
虽然抽卡的原因不尽相同,但如果产物能够稳定输出,能大幅降低抽卡次数,那就能大幅提升效率。
② 修改成本低,不用重头再来
如果每一次调整细节,都必须重新输入提示词、重新生成一整张图片,那生产效率就会大大降低。
我们真正需要的是能像 Photoshop 或者 Figma 一样,轻松进行局部调整的能力:
「可控」意味着,我们能以最低的成本进行调整与修改,而不是推倒重来。
③ 批量复用效率高,降低边际成本
如果每一张图片都是一次全新的随机生成,意味着当我需要一系列的视觉资产时,每张图片都要花费相同的精力与成本,这显然不可持续。
真正的生产场景是:
此后,能持续以极低的边际成本批量生成同一风格的资产,这才是实际生产需求。
而「可控」正是确保了“规模化复用”成为可能。
比如,我一直在用的:
④ 上手简单,但也能满足高手需求
很多 AI 生图工具,要么新手难以掌控,要么高手无法精细调整,总难以兼顾两端。
真正的生产力工具,必须同时满足:
星流熟悉掌握 AI 生图技巧的设计师也提供了相对充分的自由度,
下面是我设定 1 - 16 个不同采样步数后生成的图。
可见,「可控」不是只有一种交互方式,而是给用户提供了多种不同层次的交互途径,让所有人都能在同一款产品中找到适合自己的生产方式。
总结一下,对用户而言,真正的生产力来自于:
这四点,就是我所理解的,为什么说只有「可控」才是真正的生产力。
有了明确的定义,我们接下来再详细拆解星流的产品设计,看看它是如何具体实现这些「可控」能力的。
前面讲了很多对「可控」的理解,但再好的概念,如果产品落不了地,也都是空谈。
我之所以这么认可星流,就是因为它的设计思路非常明确:将抽象的「可控」理念,实实在在地体现在产品界面的每一个细节当中。
具体来说,星流在产品设计层面,真正实现了以下三点:
① LUI(语言交互)和 GUI(图形交互)的深度融合
很多 AI 工具,要么纯粹靠 Prompt 生成,要么完全依赖 GUI 控件。
但星流厉害在于,它同时提供了两条完整交互路径,供不同类型的用户灵活选择。
参数专业用户可以精准控制生成的每一个细节,达到精细调整效果。
两种路径相互融合,能让用户根据需求自由切换:
这种兼容性强的设计方式,是星流交互设计高明之处。
② Prompt 可结构化:多轮交互、模块拆解
星流采用了分步引导的结构化交互:
这种结构化的 Prompt 方式,彻底告别了传统 Prompt 生图中随机抽盲盒的痛苦:把用户与 AI 的提示词交互过程,变成明确的设计决策;让 Prompt 的编写过程,变成可回溯、可调整的可控流程。
因为,用户很难一次就提出完全准确的命题或者要求,
在这个过程中,需要 AI 帮助用户进行深入的引导,直到得出最终结论。
只有这样,才能真正得出用户认可的内容。
③ 完整可回溯的工作流机制
传统 AI 生图最大的问题之一,一旦生成图片,发现某处不满意,只能推倒重来;
生成就无法回滚…
然后,后续每一次调整都意味着重新消耗算力、重新消耗时间成本。
为了做到可控生图,市面上也出现了一些基于工作流的工具,比如大家熟悉的 ComfyUI。
但问题在于:
星流于把这种专业、复杂的工作流机制,变成了真正轻量、直观、适合所有人的产品体验。
具体来说:
1. 每一次操作(比如上传图片、抠图、去背景等)都会形成一个明确的「工作节点」,节点间以简单清晰的流程连线直观展示;
2. 用户可以随时在任意节点基础上回溯、修改或重新执行,不需要重新输入提示词;
3. 每一步的调整、操作与结果都是透明、可追溯的,用户能够清楚看到创作过程的每一个细节;
4. 支持单步运行或一键完整运行工作流,满足快速试验与批量复用需求。
以上三点总结下来,星流在产品设计上做到:
这些具体的产品设计与交互机制,才是星流真正实现了抽象的「可控」理念,让它成为我认为真正具备生产力的 AI 工具。
当前的 AIGC 工具市场,绝大部分公司仍然把精力放在炼丹,也就是持续优化生成模型本身上。
但星流走的路线完全不同:
它在模型本身之外,更进一步建立了一套以「可控性」为核心的产品交互体系,并由此形成了竞争对手难以快速复制的深厚护城河。
但,为什么我觉得「可控性」才是下一阶段真正的竞争壁垒?
模型的优化终归会遇到瓶颈,而基于模型之上的「可控交互」与「工程化生产」能力,却具备极高的复用性与难以复制的长期壁垒。
具体来说:模型优化到一定阶段之后,彼此之间的差异会逐渐缩小,最终可能只剩下一些画风上的细微区别,而这些区别很可能也可以通过类似 Lora 的技术快速弥补。
就像大语言模型的发展历程一样,在很多日常对话场景中,我们已经很难分辨一段内容究竟出自 4o、Gemini 2.5 、 Claude 4, 虽然 DeepSeek 依然是那么亮眼。
因此,当模型本身的竞争逐渐趋同化之后,下一阶段 AIGC 工具的竞争焦点,
将势必从「哪家模型更强」,转向「谁的产品更可控、更好用、更能真正解决用户的实际问题」。
而星流之所以能迅速建立这样的护城河,核心优势主要来自于以下三点:
① Liblib 在生图工程化方面积累的深厚 KnowHow
事实上,Liblib 团队长期深耕于 AI 生图领域,已经积累了大量工程化的实践经验,
他们早已具备成熟的“大模型封装调用”工程框架,能够快速地把不同的大模型平滑接入自己的产品体系,
支持 SDXL、Star-3 等不同模型之间的灵活切换、组合、升级,而不需要在产品层面做出任何大规模调整,
即使外部模型有重大更新,星流也能在短时间内快速适配新模型,而不是被模型升级所取代。
也就是说,星流的底层工程能力,使它不再依赖于任何单一模型,虽然模型优化很重要,但它不再是决定这个产品长期价值的唯一因素;
星流真正的壁垒,是把模型能力稳定转化为高效的、稳定的用户端生产流程的能力。
② 大量风格 Lora 储备,让风格控制高度模块化
传统的 AI 生图中,风格控制是一项非常复杂的工程,往往需要用户自行调节权重,甚至手动管理多个不同的 Lora 模型。
但星流在这一点上的做法非常特别:
更关键的是,这种 Lora 风格控制的方式,是可以持续扩展的:
光凭这么多 Lora 的管理和社区共建带来的持续积累,星流已经构筑了一道极高的壁垒,想要挑战它的产品恐怕很难在短期内追赶上来。
③ 精准的 Prompt 理解与操纵能力
最后也是最难复制的一点,就是星流基于长期的 Prompt 数据积累,已经形成了对自然语言指令极为精准的理解能力:
浅浅感受一下星流写出来的提示词,
这些提示词对我而言已经完全超纲了,我的脑回路里压根写不出这样的提示词…
所以,超出我认知而且效果好的产品,会激发我的付费欲望。
可能是另一个维度的…知识付费吧。
竞争对手要追上这套能力,不仅需要模型本身,更需要长期、大量、高质量的用户数据积累:
纵观以上三点,我们可以清晰地看到:
星流真正的竞争壁垒,不再只是单纯套壳一个生图模型能力,而是基于模型之上,将模型能力稳定转化为用户可精准掌控、可规模化复用的生产流程。
因此,即便星流目前还没有推出完全自研的基础生成模型,也丝毫不会影响它在未来市场上的竞争优势。
反而,模型不断更新迭代之后,星流不但不会被淘汰,还能快速将更强的模型快速而平滑地纳入自己的交互体系,升级自己。
用过这么多 AI 工具后,我越来越确信一件事:
单纯的模型优势,迟早会变成行业标配,
真正拉开下一阶段 AIGC 工具差距的,是模型之外的用户交互设计与工程化改造能力。
从我个人使用体验来说,星流带给我的惊喜就在于:
更重要的是,它建立的这种基于可控交互的壁垒:
事实上,这种观点在行业内也得到了明确认可。
Liblib 的投资人之一、金沙江资本的朱啸虎,在前段时间中关村论坛的分享上也明确表达过类似的观点:
AI 创业者要勇于承认自己的产品没有技术壁垒,所有的 AI 应用都是套壳应用,真正的壁垒在于对用户的洞察,对产品力的把控。
本质上就是解决大模型不好解决、用户不好使用的问题。
星流正是用实际行动在印证他们投资人的观点:
它深入理解用户需求、精准把握产品体验,真正让大模型变成了用户手中的生产力工具,而不仅仅是没有过度陷入模型炼丹的套壳。
也因此,我才越来越坚定地相信:
未来 AIGC 工具的竞争焦点,将从模型能力的炼丹,转向如何真正地、持续地解决用户的问题。
而星流,显然已经在这条路上抢占了先机。
文章来自于微信公众号“洛小山”,作者是“洛小山”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0