AI 时代,「品味」可能是创作者最重要的素质了
这两年 AI 的能力越来越强了,甚至有点溢出的感觉。
图片、视频、音乐、代码,每个方向上都有好几个工具在卷。单点能力上,它们已经能很好地满足大多数需求了。
但如果你想交付一个完整的作品,比如从零开始做一部动画短片,你会发现自己还是在不同工具之间不停地跳转,没完没了地复制粘贴:用这个工具写剧本、用那个工具出图、再去另一个生成视频。
相比于 AI 的单点生成能力,这种碎片化的工作流才是更大的问题。
下一代创作软件比的不是模型能力,而是谁能把完整的创作流程跑通。 能让 Agent 从接到目标开始,一路协作推进到交付成品的系统,才是真正的竞争力。
OmniWork 是我们最近看到的明确在朝这个方向走的产品。它给自己的定位是「The Agent OS for Creative Work」,面向创作工作的 Agent 操作系统。
如果要用一个更直觉的说法来理解它,OmniWork 就像是一个「知乎专家团队(全干版)」:你可以把完整的创作目标交给它、由多个 AI 专家协同推进到交付的系统。
我们用 OmniWork 跑了 3 个任务,跟大家分享一下实际体验。
实测 OmniWork
进入 OmniWork,第一感觉是轻。整个产品在浏览器里直接运行,不需要本地部署任何东西,打开网页就能用。
左边栏是四个核心入口:New Task(新建任务)、Autowork(自动化任务)、Experts Market(专家市场)、Skills(技能库)。
打开 Experts Market,你看到的是一排排「专家」,Film Production Director、Music Producer、Game Art Director、Visual Design Director
每个 Expert 都有明确的职能定位和一组挂载的 Skills。

这跟通用工具是完全不同的思路。每个 Expert 更像是一个有明确岗位职责的专业角色。它只干它擅长的事,但在那个方向上比通用模型深得多。
Case 1:趋势调研,让 AI 情报员帮你三分钟摸清一个赛道
我们做的第一件事是一个跟工作直接相关的任务。因为最近在关注 AI 短剧和漫剧赛道,所以想快速摸清过去一周各平台上什么内容最火、创作者在用什么工具、讨论热度集中在哪些话题。
把需求丢给了 Trending Content Monitor:
帮我调研过去一周 YouTube、TikTok、X 上最火的 AI 短剧和 AI 漫剧内容。我想知道:
1.哪些作品播放量/互动最高,为什么火
2.有没有值得关注的新创作者或新玩法
3.创作者用了什么工具和工作流
4.当前讨论热度最高的话题和标签 按热度排序,每条给我一句话总结亮点。
它调用了 youtube-tiktok-trend-analysis、x-reddit-trend-analysis 和 web-search 三个 Skill。

大概几分钟之后,OmniWork 就交付了一份完整的可视化报告。

内容层面,最有价值的是两个维度。
一是工具分布,这种结构化的信息整理确实比自己零散刷信息流更高效。

二是新创作者的发现。报告里提到的几个账号我们之前没关注过,顺着线索去看确实找到了一些有意思的内容。
当然,报告里的具体播放量数据没法逐条核实,这类 AI 生成的调研报告目前还是适合当作方向性参考,而不是可以直接引用的数据源。但作为一份两分钟内交付的行业速览,这个信息密度已经够用了。自己做同样的调研,少说要花半天。
OmniWork 的 Autowork 功能可以把这类调研任务设成定时执行。设好频率和交付格式,它会在后台自动跑,定期把结果推给你。相当于雇了一个 7×24 在线的行业情报员。

Case 2:穿山甲短片,一句话启动完整动画制作流水线
盯完赛道趋势之后,我们想试一个更重的任务——用 OmniWork 从零做一部动画短片。
这次找的是 Film Production Director。点开这个 Expert 的详情页,它挂载了 16 个 Skills,覆盖从角色设计到分镜到视频生成到后期合成的完整链路:影视工作流程、编剧、分镜画师、三视图合成师、视频生成、视频后期剪辑师……

首先给一句指令:
请使用「穿山甲归途」这个主题创作一个动画短片,交付完整脚本和视频,直接产出即可,无需让我确认
然后它自己跑起来了。整个制作流水线分四个阶段:
Phase 1:角色三视图生成。 基于给的原画,生成了穿山甲的正面、侧面、背面三视图,用于后续视频生成时保持角色一致性。

Phase 2:分镜脚本创作。 自动构建了一个五幕叙事结构(独行、困境、转机、筑巢、归宿),写了完整的分镜脚本。

Phase 3:五段视频逐段生成。 它使用首尾帧链接技术,每一段的末帧都作为下一段的起始参考帧,保持了段落之间的画面连贯性。
Phase 4:最终合成。 五段视频加上片名字卡,合成为一部完整短片。

最终交付的《穿山甲归途》全长 68 秒,1080p 画质,吉卜力风格的治愈画风。 片头有字卡,片尾有收束,全片配了背景音乐。

画面层面,穿山甲的形象在五个场景中保持了角色一致性,没有出现常见的 AI 视频「变脸」问题。
清晨森林里的光影是柔和的暖色调,暴雨场景切到冷灰色,雨后转机的画面又回到暖调,情绪节奏跟色调变化是配合的。

叙事层面,五幕结构是一个完整的故事弧线,起承转合都有,不是五段随机画面拼在一起。最后月光下穿山甲蜷缩入睡那个镜头,配合音乐的渐弱收束,作为短片结尾是成立的。

也有一些可以感知到的 AI 痕迹。 穿山甲的肢体动作在某些帧里有轻微的「漂移感」,不够扎实;五段视频之间的场景切换虽然用了帧链接,仔细看还是能察觉到风格的微妙跳跃。
不过考虑到整个制作过程是「一句话指令、零人工干预、一个半小时出片」,这个完成度已经远超预期。
而且全程只跟 Film Production Director 一个专家交互,就实现了一套完整的动画制作流水线。从开始到输出完整视频,都是系统自主完成决策,无需人工辅助。
有一个细节我们觉得很有意思。 任务完成后,系统弹出一个提示:「Omni wants to turn this task into a skill」,问要不要把这次穿山甲动画短片的完整制作流程沉淀为一个可复用的 Skill。

点了 Sounds good 之后,下次再做类似的动画短片,系统可以直接调用这个 Skill,不用重新摸索流程,个人的知识资产就这么沉淀下来了。
Case 3:穿山甲跑酷游戏,多专家协作交付一个可玩的成品
做完动画短片,我们顺手给穿山甲加了一个「番外篇」,用 OmniWork 做一个横版跑酷小游戏,让穿山甲延续短片里的归途故事,一路躲避毒蛇、蝎子、猎人陷阱,最终回到家。
这次的任务跟 Case 2 有一个本质区别:做动画短片只需要一个 Expert(导演),但做游戏则需要多个 Expert 协作。
我们在 Experts Market 里「聘请」了一个专业游戏团队:
•Game Design Director:负责玩法设计、关卡节奏、GDD 编写
•Game Art Director:负责角色立绘、Spritesheet 资产和场景美术
•Game Dev Director:负责 HTML5 代码实现
•Game Test Director:负责 QA 验证

Prompt 词:
💡 请基于这个「穿山甲归途」这个主题,制作一个横版跑酷 HTML5 小游戏:穿山甲在森林中奔跑回家,需要躲避毒蛇、蝎子和猎人陷阱,最后跑到家即通关。要求交付完整美术资产和可运行的游戏 demo。
这次能明显看到多个 Expert 在接力工作。
•Game-Design-Director 和 Game-Art-Director 并行启动,一个写 GDD 游戏设计文档,一个产出 15 套 8-bit 像素风格美术资产;
•两边交付后 Game-Dev-Director 接手,用 Phaser 3 引擎把设计和素材整合成可运行的 HTML5 游戏;
•最后 Game-Test-Director 做 QA 验收,找到两个 Bug 并直接修复。

最终交付的是一个完整可玩的跑酷游戏。穿山甲在森林中自动奔跑,有明显的纵深感。左上角三颗红心显示生命值,右上角实时计分。前方地面上蹲着蝎子,需要跳跃躲避。最后一关跑到洞穴门口即可通关,跟短片结尾呼应。

美术精度跟专业独立游戏当然有差距,毕竟一个精美的游戏就是需要投入大量的人力完成的。但 OmniWork 在半小时内就产出了一个可以完整验证的 Demo,这种效率和完成度是令人印象深刻的。
如果说 Case 2 展示的是「一个专家调用多个工具」的纵向深度,Case 3 展示的就是「多个专家接力协作」的横向广度。
这才是 OmniWork「知乎专家团队(全干版)」定位的完整形态:任务简单时它是一个全能专家,任务复杂时它变成一支有分工、有工序的团队。
OmniWork 背后的几个行业观察
做完这 3 个测试,产品之外,我们觉得有几个行业层面的变化值得聊聊。
【1】从「资产生成」到「成品交付」,AI 创作工具的交付单位正在升级。
过去一年大家的注意力都在模型能力上,视频更逼真了、音乐更好听了、代码更准了。
在 OmniWork 里,给了一句话和一张图,系统就可以自己拆解任务、调度流水线、处理衔接,最后交出来一部带完整叙事和配乐的成片。整个过程里没有碰过任何一个单点工具。
创作工具的交付单位从「一张图」「一段视频」升级到了「一个完整作品」。这个变化一旦成立,创作者的生态会发生结构性的变化。
【2】AI 创作工具的下一个壁垒,可能不在模型层,而在经验层。
通用大模型会越来越强,单纯的能力封装很容易被追平。OmniWork 的思路是把真人专家的经验结构化写进 Agent,再通过 Skill 沉淀不断积累。
据我们所知,OmniWork 已经跟上戏文化、上音人工智能音乐疗愈实验室合作,像专家市场里的「导演」「音乐制作人」背后,都是真人专家的经验注入。
再加上 Skill 的沉淀机制,每完成一个复杂任务,系统就把工作流提炼为新的 Skill,下次可以直接调用。这个「经验层」如果能越滚越厚,就是别人很难复制的东西。
【3】「创作软件」和「创作服务」的边界正在模糊
过去软件就是软件,服务就是服务。Premiere 是工具,你得自己会用;找外包是服务,别人帮你干但很贵。
OmniWork 有意思的地方在于它处在这两者的中间地带:它是一个软件产品,但用起来的体验更像是在跟一个服务团队下需求。你不需要学会怎么操作每个功能,你只需要说清楚你要什么。
如果要用一句话概括 OmniWork 的定位,「AI 知乎专家(全干版)」可能是最直白的说法。它确实在描述一种新品类:有专家服务的交付能力,但以软件的价格和速度运行。 7×24 在线、即时响应、持续记住你的偏好,这些是真人专家物理上做不到的。
当然,AI 专家的判断力和真人顶级专家之间还有差距,但对大量「找不到专家、找不起专家」的创作者来说,这个差距已经被效率和成本优势覆盖了。
当执行层面的门槛被工具抹平,创作者的核心工作就从「怎么实现」退回到了「做什么」和「做成什么样」。
到了这一步,真正稀缺的就是品味了。选什么题材、要什么调性、在哪里收束,这些判断 AI 替不了你。
OmniWork 目前还在内测阶段,我们手上有几个邀请码,感兴趣的可以在评论区评论。
产品地址:www.omniwork.ai
文章来自于微信公众号 “十字路口Crossing”,作者 “十字路口Crossing”
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0