刚刚,火山引擎上线了豆包・图像创作模型 Seedream 4.0,我提前试了一下,应该各位也看到了各种非常强的玩法和图片。
简单来说就是一个支持图片生成、连续图片编辑、多图参考的全能图像创作模型。
藏师傅玩了两天跑了上千张图片之后基本摸清了这个图像创作模型的能力,优秀的美学表现、世界知识、提示词遵循、一致性保持、精准的编辑能力、完美的中文支持,而且还能自定义生成比例,还有直出 4K 图片的能力,对于中文用户来说毫无疑问这就是当前 T0 级别的图像创作模型。
当然我也发掘的非常多有意思的玩法,前几天发了几个以后已经有人开始自己接单或者做产品开始盈利了。
现在开始,企业客户就可以通过火山引擎MaaS平台火山方舟接入Seedream 4.0,而且这是所有渠道中唯一支持 4K 图片直出的 Seedream 4.0 图像创作模型。
个人用户也别着急,Seedream 4.0已同步在豆包、即梦APP全量上线。4K直出的版本,将于今晚20:00首次开放给个人用户,搜索“火山方舟体验中心”,就能第一时间体验。
开始我们的教程,如果你暂时没时间看的话,也可以点赞或者转发收藏一下,谢谢了🙏
先来看一下玩法目录:
首先是一个体现Seedream 4.0 修改精细度的案例,也是现在独家的能力,他能对我们日常修图美颜涉及到的所有关键词做出响应。
不管是光影、滤镜、装造还是发型,基本上你能想到的名词他都知道,而且这些元素还可以在提示词中随意组合。
光影的效果是最好的,除了我们常见的光线外我还测试了分割光、环形光以及伦勃朗光这种非常复杂的打光方式, Seedream 4.0 也都能响应,而且提示词极其简单。
提示词:将画面光影改为 XXX
我们常见的滤镜照片滤镜也没问题,这里你甚至可以不止给人像加,加在风景图上也是可以的,而且不会影响原有照片的内容。
提示词:为画面添加 XXX 滤镜
说实话复杂装造这个我没想到他可以搞定的,因为化妆这个事情实在是太过于细微了,结果大部分的装造关键词他都能响应,找女性朋友看了一下她已经相当满意了,眼线这种过于细节响应有时会有点问题。
提示词:为角色添加 XXXX 装造
发型这里的话基本上常见的发型都能响应,但是一旦涉及到某个发型加点层次这样的就不行了,因为改变太细微了,有点强模所难。
提示词:将图中人物发型更改为 XXX
这玩意让现在做美颜相机这种应用门槛非常低了,你完全可以探索出一个图表结合 LLM 解析用户的修图需求做出一个言出法随的美颜应用,而且可以跟用户原来的人脸保持高度的一致性。
当时大家都为 Nano Banana 那种基于几个角色然后连续出分镜图的案例惊叹不已,结果自己试了一下发现,三张图就无法保持 ID 了,而且清晰度过低根本没办法看清脸,不可用。
Seedream 4.0 这次可用程度相当高,生成的图片因为非常清晰对于人脸的表现也很清晰,在连续生成 6 张图之后人脸 ID 还能保持得很好。
如果你只需要参考角色面部的话建议上传大头照,这样效果最好,如果需要参考服装的话就上传全身或者半身照。
我这里让模型虚构了一个凡人修仙传的韩立和紫灵穿越到巴黎谈恋爱的小剧场,说清楚需要场景以及要几张图就行,当然你也可以自定义每个场景的画面提示词,不过我觉得让模型发挥效果更好。
图片提示词:
参考这两个角色的面部和发型,将其更改为现代冬天的装束,生成 6 张连续的在巴黎约会的分镜图,写实电影剧照风格,需要在一个场景中,连续动作
再生成完图片之后你可以用 Seedance (个人用户在即梦app、企业用户在火山引擎上可以使用)的首尾帧视频模型或者智能多帧模型用我这套提示词为每两张图之间生成首尾帧的提示词。
首尾帧视频提示词生成:
你是一位顶尖的创意视频导演和VFX(视觉特效)概念艺术家。你的任务是为AI视频生成模型设计一个从【起始帧】到【结束帧】的转场过程。
你的核心目标是:构思并用一段话清晰、具体地描述这个动态视觉变化。
在构思时,请遵循以下创作框架:
第一步:分析差异 快速判断【起始帧】和【结束帧】的差异程度。
A类 - 关联性强: 主体或场景基本一致,只是状态、风格或环境发生改变(例如,同一个人换了衣服,同一个场景从白天到黑夜)。
B类 - 差异巨大: 主体和场景完全不同(例如,一只猫在客厅 → 一艘飞船在太空)。
第二步:选择转场策略
如果属于 A类,优先采用“原地演变”的策略。让变化直接发生在主体和环境上,尽量不使用或只使用微弱的摄像机移动。
如果属于 B类,采用“运镜驱动转场”的策略。必须使用一种明确的摄像机移动(如推、拉、摇、移、旋转)来引导过渡,让镜头运动成为连接两个不相干画面的桥梁。
第三步:构思具体变化(从以下工具箱中选择组合)
主体变化: 主体如何改变?(形态变化、材质替换、服装更替、分解重组、消失或出现)。
环境变化: 背景如何改变?(时间流逝、季节更替、空间切换、从现实变为幻想)。
风格/特效变化: 用什么视觉风格或特效来包装这个过程?(例如,画面逐渐像素化后重组、被火焰/水流吞噬后显现、转变为水彩/油画风格、出现光效粒子)。
输出规则:
将你的最终构思整合为一个连贯的段落。
描述要具体、直接,充满画面感。专注于“我们看到了什么”,而不是“我们感觉到了什么”。
严格遵守你在第二步中选择的摄像机移动策略。
避免使用模糊的比喻和过于文学化的修辞。
现在,请根据我提供的【起始帧】(图片A)和【结束帧】(图片B),生成你的转场描述。
生成多个视频后只需要把视频按顺序用剪映或者其他工具剪辑加上配乐就行,最近我已经看到过好多个类似的的视频爆火了,也可以直接把这个流程自动化做成产品或者工作流,感觉应该很赚。
这个才是这次的大活之一,以往的 AI PPT 产品要么是套模版素材,无法自定义而且模版往往不适合你的大纲,要不就是用前端代码写,写出来的页面很多时候只有图标和文案非常单调。
看到 Seedream 4.0 的时候我就知道机会来了,我搞了一套流程可以直接提取你的PPT要点变成非常有质感的思维模型演示PPT页面。
而且生成的图像非常实用,图片左边或者右边会留下为你写字排版的空间,生成的图片符合你的思维模型,比如并列的就会展示玻璃卡片,递进的就会是金字塔,完美兼顾了美观、可控和表意。
使用方式就是将下面这个提示词跟你这一页的文案内容一起发给豆包之类的多模态模型,他就会为你生成对应的 Seedream 4.0 图片提示词,然后直接输入调整比例就能获得 PPT 背景图了。
生成提示词的提示词:
角色: 你现在是一位顶级的视觉概念设计师,专注于将商业或学术PPT内容转化为富有现代感、空间感和高级质感的视觉图像概念。你的设计既要美学出众,又要精准传达内容的内在逻辑。
核心任务: 你的任务是接收用
一张电影海报级别的视觉作品,采用极简主义和空间主义风格。三块大小不一、轮廓分明的长方形磨砂玻璃板,以一种优雅的姿态悬浮在画面的右半部分。最大的玻璃板靠后,上面以简洁无衬线的白色字体蚀刻着核心公式 “变量 = 突破点”;前面两块较小的玻璃板前后错落,分别蚀刻着 “新用户 = 突破点 - 惯性” 和 “突破点 = 时代变量”。
玻璃材质具有高级的半透明磨砂质感,边缘锐利,能捕捉光线。一束强烈而聚焦的聚光灯从画面左上方斜射而下,穿透玻璃,在其表面形成柔和的光晕和清晰的轮廓光,并在深色背景上投下富有层次感的柔和长阴影。
背景是纯粹的、带有微弱颗粒感的哑光深灰色墙面,营造出静谧而深邃的空间感。整体色调冷静,光线中带有极微弱的青色,赋予画面科技感和智慧感。
构图上,所有视觉主体严格集中在画面的右侧,为左侧留出大片干净的背景区域,以实现黄金分割和不对称的美感,方便后期排版添加详细文字。
户输入的PPT文本内容(通常包含一个标题和几个要点),并基于这些内容创作一段用于AI绘画的、详细的、电影海报级别的图片生成提示词(Image Generation Prompt)。
最终输出的图片提示词必须遵循以下风格和规则:
a.核心视觉材质(二选一):
你必须根据内容的调性,在以下两种核心材质中选择一种作为视觉主体:
b.结构与布局(思维模型匹配):
在生成提示词前,你必须首先分析用户输入内容之间的逻辑关系,并选择最匹配的视觉模型进行构图:
c.文字内容处理:
d.色彩、光影与背景:
e.构图与留白:
工作流程示例(基于你的新案例):
a.接收用户输入:
b.内部思考:
c.生成最终的图片提示词(输出):
d.一个巨大的圆环由四段独立的弧形构成,悬浮于画面右侧。它们在空中几乎要拼接成一个完整的圆形,但彼此间留有发光的微妙间隙,象征闭环瞬间的动态张力。四段弧形上依次以蚀刻工艺呈现出'定义问题'、'构建方案'、'验证迭代'、'实现闭环'的字样。整体材质为带有冷静光泽的纯净铂金色,表面光滑且反射着环境光,极具科技感。背景是深邃的、带有微光网格的数字蓝图。一束柔和但聚焦的光线从圆环的中心向外发散,将视线引向那即将闭合的缝隙。画面的整个左半部
可以看一下这几个结果,这里我找的橘子前几天的演讲 PPT 非常符合实际,左边的纯色图片是他原来的,右边的是我用了模型生成的图加上一些文字排版的结果,对比非常明显。
提示词:
一张电影海报级别的视觉作品,采用极简主义和空间主义风格。三块大小不一、轮廓分明的长方形磨砂玻璃板,以一种优雅的姿态悬浮在画面的右半部分。最大的玻璃板靠后,上面以简洁无衬线的白色字体蚀刻着核心公式 “变量 = 突破点”;前面两块较小的玻璃板前后错落,分别蚀刻着 “新用户 = 突破点 - 惯性” 和 “突破点 = 时代变量”。
玻璃材质具有高级的半透明磨砂质感,边缘锐利,能捕捉光线。一束强烈而聚焦的聚光灯从画面左上方斜射而下,穿透玻璃,在其表面形成柔和的光晕和清晰的轮廓光,并在深色背景上投下富有层次感的柔和长阴影。
背景是纯粹的、带有微弱颗粒感的哑光深灰色墙面,营造出静谧而深邃的空间感。整体色调冷静,光线中带有极微弱的青色,赋予画面科技感和智慧感。
构图上,所有视觉主体严格集中在画面的右侧,为左侧留出大片干净的背景区域,以实现黄金分割和不对称的美感,方便后期排版添加详细文字。
提示词:
一张电影海报级别的视觉作品,采用极简主义和空间主义风格。三块大小不一、轮廓分明的长方形磨砂玻璃板,以一种优雅的姿态悬浮在画面的右半部分。最大的玻璃板靠后,上面以简洁无衬线的白色字体蚀刻着核心公式 “变量 = 突破点”;前面两块较小的玻璃板前后错落,分别蚀刻着 “新用户 = 突破点 - 惯性” 和 “突破点 = 时代变量”。
玻璃材质具有高级的半透明磨砂质感,边缘锐利,能捕捉光线。一束强烈而聚焦的聚光灯从画面左上方斜射而下,穿透玻璃,在其表面形成柔和的光晕和清晰的轮廓光,并在深色背景上投下富有层次感的柔和长阴影。
背景是纯粹的、带有微弱颗粒感的哑光深灰色墙面,营造出静谧而深邃的空间感。整体色调冷静,光线中带有极微弱的青色,赋予画面科技感和智慧感。
构图上,所有视觉主体严格集中在画面的右侧,为左侧留出大片干净的背景区域,以实现黄金分割和不对称的美感,方便后期排版添加详细文字。
提示词:
数块大小不一的几何金属板,以一种优雅的解构主义方式悬浮在画面的左侧。整体材质为带有细腻拉丝纹理的哑光黑钢,边缘锋利,反射着冷峻的光泽。最大的三块垂直金属板上,分别用蚀刻工艺清晰地展示着“好产品”、“好时机”、“好宣发”的白色字样。在它们下方,几块稍小的金属板错落有致,上面刻着“找到突破”、“抢先一步”和“放大优势”。一束戏剧性的、极其锐利的聚光灯从画面外斜射而下,精准地照亮了刻有“找到突破”的金属板,使其在幽暗的环境中成为唯一的视觉焦点,并投下深邃的阴影。背景是纯粹的、无任何干扰的哑光深灰色。整个视觉主体被精心布置在画面的左半部分,在画面的右侧形成了大面积、干净的留白区域,为后期添加详细文字和标题提供了充足空间。
这个方案应该会给现在的 AI PPT 行业带来新的实现方式,接入 Seedream 4.0 图像创作模型后加上 AI 编码在图片上进行一些简单排版就可以获得非常上流而且每次都不一样的 PPT 页面。
这个是想起来苹果要开发布会了 iOS 26 的液态玻璃效果做的,可以将你拍摄的任何照片变成玻璃图标,完全不需要修改提示词,而且模型会自己在下方加上合适的文字,你可以直接发社交媒体炫耀。
提示词:
将这张照片的景色变成一个带有照片相关渐变色,透明磨砂玻璃慢射材质,图标下方用有艺术黑体写着跟图片景色相关的英文标题,纯白背景的图标,C4D,OC渲染。
在 Seedream 图像创作模型 3.0 的时候玄学护身符壁纸就帮我涨了一大波粉丝,到了 4.0 我们当然不能忘了这个非常有流量的垂类。
现在你可以上传你的宠物头像,然后让模型帮你生成长得很像你的宠物的山海经神兽许愿符了,而且我还让模型将你的宠物照片放在了生成结果上,这样就不用你自己拼图了。
提示词:
以我上传的 [边境牧羊犬] 的样貌和神态为原型,将其幻化成一只威风凛凛的山海经神兽。神兽保留着宠物的特征,但体型巨大化,身披荧光彩绘的鳞甲与符文,体态线条夸张而充满力量,眼神睥睨,仿佛在守护一方天地。
主体为以复古票据为原型,米黄底色,外围有繁复绿纹边框。
背景是充满张力的水墨风《山海经》世界,远山如黛,怪石嶙峋,周围有其他鬼怪异兽的虚影在云雾中若隐若现。
在画面的 [左下角 或 右下角],有一个类似高科技悬浮屏幕(或古老卷轴)的设计,这个屏幕(或卷轴)上清晰地展示着我上传的宠物原始照片,旁边还有一些类似“原型体”、“灵力值”的数据标签和神秘符号。
荧光彩绘,夸张线条,现代潮流与古典神话碰撞,绚丽色彩,前卫艺术,非常规构图,冲击力,张力,情绪释放,创新,写实细节,梦幻光影,水墨电影感。
顶部和底部有重复英文 'EVERYTHING GOES WELL',中间 'GOOD LUCK',两侧竖排英文 'LIFE IS SHORT WHY NOT TRY',中央用粗犷黑笔写着 '逢考必过',周遭簇拥竖排小字,底部有英文 'Wish you all the heavenly blessings' 与红色篆刻印章的画面,国潮票据场景,复古花纹、书法狂草、篆刻印章与英文标语碰撞修饰,纸张边缘粗糙磨损,纸张纹理,红色印章突出清晰
搞完上面的宠物许愿符以后我突然看到了自己的桌面,这不是完美的玄学商品载体吗?
于是就搞了提示词将鼠标垫换成许愿鼠标垫,发出去之后很多朋友希望做成实体,做电商的朋友们靠你们了。
提示词:
请将图片中涂抹的区域,替换成一个全新的、超写实风格的布艺鼠标垫。
鼠标垫设计要求:
设计主题: 鼠标垫的整个表面,需要完美地印刷上一个国潮护身符票据的图案。
图案细节: 这个票据图案以复古米黄为底色,外圈有复杂的绿色花纹边框。顶部和底部是重复的英文 'EVERYTHING GOES WELL',中间有大写的 'GOOD LUCK',两侧是竖排的 'LIFE IS SHORT WHY NOT TRY'。
核心祝福语: 在鼠标垫正中央,用极其粗犷、充满力量感的黑色书法狂草写着"代码无Bug / 甲方闭嘴 / 需求不改 / 摸鱼万岁"。
辅助元素: 祝福语周围簇拥着许多竖排的、模糊不清的祈福小字。在图案的右下角,有一个非常清晰、显眼的红色篆刻印章,印章内容可以是“心想事成”或类似的吉利话。
纸张质感: 尽管是印刷图案,但要表现出原始设计的纸张纹理,以及纸张边缘自然的粗糙磨损感。
与环境融合要求 ( realism is key! ):
完美替换: 新生成的鼠标垫必须完全遵循原始鼠标垫的形状、大小和透视角度,无缝地融入到照片环境中。
材质表现: 鼠标垫的材质应为高品质的细纤维布面,在图案上能看到极其微妙的布料纹理,边缘最好有精密的锁边设计。
光影一致: 必须严格遵守原照片的光照环境。台灯或屏幕的光照要自然地洒在鼠标垫表面,键盘、鼠标或其他桌上物品投射在鼠标垫上的阴影,要被完整且逼真地保留下来。
无缝衔接: 如果原始鼠标垫有部分被键盘、水杯等物品压住,生成的新鼠标垫图案也必须自然地出现在这些物品的下方,不能有任何穿帮或覆盖的痕迹。
这是我发的第二个 Seedream 4.0 的案例,没想到发出去直接就爆了,小红书一堆参考提示词的人 @ 我,这还没包括没提我名字的。
今天上午阿真还说已经有人开始用这个提示词给其他人定制头像了,疯狂赚钱,火山引擎上了 API 之后马上就能自动化了,加油啊朋友们。麻了,藏师傅现在是 AI 小生意的发源地了。
我昨天发了之后看到还有朋友不会用,需要将下面这张图片放在第一张图,然后将你想要生成头像的照片放在第二张图,然后输入提示词就行。
参考图1的风格和样式为图2的角色生成一个图标,同时只要参考图2的头部位置,像一个头像图标,图标下方的文字应该为“Jinx”
垫了下 Darius Dan这个画头像老哥的图,他手绘的一套图标卖几十美元,不过注意自己玩可以不要盈利哈,尤其是垫图这种方式。
Nano Banana 做手办火了一波,日常二次元那么少,结果一玩图片人人都是二次元, Seedream 4.0 图片可以玩更猛的。
你只需要上传你的照片和想要 Cos 的角色图片就可以无痛 Cos 你喜欢的角色了,真实度和人脸还原度相当高,他还把我的脸型修了一下让我更像贝吉塔。
让图1的穿上图2角色的写实质感的服饰和发型。并在图1的环境中摆出同样的姿势,不要改变人脸,发型和服饰需要更真实像实拍
当然也可以让你喜欢的偶像 Cos 你喜欢的动漫或者游戏角色,相比每个动漫改真人剧集的时候你都有自己心目中的主角人选吧,现在可以实现你的心愿了。
由于 Seedream 4.0图像创作模型有一定的世界知识和视觉推理能力,我就在想那是不是我们就可以直接把今天拍的照片给他,让他帮我们记日记呢?
探索了一下提示词发现真的可以!你可以上传自己今天拍的图片,告诉他今天的日期和天气,他就会帮你生成一个手帐风格的日记图片了。
你还可以把今天的自拍放上去,他就会帮你生成一个手绘形象在页面上,注意提示词写的人像放在第四张图。
提示词:
帮我生成一张图片,根据图片内容帮我模拟在一张略带纹理的纸张上(米黄色或者浅棕色)手写的关于今天的日记。所有的图片以拼贴画风格放在一页日记上,包含以下元素:
用手写字体描述今天做了什么,以及一两句吸引人的标语或简介,包含几张图片的介绍,用红色笔迹或其他亮色圈出或用箭头指向特别推荐的地点或活动。穿插一些与图片特色相关的简单涂鸦式小图画,写着标题“2025 0909 ”“北京 晴 28°”,并添加一个图 4 角色的手绘形象
整体感觉要像一份由热爱生活的作者精心制作的、生动有趣的个人日记。
你完全可以用这套提示词做一个日记应用,然后把用户每天的日记放在一个写实虚拟的日记本里面,做个拟物化的动画绝对卖疯了。
在图像理解和视觉推理上 Seedream 4.0 模型真的很厉害,基本需要很简单的提示词就可以对复杂的图片做出合适的修改。
比如这里我只让他根据图 2 的配色改图 1 的设计稿,他完美的搭配了色板的颜色,知道哪些该用在文字上哪些该用在卡片背景和图标上。
图1 UI设计稿改成图2配色
当然也可以直接改设计稿内容,你只需要跟他说主题就行完全不需要说具体的要求,比如这里我就只说改成星巴克主题,他自己就虚构了合适的文案和图标。
改变图中网页内容,将主题变为星巴克网站,只替换文字和图片,不改其他内容
前面说的 PPT 方案是为了产品化做的,你当然也可以给他参考图让他帮你改成你想要的内容和文字就行,这叫什么“拼好图”?
提示词:帮我生成一个作品集封面,参考图 1 的排版和内容,图 2 的背景颜色和文字配色,并将“2022”改为 “2025”
既然说到了世界知识和智能程度,那就必须把我们的知识卡片发扬光大了,之前 Nano Banana 的知识卡片只能生成英文非常可惜。
现在有了 Seedream 4.0 终于可以肆无忌惮的整了,我整理了一套知识卡片提示词模板,你可以基于这套模版生成任何风格任何受众的知识卡片。
只需要更改下面提示词方括号的内容就行,当然我也给了一些参考风格你也可以直接用。
提示词模板:
生成一张 [格式/载体] 风格的图像,向 [目标受众] 解释/展示 “[可替换的核心概念]”。图像需具备 [风格特征A]、[风格特征B] 和 [排版要求C],整体感觉类似于 [某个熟悉的参照物]。
这个的灵感是最近刷到有人用仙侠文案讲一些历史上著名的科学家的故事,然后就想仙侠风格的卡片搭配高科技产品反差确实强,而且吸引人阅读。
仙侠风格卡片提示词:
生成一张仙侠古籍图鉴风格的卡片,向宗门弟子介绍[电脑]。卡牌应采用水墨国风与工笔画相结合的画风,仙气缥缈,色彩淡雅。布局上,中心是主体的精细插图,旁边配有竖排的相对详细的楷体注释。卡牌四周应有祥云或卷草纹的古典边框,背景素净,有大量留白,整体质感如同一本传世秘籍中的一页。
这个现代信息风格卡片信息是最丰富的,而且表意非常清晰,最通用。
现代信息图风格卡片提示词:
创作一张现代极简信息图(Infographic),向都市白领解释[番茄工作法]。图片应使用明亮、和谐的色块和简洁的扁平化图标,信息布局要遵循视觉引导,使用无衬线字体标注关键步骤或元素,有相对详细的文字介绍,整体风格要干净、有条理,类似于一个高端商业分析报告中的图表。
非常炫酷的游戏风格卡片,会帮你把一些概念变成对应的游戏装备和技能,用游戏化的方式学习。
游戏装备风格卡片提示词:
设计一张幻想RPG游戏中的技能卡片,用文字和图像来解释经济学概念‘期货’。有游戏化的技能名称,卡片上有酷炫的图标、技能描述(用游戏化的语言解释概念)、消耗的‘精力值’和冷却时间。整体是暗黑奇幻风格,带有发光的魔法符文边框。
塔罗牌风格适合讲解一些哲学和西方历史概念、人物、事件等代入感相当强,而且 Seedream 4.0 生成的塔罗牌非常有质感,恍惚间好像是立体的。
塔罗牌风格卡片提示词:
设计一张塔罗牌,用神秘学的象征手法来诠释[集体潜意识]。卡牌需要有经典的装饰性边框,中心是象征性的核心图像,底部有卡牌名称的罗马数字和标题以及中文描述。整体采用神秘、复古的版画风格,色彩象征意义丰富。
技术宅和开发者适合用这套,看起来非常的专业。
蓝图风格卡片提示词:
生成一张技术蓝图风格的知识卡片,向工程师阐释[喷气发动机工作原理]。图像需使用经典的蓝底白线,包含精确的几何线条、尺寸标注和剖面视图,排版严谨,下方设有标题栏和图例和详细文字说明,呈现出专业工程图纸的质感。
这种风格适合用在自然和地理科学概念上,非常应景。
博物学家野外记录风格卡片提示词:
设计一页博物学家的野外手册,向社会观察者介绍[板块构造理论]。画面应以手绘水彩风格为主,包含主体对象的精细素描、其“行为”或“特征”的图解,并配有简单的手写体的文字观察笔记。整体布局自由,带有纸张的做旧纹理和墨迹污渍,仿佛一本真正的田野笔记。
这里我故意用教科书这种古板的表现形式表现一些时髦的现象,反差感比较强。
教科书插图风格卡片提示词:
生成一张复古科学教科书插图风格的图像,向学生解释[网络喷子]。图像应采用柔和的胶版印刷色调,带有细致的钢笔线条和简单的标签注释文字,布局清晰,包含一个主图和几个辅助小图,整体质感如同上世纪的纸质印刷品。
优化过的游戏风格卡片,你可以自定义游戏的背景,比如下面的赛博朋克和仙侠游戏,右边的仙侠游戏这个卡片效果太好了,你跟我说这是真实游戏截图或者素材也信。
幻想RPG游戏中的技能说明卡片:
生成一个幻想RPG游戏中的技能说明界面,向玩家介绍[复利效应]。界面需包含一个代表该概念的像素艺术或手绘图标、技能的名称、稀有度(如:传说、史诗)和简单的文字描述,以及一段用游戏化语言风格写成的描述文字。整体UI设计要有仙侠游戏风格
好了这就是今天的全部教程内容了。
希望能对你有些启发,目前 Seedream 4.0 图像生成模型已经在火山引擎全量上线,如果看到上面这些案例手痒了可以搞一个自己的产品,现在的开发成本真的很低了。
我随手在便利贴上画了三条波浪线,拍照丢进模型,补一句“玻璃质感”。它把歪歪扭扭的线当成光路,在图里折出厚度,像把草图直接吹成玻璃雕塑。那一刻我突然明白:提示词不是“写给 AI 的句子”,而是“递给模型的任意线索”——声音、草图、视频截帧、甚至手机陀螺仪的抖动数据,只要它能被编码成向量,就能成为对话的开头。
于是“写提示词”这件事被拆成两步:
1.先问自己“我手里有什么现成的碎片?”
2.再补一句“我想让它变成什么质感?”
碎片越随意,模型越能把你的个人噪声当成风格指纹;补的那一句越短,留给它的翻译空间越大。就像把一块贝壳交给海浪,它冲回来的是磨掉棱角的玻璃,而不是贝壳说明书。
所以,关掉教程之后,别急着“写一段更好的提示词”。先低头看看四周:
拍下任意一块,扔进火山引擎,补一句“做成头像”“做成 PPT 背景”“做成护身符”。第一次生成的图可能不像样,但你会亲眼看到“个人垃圾时间”如何被翻译成“公共可见的美学”,再用火山引擎的其他模型做成产品。这比任何课程都更快地告诉你:AI 时代的“原创”,不再是从零到一的创造,而是从生活碎片到可交付产品的翻译——而翻译机已经架好,就等你把碎片投进去,能火的 AI 内容不是脱离现实创造而是加工现实。
如果你愿意,欢迎把你随手拍的“碎片翻译”发到评论区,甚至是用火山引擎把他做成产品。世界早就在我们口袋里,只是需要一次“扔进模型”的动作,才被重新看见,并且被标好了价格。
文章来自于微信公众号“歸藏的AI工具箱”。
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0