今天是 2024 年的最后一天。
对于即将到来的 2025 年,你许下了什么新年心愿呢?
小布的愿望是做一个有钱又有趣的人,实在不行,光有钱也行。
怎么才能变有钱呢?有的人靠实力,咱们靠的是想象力。
新的一年,只想把脑袋里的钱,转到我的银行卡里去。或许不能立刻就变得富有,但至少可以让数字世界里的自己先沾沾喜气。
I want it,I got it,在让幻觉成真这件事上,AI 有的是力气和手段。
愿人刚回到工位,迎头就撞上泼天的富贵?
愿逆风如解意,大风吹来十亿人民币?
愿作人间富贵花,时时刻刻都有钱花?
嘿嘿,谢谢即梦,写了两句提示词,怎么就把我的平行宇宙抽出来了?
朋友圈背景、动态壁纸都换上了,新年新气象,每次解锁手机,都在提醒自己:已和财富建立全天候战略伙伴关系。
即梦网页端和 App 端每天都能领免费积分/使用次数,记得日常打卡哦!
网页端传送门:https://jimeng.jianying.com/ai-tool/home/
移动互联网的兴起,也是一场视觉表达的进化史。
表情包就见证了这场演变,从纯文字:) 到 emoji🤔️,再到有图文配合的 gif,现在还发展出了集声画配字于一体的猫 meme......
随着我们的聊天框越来越“能装”,一张小小的图里塞满了绘画、文字、动效。一张图承载的信息越来越多,一帧画面可以表达的内容也越来越丰富。
不知不觉中,我们越来越需要加工过的图片,拍照要琢磨角度和光线,发朋友圈讲究排版和仪式感,吐槽 TGA 还想自己 P 个梗图。
但把脑海中的创意转化为高级的视觉效果,并不简单。从构图到配色,从素材选择到文字排版,也离不开审美积累和专业软件技能。
直到 AI 出现,才让这件事有了转机。
在众多 AIGC 平台中,即梦可以说是来势汹汹。
自今年 2 月开放内测以来,坐拥字节强大的技术背景,即梦的更新速度就像是它的 Logo —— 一个陀螺,卷个不停,月月都有新惊喜。
最近上新的“智能参考”和“文字海报”功能,更是把 AI 生图的强度拉到了随身创意工作室的水平。
“智能参考”相当于把 P 图软件简化成了聊天框,还能轻松实现这些软件做不到的效果。
不需要提示词,一句:“下雪了,大雪纷飞,雪铺满地”,AI 就能精准理解。
让自嘲“落粉肠都冇可能落雪”的广州,沉浸在银装素裹的童话里。
对比看更加明显,点到哪里改哪里,就是这么准确,连天空颜色的分层都一模一样,几乎没有影响原图的其他细节。
那么,以前是只要心态好,办公室也是巴厘岛,现在是即梦玩得好,分分钟变身度假照。
原图/把背景改成世界各地的知名景观
表情不够自然?不用费心。今天这身搭配不够出彩?换件衣服的事。“智能参考”都能让美美的写真照片规模化量产。
而独家的中文“文字海报”功能,选择输入一句话就能生成有设计感的中英文海报。
面对这样的“大白话”,即梦给我们的海报,画风和设计感都很不错:
提示词:一幅以“小寒”节气为主题的中国风海报,风格简约大气,海报上写有文字“小寒”
进阶一下提示词,就做出了“大师级”作品:
提示词:黑白电影海报,东方禅意意境,电影主题文字苍劲有力的书法毛笔字“影”,巨大的字体,肆意挥洒笔触,意境深远,大面积留白,禅意,空灵,细沙铺成的太极图案枯山水地面,侠客在太极图案上比剑道,极简主义,主题文字下面红色英文:SHADOW,获奖 icon,极致电影构图,大面积留白,三分之二空白,无限想象空间,高清输出,32K,HDR
换句话说,这相当于请来了一组 PS、AI、ID Adobe 全家桶得玩得溜,构图、配色、排版的美学修养过关,字体搭配和版式设计都在线的设计团队。
上新了的即梦把这几件事“看起来很难”变成了“我也会啊”。
先说提示词这件事。
AI 生图和 ChatBot 完全不一样。面对输入框的时候,可能我们脑子里只有一个大致的概念,比如我想要一份论文的写作提纲,或我想要一张梦核风格的 hello kitty 头像。
ChatBot 会把逐渐把抽象落实具体。但图像模型不擅长于此,因此我们印象中的生图提示词都特别长,要考虑主体、构图、背景、风格、光效.....;风格又分现代、复古、艺术、潮流......;其中现代风格一项又可以分出极简主义、未来科技、扁平化、大胆色彩、视觉碰撞.....
好的,师傅别念了,还没说到最痛的呢 —— 写完这么长的提示词,还得等好一会儿才能看出图效果。
但即梦不一样:
1. 「图片 2.1 模型」的指令理解力更强了,情绪起伏、成语意境,都能准确理解并呈现。
2. 还支持导入参考图,可以分别参考示例的主体、人物长相、角色特征、风格、边缘轮廓、景深、人物姿势,且参考强度可调。(类似于两个语言不通的人本来在靠翻译软件问路,现在他们之间有了导航(参考图),可以从各个维度给模型一个参考思路)
3. 没有灵感,完全不会写提示词,还可以在即梦的社区一键 get 同款。
“做同款”全过程.vcr
提示词:金箔岩彩,工笔山水画,长烟一空,皓月千里,浮光跃金,静影沉璧,渔歌互答,此乐何极,高对比度,高饱和度
即使把《岳阳楼记》这样的古文摘出来当提示词,即梦也能理解到位。千年之隔,也能与古人共此明月。
提示词:三维古风,白色丝绸,透明纱幔,发光诗词,诗词在透明的纱幔上,平铺画面,一个极小的人行走在丝绢上,发光丝绢,无限想象力,幻雾感,折射阳光,大面积留白,高清
若将诗词刻于轻纱,文字会如何流光溢彩?虽难以想象,却在即梦笔下,化作了一幅幅灵动的画卷。
第二是丰富的应用场景。就算是专业设计师,也很难精通插图、原画、IP、3D、包装、海报等所有领域。
但即梦做到了小白绝对友好 —— 表情包、红包封面、产品海报,说什么画什么。
想要什么,几秒搞定,效率直接拉满,随心实现头像、壁纸自由。
表情包
提示词:Q 版画风,萌系,简约风,高级感,梦幻感,夏之光 Q 版,可爱画风,表情分别为大笑,淘气,捂嘴,疑惑,委屈,伤心,暴富,谢谢红包,爱你。纯白背景,表情包设计,超高清,超细节,灯光明亮提示词:Q 版画风,萌系,简约风,高级感,梦幻感,夏之光 Q 版,可爱画风,表情分别为大笑,淘气,捂嘴,疑惑,委屈,伤心,暴富,谢谢红包,爱你。纯白背景,表情包设计,超高清,超细节,灯光明亮
红包封面
提示词:岩彩绘画,对立平衡,蒙太奇摄影,决定性瞬间,丝网印刷,拼贴,正负形设计,插画动画,氛围感,新年氛围,偷感小猫,文字“拜年了”的红包封面
壁纸
提示词:一束光线照在正在草地上奔跑的人身上,呈现出迷人的光影效果、充满韵律的光影变化,带有颗粒感。极简主义风格,运动模糊形式,以大光圈乃至超大光圈进行拍摄,极致的光影效果无比真实,柔和的光线恰到好处。高级艺术性,高品质电影质感
电商海报
提示词:巧克力蛋糕新品海报,小清新风格,45 度俯拍视角,柔和自然光,黄色小清新色调,虚化背景,突出甜点质感,留白设计,文案"纵享丝滑",优雅字体,简约排版,右下角添加价格"¥68",不要添加其他文字
以上这些,都是我用“做同款”功能做的,看完这些结果,特别是这个和某宝详情页长得差不多的海报。
只想问,这是我,一个现搜提示词现写稿的小白配做出来的吗?
第三是设计的灵魂在线。虽然市面上的 AI 画师已经很多,如果攻击它们最薄弱的环节,那还是没有设计感。
抓眼球的视觉设计、清晰的信息传达、产品理念与美观的融合,即梦已经游刃有余。
最后是专业工作流的封装打包。
扩图、重绘这些进阶技能?已是标配。消除笔、局部重绘、涂一涂就能轻松修复 AI 的小失误。
实时画布还能分图层生成。
我们可以上传简笔画、参考图,还可以用即梦生成线稿,用提示词实时修改画面,更可控地画出心中所想。
拖动左边两个图层的位置关系,右边的画面也会随时改变,背景、主体可以分别优化,构图可以灵活调整,我们能更自如地把控画面效果
在产品设计上,即梦做到了入门时,零门槛就能 get 专业效果;想进阶,丰富的工具链又为创作保留了无限可能。
据特工们向业内人士了解,即梦目前是 AI 商业短片的主力工具,主要原因有三:成本更低,效果稳定,功能够全。
只需自然语言及图片输入,就能生成高质量的图像及视频,还拥有故事创作模式、首尾帧、对口型、运镜控制、速度控制等 AI 编辑的能力,视频质量更上一层楼。
就在一个月前,字节旗下视频生成模型 PixelDance(P2.0 pro)和Seaweed(S2.0 pro)在即梦网页版和 App 全量上线。
新升级的模型,有极致运镜、组合多镜头的能力,与人类交互中能够严格地服从 Prompt、理解复杂 Prompt,生成的视频质量也更可控。
具体来说,P2.0 pro 模型具有极高的“提示词遵循能力”,即使输入很复杂的提示词,它也能听懂并生成视频。
为了增加难度,我没有用长度来定义“提示词的复杂度”。毕竟,给 AI 最大的发挥空间,才能以实力见真章。
以下视频均由在即梦 AI 视频的页面选择,文生视频,输入提示词,选择「视频 P2.0 Pro 模型」生成得来。
提示词:镜头环绕 bb 霜拍摄,镜头不固定
看来 P2.0 pro 读出了我的潜台词,做出了广告大片满满的高级感。(更令人印象深刻的是,BB 霜上的字也没有闪烁或变糊!)
虽然下面的这段提示词看起来也不复杂,但它要求模型切两次镜头,由于扩散模型的生成机制,每次镜头切换都相当于一次新的场景重建任务,需要同时确保时空一致性和视觉连贯性。
一个包含两次切换的镜头序列,实际上要求模型在维持人物特征识别的同时,处理三组独立场景的透视关系和光影变换。
提示词:穿校服的女生和拿着画板的男生在美术教室相遇。镜头切换,特写女生看画时惊喜的表情。镜头切换,近景拍摄男生画画时专注的样子
要说人类社会什么最复杂,那可能就是情绪了,麦麦一上节目,流量超越一线明星,说到底还是那阴晴不定捉摸不透的情绪。
提示词:两个女生先无奈地笑,然后紧张地注视对方
这段镜头中,人物面部表情变化自然,没有任何虚化崩坏,AI 演员将笑中带着的无奈与紧张氛围层层递进,演绎出微妙的情绪张力。
另一边,S2.0 pro 模型具有超高的首帧一致性和画质表现。
其生成能力,也是一等一的存在,只需 60 秒内就能生成一段 5 秒的高质量 AI 视频,市场上其他 AI 视频生成工具少则需要等待 3-5 分钟的生成时间。
在快速生成视频的同时,S2.0 模型确保了动作的流畅性和画质的稳定性,生成的视频效果自然和逼真。
交给动画师做这样的跨年动态海报,Ta 会告诉你:“我起码要做一个下午”,而交给即梦,真的不超过 5 分钟。
嗒哒,一个适合跨年夜发给朋友的动态海报就做好了,还可以在剪映里转成 live 图哦~
同样的步骤,手办也可以“活过来”,成为真实世界中的“马猴烧酒”。
特斯拉前人工智能自动驾驶总监 Karpathy 在玩视频生成的时候曾感叹,最耗费时间精力的不是想 Prompt,而是做一个视频需要打开几十个网页,一个写脚本,一个做画面,一个生图,一个生成视频画面,一个做音效,一个平台的点数抽卡抽完了还要换一个,要是有平台能统一这些功能就好了。
即梦用行动诠释了自己的定位:一站式智能创作平台,每一个字都恰如其分。
比如,你刚刚生成的图,不需要再做多余的动作,它就可以成为参考图,自动进入生图或视频生成的工作流中。
而点开即梦的网页端或者 App 首页,无论是视频还是图片,都能一键套用模版。
这让我想起了 2016 年刚上线的抖音,同样也提供了许多拍视频的模版,比如滤镜、特效、音乐库等,即使是普通用户也能快速制作出有趣的短视频作品。
这无疑降低了内容创作的门槛,激发社区的创意,也为抖音带来了正反馈。
后面的故事我们很熟悉,抖音成为了国内最炙手可热的短视频社交应用软件,成为了人人艳羡的对象,抖音制定了竖屏短视频的法则,其他软件更新甚至都要为了更像抖音一点而调整按钮和界面。
截至 2024 年 9 月,抖音短视频行业的月活跃用户规模已经突破 10 亿大关,达到了 10.26 亿人次;月人均使用时长为 59.7 小时,也就是说,中国有 10 亿人平均每天刷 2 个小时的短视频。
目前,即梦 App 和网页端都已上线“短片”分区,以和抖音一致的瀑布流的形式展,我们可以在手机上刷 AIGC 版本的抖音了。
不用等到不确定的未来,现在我们就已经可以在 AIGC 版本的“抖音”,让天马行空的幻想落地。在社区里,我们不仅能欣赏优秀作品获取灵感,还能通过交流互动,快速将零散的知识转化为实用技能。
看看这个组合:领先的技术实力、更极致的产品体验、活跃的创作社区,以及即梦 AI 与抖音、剪映一起构建的从创作到传播的完整生态。
即梦成为下一个爆发的“抖音”,似乎也非常值得期待。
特工们联手即梦准备了一波年末福利!
我们用即梦 AI 生成了一张神秘书籍封面,快来猜猜它们分别对应哪本书?率先在评论区猜对的小伙伴,将获得对应实体书一本!
文章来自微信公众号“特工宇宙”,作者“特工小布”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0