100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了
7929点击    2025-06-07 10:50

前段时间,我们横向对比了即梦3.0、2.1、GPT4o的海报生成能力,


当时即梦3.0的文生图中文能力就已经超过了 GPT4o,我们通过提示语就可以控制字体的样式、位置、大小、排版等等。


那时候我们就感叹,就缺个图生图啊!


让我把之前囤的好图、设计好的IP、logo等等都来个二次加工,


毕竟文生图再强,却不能实现现实世界已有的产品或图片的“从有到优”,实在是真真真遗憾啊!


昨天下午可算蹲到了内测,即梦3.0图片模型更新了智能参考功能,

100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

UI也换了 更好看了


直接上!效!果!


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

原图和图生图效果对比


这些图,全部一句话一次就搞定了!


这个原图的风格和一致性保持,是我目前用过最好的垫图,而且还有了即梦3.0的中文能力加持,真的太有意思了。


这么多好玩的效果太值得来一期100镜了!


于是我点了个超大杯万里木兰(熬夜),按照难度分为添加文字修改文字复杂设计以及原图一致性保持四个方面直接大开测!


顺带提一句,即梦3AI视频首尾帧也在内测了,许愿大家都能抽到!这次的图片和提示语也都打包起来了,公众号回复即梦海报就行


01|添加文字


我们先拿了一批“空白梗图”来试水。


你们懂的,作为一个日常用梗高手,手机相册里永远存着数百张等待投放的表情包。


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


但每次打开PS给表情包加文字都感觉像是“大炮打蚊子”,打开手机上的那些app也只能加最简单的文字,好多花样都搞不来。


终于,我现在能用一句话就能做自己的表情包了,只需要用这句:


在这张图的xx位置上加上xxx字体的文字“xxxxx”


就这么简单,然后你就可以获得:


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

左为原图 右为即梦垫图生成


不仅文字会在规定的位置填写好,而且图片的一致性保持的非常好,几乎和原图完全一样,


最重要的是,添加的文字不管是字体还是颜色还是样式都和原图完!美!融!合!在!一!起!


这就不是随便什么app能做到的了,放在之前是完全需要用ps的程度,


现在一句话就成了。


02|修改文字


过去在一张不分层的原始图片上改字非常麻烦,


得先把文字抠掉、填充背景、再把文字做成相应的样式,添加到原图上,这过程听着就够累人的了。


那我们这次试试看能不能也用一句话取代原本的工作流。


先来一张简单的:


把文字改成同样风格字体的“即梦更新”

100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


我感觉这个图小时候抱过我,这味儿也太对了吧,而且这个提示语也太简单了。。。。


同样的,我们还可以:


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

改标示牌


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

复用喜欢的字体


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

改书法


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

假装名人名言(偷笑


如果我不说,你能猜出这些图哪些是原图吗?


即使是更复杂的的图片也可以在保持原本图片的元素上做到修改其中的文字,比如说路标:


把三角形路标中的logo去掉然后重新画一个AI机器人logo,把黄色路牌中的文字改成“此处常有AI出没”“保护好你的脑子”

100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


把标志中的文字都去掉,然后改成“你在干嘛 还不睡吗 别卷了”,“what are you doing now? Sleep  please!”,“何してるの?まだ寝てないの?”

100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


Amazing啊!我每搞出来一张图脑子里都会响起“这就行了?”的声音,


这我还能说什么呢,以前一张图都得我搞好几个小时,现在真的一句话就行了。


至少在我这种PS半吊子选手这里,真的可以告别PS了。


03|复杂设计


如果说上面两趴,是我以前使使劲还能用PS熬上个把个小时就能做出来的程度,那做海报,就是我这种非专业设计无法企及的高度。


没有系统学习过构图、排版等等专业设计知识,真的做出来的东西都是不好用的。之前即梦也能做中文海报,但是因为无法沿用产品、写实图片等等原因,也有一种纸上谈兵之感。


不过,现在的即梦重生归来了!


电商新品海报,主打“夏日居家仪式感”。画面以冰蓝色为主色调,搭配银灰色与薄荷绿点缀。主标题超大字号居中:“冷萃自由·醒着做梦”,使用凌厉的几何无衬线字体;副标题在左上角:“0热感咖啡机 佛系养生必备”。  
右上角贴橙色渐变标签:“反卷青年俱乐部”。底部促销区:左为品牌Logo“CHILLBREW”,右为平台信息“抖音 搜索#冰感研究所”。背景巧妙融入半透明波浪纹、气泡元素,以及slogan“焦虑溶解计划”,画面清爽有呼吸感。

100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


这真的不是已经在投入使用的海报吗?连某抖的风格都延续了,


设计感、文字稳定、还有产品的一致性保持,我个人感觉是电商完全可以直接拿来使用的程度,


为了测试这不是偶然,我还做了一个科技感耳机海报和可爱风格抱枕海报:


电商促销海报设计,以清新活泼的绿色为主背景,主体物是‘榴莲抱枕’,带白色描边,整体色调鲜明活泼。主标题‘可爱能当饭吃’,使用粗体无衬线字体居中;副标题‘香浓好物 榴莲抱枕’位于右上角,字体简约清晰。上方粉色标签文字‘奖励型人格’,下方标注‘好闺闺送我!’、‘Fruity Home’、‘Good Things Conference’,使用无衬线印刷体,排版整齐。底部保留‘抖音商城 618好东西大会’,配以搜索框图标。背景添二维码及英文词汇‘INFINITE VARIETY CURIOSITY & INTEREST’,整体构图层次分明,体现年轻化电商风格。

100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


电商促销海报设计,主体为白色无线耳机,采用悬浮式展示,画面以深蓝色为主色调,搭配霓虹粉点缀,背景有科技感网格线条。主标题是"声临其境 随心而听",采用未来感sans-serif字体,位于画面上方;副标题为"新一代降噪黑科技",位于耳机图片下方。左上角有限时标签"618特惠 低至5折",右下角配有"沉浸式体验"的标注,采用霓虹字效果。底部包含"全网最低价 立即抢购"以及"科技先锋系列"的促销标语,旁边有小程序码和"扫码立减50元"提示。增加抖音元素和"直播间减100"标签,整体构图层次分明,科技感十足。

100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


文字多起来就是会有一部分稳定性不太够,但是产品图的沿用,以及海报设计风格和排版都可以作为美工灵感拿来直接用,甚至直接在即梦内再多轮修改文字都可以。


我还玩了一组名画直播和玩梗系列,感觉也非常适合现在的社媒sense:


蒙娜丽莎来到直播间!背景换成粉色梦幻直播间打赏墙(闪烁“火箭”、“嘉年华”特效),她正面对镜头微笑手里拿着的商品是一个像素风格的“神秘微笑”联名款充电宝。屏幕上飘过弹幕:“这笑容真的值了!”、“家人们冲!”、“求同款!”。

100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


直播视频截图,图中人物半侧脸对镜头,耳环改变为智能可发光"珍珠Pro Max耳机",手中拿着化妆片正在化妆,化妆台上摆满"维米尔联名款"彩妆,包括"透光珍珠高光"、"荷兰少女粉底"。手机屏幕显示直播数据:"在线56.8万"。弹幕滚动:"这款高光也太会打亮了吧!"、"姐妹们这个蓝头巾可以当遮瑕!"、"求耳环同款链接!"。桌角有精美包装盒

100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


替换图中背景为“北京地铁西二旗早高峰”!画中人物穿着西装在中心,周围皆是表情麻木、看手机的打工人。背景恐怖的天空换成地铁隧道灯光和闪烁的站点信息屏(显示“下一站:西二旗”,“请挤挤再上”)。站台上悬挂着巨大的口号标语:“努力奋斗 快乐工作!”(字迹略带嘲讽扭曲感)。空中飘着几个气泡弹幕:“我的工位呢?!”、“钉钉别响了!”、“地铁坐过站了!”,保持原画配色风格。

100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


我甚至还用自己的图做了一组短视频封面,感觉我要解放自己的双手了:


生成一个短视频封面,人物周边有一些艺术设计,主标题是“这个AI工具”“让我10分钟做完周报”,周围散落着一些和主标题相关的图标,还有一些emoji表情,标题需要强调放大重点文字,专业的封面排版设计,吸睛封面设计,戏剧化展现,高对比度吸睛封面

100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


小遗憾就是,目前对于这种对于人物原图修改元素较多的图片,人脸的一致性还是稍微差了一点,有种又像又不像的感觉。


但如果对于图片比例和元素修改不多的话,人脸的一致性保持就又很强了!


让我们来看下一趴!


04|原图一致性保持


上面我们已经多次感叹,即梦3.0的智能参考对于原图一致性的保持真的强,


但人脸其实一直是垫图生成的弊病,上面我做短视频封面的时候还是能感受到人脸有点变化,


但是,我在测试的时候又发现,只要对原图不做特别多比例和元素的修改,人脸的一致性还是非常之强!


我们来看这张图,记住他们的脸


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

原图


接下里我要变魔术了:


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

人物消失术


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

角色添加术


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

画风转换术


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

滤镜更改术


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

变装变季节


仔细看这些图的人脸真的可以说一模一样,


我直观的用一个视频来给大家对比一下:


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


非常明显了,我甚至怀疑即梦是抠图做的生成,期待在多元素增加或者修改时,人脸保持还能够保持的更一致。


说到这了,还是照例教教大家怎么使用。


目前即梦3.0图片模型的智能参考功能,还在内测中,会陆续给大家开放,可以蹲蹲官方消息,或者随时看看自己的页面有没有灰度到:


1.选择图片生成,点击这个上传图片框


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


2.上传图片,选择智能参考


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


3.然后选择图片3.0模型,输入提示语就可以了


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


还是熟悉的两积分,熟悉的性价比。顶流也来凑个热闹。


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了


写在最后


有些更新,是一眼惊艳;


而有些更新,是压抑许久之后,终于把“还差这一口气”的事情给补上了。


即梦3图生海报,就是后者。


我知道很多人跟我一样:


你会写 prompt,会做品牌调性管理,你甚至做了很多 IP 世界观设定,有了很多文案 、logo 的灵感。


你差的,就只是一个能“把好图好字二次创作”的出口。


即梦3.0图片模型的智能参考,就是这个出口。


从今天起,你积累的每一张好图,每一套设计好的 IP,每一个细节完美的 Logo,都会有更新的生命力。


我已经不在意它比 GPT-4o 准一点,还是快一点。


我只在意:


它好懂我。


文章来自公众号“卡尔的AI沃茨”,作者“阿汤 & 卡尔”


100镜实测即梦3.0新功能“看图改图”,一致性精细到头发丝级了

关键词: AI , 即梦 , AI制图 , AI PS
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

4
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales