这两天,Nano Banana正式上线后,已经刷爆了我的所有社交媒体,而它,现在也成了AI绘图领域,口喷改图的当之无愧的版本真神。
虽然我前几天写过一篇Nano Banana的人物一致性新王Nano Banana登基,AI图片编辑史诗级升级,但当时它还只能在lmarena上抽卡,不是很方便。
而且我觉得,上次写的那篇,因为受制于Imarena的盲测属性,没法把Nano Banana的功力完全发挥出来。
但是现在,无论是推特公众号还是小红书上,都有太多颠覆的例子了,我自己也爽完了两天,说实话,只是改个背景改个服装,已经完全不够用了==
所以今天,再来加更一期,Nano Banana最新用法合集,让大家看看这玩意有多强。
话不多说,直接开始。
最近最出圈的用法,没有之一。
这是提示词:
create a 1/7 scale commercialized figure of thecharacter in the illustration, in a realistic styie and environment.Place the figure on a computer desk, using a circular transparent acrylic base without any text.On the computer screen, display the ZBrush modeling process of the figure.Next to the computer screen, place a BANDAl-style toy packaging box printedwith the original artwork.
我先做了一个芙宁娜。
然后做了一个猫。
NB真的很细,连脏脏的猫脚都还原了。。。
兴致所至,我还做了一个老朋友。
只需要给NB一张你的照片,和你想cos的角色的照片,提示词非常简单:让图一的人物cosplay图二的角色,服饰、妆容、道具和图二一致。
然后你就会得到——
虽然没有完全还原,枪长的不太一样,脖子上的项圈有些微的不同,裤子也不是及膝裤而是长裤。
但整体的效果,还是很对味的,而且服装道具啥的都还挺有质感的。
还是用上面cosplay的栗子。
提示词:让图二的人物做出图一的动作。
NB的理解能力还是有点强的,即使只是给它画一堆火柴人,它也知道你是啥意思。
我还挺喜欢它在金克斯身边加的这几道线条的,感觉多了一些动漫感,有种次元壁打破的感觉。
然后孩子打累了,倒头就睡。。。
是一个对灵魂画手很友好的功能。
然后是这个生成产品内部结构的方式,太酷了。
提示词在此:Ultra-detailed exploded view of a product, metallic parts and electronic components floating in mid-air, perfectly aligned, revealing inner structure, futuristic technology aesthetic, 8K resolution, soft cinematic lighting, highly realistic.
生成完图片之后,还可以用可灵的首尾帧,直接做个视频。
创作之间的衔接非常丝滑。
受到这位大佬的启发,我也试了试转线稿和上色的能力。
提示词:按图一的色卡的配色给图二的线稿上色。
体验就是,非常丝滑。
转线稿我只抽卡了一次就成功了。
上色抽了五六次,最终的结果是这样,不能说完全遵循了色卡,但整体的色调是对的。
另一个还不错的上色案例也放在这里给你们看看。
这个UI界面,也让我觉得很惊艳。
提示词:A fantasy RPG game screenshot, featuring the single main character in the picture standing in the center,handing a book and a torch, detailed ruined temple environment with ancient stone pillars, vines, stained glass windows, glowing magical atmosphere, cinematic lighting. Include RPG-style UI elements: character portrait in the corner, health and mana bar at the top, minimap at the bottom right, dialogue text at the bottom saying "This must be the place...". Highly detailed, anime-inspired game art, immersive atmosphere, ultra quality.
提示词:A galgame visual novel screenshot, set inside a luxurious Rococo-style castle interior, with ornate decorations, chandeliers, golden details, elegant furniture and pastel colors.The single character in the picture stands in the center foreground, anime-style illustration, expressive face. Include galgame UI elements: dialogue text box in english at the bottom with character name displayed, choices menu buttons, clean interface design. Soft lighting, romantic atmosphere, high quality visual novel style artwork.
画面效果是好的,但这张图上的文字我抽了好几次卡还是没法用,文字生成能力,是大香蕉的短板。
提示词:根据图片内容生成九格漫画,用画面和镜头讲故事。
这是NB给到的结果。
还有另一张,虽然画面有瑕疵,但我还挺喜欢它插入闪回的讲故事方式。
提示词:给这个男人生成一张艺术肖像照片,通过半明半暗的打光效果,赋予男人亦正亦邪的特征。
提示词:让这张照片中的天空变成晚霞的颜色,空中有很多鸟在飞,和原图融为一体。
修图的效果,一致性的保持,都很好。
尤其是应县木塔这张,氛围感一下子就出来了。
给被子印上lv老花,身价升级。
提示词:给被子上面印上lv老花。
或者做一张口红广告的海报。
提示词:做一张口红的商品宣传海报,图中的女人手握口红,看向镜头。
在电商这个领域,NB的一致性已经能够让它非常游刃有余地生图了。
NB还有一个很强的地方,就是它有视觉推理能力。
可以给你讲解题目。
也可以帮你把地标照片,p成这种酷炫的AR版本。
我自己也做了一张。
提示词拿好:you are a location-based AR experience generator. highlight [point of interest] in this image and annotate relevant information about it.
最后,总结一下现在的Nano Banana。
比起几天前,用起来方便了很多。
现在你可以直接在Google家的AI Studio和Gemini上用Nano Banana了,网址如下:
https://aistudio.google.com/prompts/new_chat
https://gemini.google.com/
lmarena也有了nano banana的正式版本,不用再抽卡。
lmarena网址:https://lmarena.ai/
还有设计Agent Lovart,第一时间接入了Nano Banana,宣布周末限免,Agent+banana,还是很酷的:
https://www.lovart.ai/
再说一下NB的能力,一致性确实NB。
但是首先还是需要抽卡,得多抽一抽。
然后主体不能多,多个主体还是很容易出问题。比如想把缺席的人p进大合照里,就不太现实。
缺点也有,中文字真的非常拉跨,如果想在图片中加入中文,目前效果断档领先的依然即梦。
另外就是它的画质,确实会压缩。
还好@阿真irene给我推荐了一个网站,可以帮助修复成高清。
https://arc.tencent.com/zh/ai-demos/imgRestore
还有个问题,就是我真的很需要它做个一键重新生成的功能。
否则每次抽卡,都要再次上传图片和提示词,好烦。。。
不过总体来说,Google这次还是非常扬眉吐气的。
犹记得几个月前GPT-4o大显神威的时候,Google发布了用嘴改图的2.0flash,然后惨遭大家忽略,成为AI届汪峰。
但现在Google终于扳回了一城。
这家厂子的底蕴。
还是太恐怖了。
文章来自于微信公众号“数字生命卡兹克”。
【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。
项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file
在线使用:https://aicomicfactory.app/
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0