
前天晚上谷歌推出了基于 Gemini 3 优化后的 Nano Banana Pro 模型,能力大幅提升,而且解决了多语言问题。
我也疯狂玩了两天,搞了一堆案例,刚好看到一向财大气粗的 Lovart 又搞免费活动了,就顺便探索一下这么强的图像生成和编辑模型结合 Agent 会有什么更强的能力,结果还真让我找到几个。
可以帮你生成纸片人老婆到现实场景的照片,可以有想去哪里点哪里的打卡照,以及完爆 NotebookLM 的 PPT 生成。
先介绍一下 Lovart 的活动:
11.21–11.23 这几天 Nano Banana Pro 全员免费使用。
在这期间订阅 Basic 及以上会员,会员有效期能享受Nano Banana Pro 365 天 0 积分无限量使用。
所有现有 Basic 以上等级的会员也会自动获得同样的 365 天 Banana Pro 0 积分权益。
Nano Banana(NB1)、Seedream 4、Midjourney v7现在也在同步享受 365 天 0 积分无限量使用。

上次免费的时候很多朋友反映因为误操作被扣了积分,这次刚好先教一下大家怎么用才能避免调用其他模型导致积分消耗。
首先最稳妥的是在画布里面使用,这里就脱离 Agent 了,可以直接选择模型,上传图片和选择分辨率,如果你就是单纯的图片生成任务可以选这个。
先在左侧浮窗里面找到 Image Generator 这个选项,然后点击之后画布上就会出现一个图片生成区域下方有具体的设置界面,然后正常输入提示词使用就行。

然后就是他们现在支持 @ 指定模型了。你可以在右侧 Agent 的输入框 @ Nano Banana Pro 这模型后面跟上提示词来只使用对应模型。

最后一个方式也是在右侧 Agent 输入框区域,右侧的那个模型选择图标里面只选择你想要的模型就行,这样就不用每次调整了直接说需求就行。

然后我们来看几个我觉得非常适合设计 Agent 跟 Nano Banana Pro 一起完成的例子。
首先是关于 Nano Banana Pro 昨天我看到的热度最高的内容。
将动漫角色跟写实场景结合,而且是多个角色,看起来视觉冲击力很强,好像你的纸片人老婆出来见你了。

这哥们也写了一个提示词,但是写的很复杂,只对当前场景生效,就没想让大伙学会,所以我自己重新探索了一个多步的可控步骤,涉及到 LLM 基于图片推理的提示词生成能力,特别适合 Lovart 玩。
原来需要先在 Gemini 里面处理,然后再去 Nano Banana Pro 反复跳转很麻烦,现在一步搞定。
提示词:
为这个写实的实景场景房间添加多位性格各异的动漫风格女孩,确保房间是写实风格,只有少女为动漫风格。
具体的生成步骤是:先帮我生成一个【XX】 环境的照片。然后基于这张环境图片,添加【 7个】动漫人物,氛围要【热闹】。 输出格式: 请分行详细描述每个人的【装扮 + 动作表情 + 所在位置】
比如我这里就先让他整了一个室内的日本传统一户建屋子的动漫女孩,Lovart 会先生成对应的写实照片,然后再往图片上增加动漫少女,这样就极大程度避免了一次生成导致周围环境也动漫化的问题。

然后整一个室外场景,这里 Lovart 第一次还给室外场景加上了其他真人,所以第二次生成的时候,出现了真人和动漫女孩混合的情况,看起来反差感更强了。

接下来的案例也很有意思,由于 Nano Banana Pro 有检索实时信息的能力,所以他知道现在某个地方的具体位置、天气时间等信息。
所以受 Deepmind 的启发,发现可以直接根据经纬度生成某个非常具体的位置的真实照片,而且还可以加上时间以及天气信息可以让这个照片更加的真实。
创建一幅经纬度位于40.00023661635351, 116.27808154448789并且符合当地当前时间氛围和实时天气的图像,在照片左下角用优美的排版写上当前经纬度以及位置信息和天气图标,并加上一句中文位置介绍文案。
比如这里这个黄石公园的位置信息,他就直接获取了时间判断现在还是夜晚,同时刚下完雪零下四度有点冷,整个照片的真实感一下就上来了。
而且我也测试了,这个经纬度大部分时间获取的地理位置还是准的,就一次把五台山飘到忻州了,也不是很离谱,其他几次我测试的结果都是对的。

在之后就有群友说不行直接加上一个人像然后选个地址做打卡照吧,哈哈。
于是我就写了一个网页来做这个事情,直接上传照片选择地址就可以帮你生成非常真实的打卡照片。
后来发现这个事情在 Lovart 根本就不需要开发,直接就可以搞定,说一下咋做。
首先你需要打开谷歌地图,找到你你想要去的位置,搜索也行随便扒拉一个位置,也行,然后邮件复制所选位置的经纬度。

获取到经纬度之后改掉下面提示词里面的经纬度,然后输入提示词和你的照片给 Lovart 就行。
提示词:
用 Nano Banana Pro 为这个人物创建一幅经纬度位于44.72067014987598, -110.85475719935745 并且符合当地当前时间氛围和实时天气的打卡照片,这个里边他的衣服穿着,需要根据所在地的这个风格去匹配。比如说雪山,它就是登山的衣服。比如说在都市里,它就是比较休闲的衣服, 在照片左下角用优美的排版写上当前经纬度以及位置信息和天气图标,并加上一句位置介绍文案。
这里需要注意的是,如果你是从 Lovart 的右侧 Agent 输入框输入的提示词,那么图片的文字和图标水印就是 Lovart 用前端的方式渲染上去的,优点是文字清晰度高,缺点是变化少,比如红框这两张。
如果你需要 Nano Banana Pro 直接生成水印内容可以用我们之前说的左侧浮窗 Image Generator 的方式生成。

感觉这个玩法会非常出圈,因为实在是太方便了,想去哪里点哪里就行,依托于 Nano Banana Pro 这次强大的一致性保持能力,生成的人像真的很像。
我还在提示词里让他根据所在位置搭配对应的衣服,搭配实时的时间和天气信息,这样看起来违和感就更加少了。
最后回到我们 Nano Banana Pro 和 Lovart 这种最擅长的内容拆解和文字处理能力,前几天 NotebookLM 上线了使用 Nano Banana Pro 驱动的 PPT 生成能力,X 上很多人玩。

我今天尝试了一下,Lovart 完全可以实现一样的 PPT 生成能力,而且更加强大!
我整理了几套 PPT 风格,你直接提示词后面加上对应的文章就可以一键生成一整套完整的PPT。
结合 Lovart 的画布功能还可以想改哪页改哪页,这不比 NotebookLM 的一锤子买卖强多了。
手绘板书风格 Lovart PPT 生成提示词:
帮我根据下面这个文章做一套中学生都能理解的PPT。
先写1个PPT大纲,规划出每一页的PPT的内容。
然后将每一页的PPT内容分别扔给Nana Banana pro生成对应页面的PPT,需要确保风格一致。
PPT的具体风格应改为教授手写拼贴画和白板风格。
文字和图像都由 Nano Banana Pro 生成,另外不要将PPT 变成一整张图,一页一张生成。
文章内容为:「此处填写文章内容」

迪特拉姆斯极简风格 Lovart PPT 生成提示词:
帮我根据下面这个文章做一套中学生都能理解的PPT。
先写1个PPT大纲,规划出每一页的PPT的内容。
然后将每一页的PPT内容分别扔给Nana Banana pro生成对应页面的PPT,需要确保风格一致。
PPT的具体风格应该为迪特拉姆斯的设计风格(Dieter Rams)。
主色调: 哑光白(Matte White)、浅灰(Light Grey)、黑色。
点缀色: 鲜艳的橙色(通常用于开关或关键操作按钮)和绿色。
表面通常干净、平滑,没有任何多余的装饰性纹理。
严谨的网格系统布局。圆角矩形(但圆角半径通常很小,看起来很硬朗)。控制钮、滑块、排气孔的排列极其整齐,具有数学般的美感。
文字和图像都由 Nano Banana Pro 生成,另外不要将PPT 变成一整张图,一页一张生成。
文章内容为:「此处填写文章内容」

英雄联盟 UI 风格 Lovart PPT 生成提示词:
帮我根据下面这个文章做一套中学生都能理解的PPT。
先写1个PPT大纲,规划出每一页的PPT的内容。
然后将每一页的PPT内容分别扔给Nana Banana pro生成对应页面的PPT,需要确保风格一致。
PPT的具体风格应该为英雄联盟的游戏UI风格。
文字和图像都由 Nano Banana Pro 生成,另外不要将PPT 变成一整张图,一页一张生成。
文章内容为:「此处填写文章内容」

渐变色便当盒风格 Lovart PPT 生成提示词:
帮我根据下面这个论文介绍做一套中学生都能理解的PPT。
先写1个PPT大纲,规划出每一页的PPT的内容。
然后将每一页的PPT内容分别扔给Nana Banana pro生成对应页面的PPT,需要确保风格一致。
PPT的具体风格应该为Bento grid layout,苹果总结幻灯片风格,模块化设计,圆角方块,UI 界面仪表盘,柔和阴影,有组织的构图,信息图表风格,深色模式(或浅色模式),科技产品功能总结,等轴测视图。
文字和图像都由 Nano Banana Pro 生成,另外不要将PPT 变成一整张图,一页一张生成。
文章内容为:「此处填写文章内容」

赛博手绘风格 Lovart PPT 生成提示词:
帮我根据下面这个文章做一套中学生都能理解的PPT。
先写1个PPT大纲,规划出每一页的PPT的内容。
然后将每一页的PPT内容分别扔给Nana Banana pro生成对应页面的PPT,需要确保风格一致。
PPT的具体风格应该为图形记录风格,手写赛博朋克风,适当增加故事性的图像和图表。
文字和图像都由 Nano Banana Pro 生成,另外不要将PPT 变成一整张图,一页一张生成。
文章内容为:「此处填写文章内容」

由于 Lovart 他比较下本,生成的图片分辨率比 NotebookLM 要高很多,这就导致文本信息会比 NotebookLM 清晰的多,文字渲染出问题的比例也很少。
如果你有自己需要的风格想要改提示词的话,可以把风格那部分改掉就行。
之前有很多人焦虑说模型越来越强的话,可能会挤占 Agent 的生成空间。我这个文章看完,你可能会有不同的想法。
这个东西我感觉是一个相辅相成的事情,模型越强 Agent 理应会更加的强大,需要做的就是做好适配,在 Agent 优化中区分那部分是必须要做的哪部分模型自己知道,少即是多,有时候不做事比做事更难。
很明显在接入了 Lovart 以后,Nano banana pro这个模型在批量生成、一致性保持以及调用更多能力上,都让它本身的能力获得了极大的放大和增强。
好了,今天内容就是这些。
文章来自于“歸藏的AI工具箱”,作者 “歸藏的AI工具箱”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0