新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)
7649点击    2025-03-13 21:33


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


自从在一支烟花群里和朋友测试起 Google 这个新工具,一上午就没停下来 WOC 的感叹。


Google 总算放出了他们去年承诺的“可连续对话改图”的 Gemini 文生图能力。


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


照例先给总体评价:


  1. Gemini (或者说 Imagen3)是当下最值得全设计行业,甚至全碳基社会使用的文生图 AI
  2. 它在自然语言的修改指令理解、材质质感复现、局部细节微调方面,达到了部分生产创作环节完全可用的水准(当然也有些 Case 还差点意思)
  3. 这几乎可以算 AI 许愿机、超级嘴炮魔法了,甚至说句“快变天了”不为过 🥲


特别的,如果你是设计行业、内容创作相关的朋友,请务必要刷完本文。(文末附有 Gemini 使用指南)


本文将用 4 项能力测试,5 个应用案例,带你理解 Gemini 的能力边界。


主要测试,挑战 AI 能力边界

主测试 1:简单形体的材质变换、连续微调形态细节,并大幅度改变视角


先用一些变态的 Case 开始,测试 Gemini 文生图的能力边界。


这是我测试的第一个 Case,因为一上来也不知道它到底边界在哪,先从简单的形体开始,让它画个正方体。⬇️


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


整个 Case 看下来非常连贯,指令理解到位,材质变换没问题,基础形态从未变形,甚至还能大幅更改相机视角,添加模特也完全没问题。


💬

PS:我说这个“简单” Case 已经秒了其他的所有文生图 AI,不过分吧。


主测试 2:手绘稿转设计渲染图,顺便拍出产品宣传图


继续测,在测试 1 的基础上,我们上到设计生产级别,用一张手绘图打底,让 Gemini 完成全流程的产品造型概念设计推敲。


这个应该是很多设计公司在乎的 Case:


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


这张图已经是最好的证明,感觉也不需要多说什么解读的话语了。


💬


如果你看到这里,也发出了“WOC”的感慨——非常感谢你点赞、转发、在看、评论本文。


虽然在实测中,在产品穿到人身上这不算稳定,总会带着一些人像与产品的变形。


就这手稿转 3D 产品渲染图,还能再微调局部设计的水平,已经完全超出本科设计专业的毕业生水平(对,因为我自己就是工业设计毕业的)


还能快速在概念设计阶段,生成模特使用场景图,进一步验证设计方案的效果。


对了, 如果你还不服气,我再补一句:每张图的生成时间不超过 10s……这还不算“炸裂”,那还有什么算呢?


主测试 3:一次性生成多套不同风格的设计


我发誓,这是本文最后一个工业设计的 Case 了,后面还有游戏设计、自媒体应用等更多元的 Case,一个比一个精彩。⬇️


💬


我其实一贯 AI 评测挺克制的,但在测试 Gemini 文生图的 4 小时内,基本每分钟都在发出粗鄙的感慨……


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


这个 Case 就是进一步模拟工业设计的造型推敲环节。


原本我们会需要大量的时间在犀牛(一套工业设计建模软件)中花数天时间建模,再花数天在 keyshot(一套工业设计渲染软件)中调整材质、打光出图。


而且一旦建模完成后,想要再对模型进行造型调整,简直是对设计师无尽的折磨。


现在,Gemini 在 20s 内就给你一次性生成 12 张 🥲 ……


主测试 4:抠图、换背景、打光影


搞定了产品设计,正常商业流程中,我们还要解决一下最终宣发的物料问题。


这时候离不开抠图、换背景、打光影拍照的工作流程。


先抠个图,无中生有地换背景:


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


没问题,换的非常好。


再看看商业级别的背景合成与打光:


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


再引用一个 WaytoAGI 上看到的例子:


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


绝了,每次都只用一句嘴炮,就能在 10s 内取得相当稳定的预期结果。甚至复杂的形体打光,也能做的有模有样。


OK,fine,测到这里,我只想说:


——大碳奸恭迎硅基老爷重塑人类社会。


社区实例一览


💬


再看一些社区里大家在尝试的应用实例,也帮助我们获得更多启发


更多应用 1:游戏角色与道具设计


对游戏行业可能的影响与启发之一:游戏内容设计(来自群友 @z.z.h


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


更多应用 2:家装设计


来自群友 @Zhenyuan_Branton,家装设计也不含糊,你也可以直接把自己的手稿、房子照片拍给它,让它自己添加家具,完成设计推演。


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


更多应用 3:创作教育、自媒体内容素材


如果 Gemini 这么强的能力,用在教育、自媒体内容创作领域呢?


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


更多应用 4:漫画绘制与改色


来自推特 @Linaqruf:


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


更多应用 5:游戏复杂场景与动作变换预览


来自推特 @Cristian Peñas:


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


如何使用?


  1. 登录 Google AI studio,链接:https://aistudio.google.com/prompts/new_chat
  2. 在 Model 中选择 PREVIEW - Gemini 2.0 Flash Experimental(new)


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


3. 确认选择「Images and text」


新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)


好,接下来也和我一起参与到恭迎硅基老爷重塑人类社会的行列吧~


Btw:我有个设计师朋友对此评价


—— 以前我可以假装建模、抠图磨洋工,现在老板只会跟我说赶紧 AI 生产改完发他了。


害!



文章来自微信公众号 “ 一泽Eze “,作者 一泽Eze



新版 Gemini 实测:堪称降维打击(含:4项能力测试,5个应用案例)




关键词: Gemini , Ai作图 , 文生图 , 谷歌AI
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。

项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file

在线使用:https://aicomicfactory.app/

2
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

3
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0