
「香蕉革命」首揭秘!谷歌疯狂工程师死磕文字渲染,竟意外炼出最强模型
「香蕉革命」首揭秘!谷歌疯狂工程师死磕文字渲染,竟意外炼出最强模型谷歌最新图像模型nano banana横空出世,它不仅能融合多张图片拼接出全新画面,还能理解地理、建筑与物理结构,甚至将二维地图转化为三维景观。凭借Gemini的世界知识与交错生成技术,模型实现了「有记忆」的多轮创作,带来极高一致性与创造力。nano banana正在重塑AI图像生成的边界,也引发了「AI创意伙伴」未来的无限遐想。
谷歌最新图像模型nano banana横空出世,它不仅能融合多张图片拼接出全新画面,还能理解地理、建筑与物理结构,甚至将二维地图转化为三维景观。凭借Gemini的世界知识与交错生成技术,模型实现了「有记忆」的多轮创作,带来极高一致性与创造力。nano banana正在重塑AI图像生成的边界,也引发了「AI创意伙伴」未来的无限遐想。
从2022年的Stable Diffusion、Midjourney,到如今的即梦AI、Lovart,AI创意工具,已经重塑了创作的工作流: 创作者提供点子,自然语言作为交互界面,AI工具最后高效实现创意的生成。
忘掉繁琐交互流程,也不用再蹲Veo 3了! 现在分钟级高质量的AI创意大片,能够一键生成了。 比如一张人物图+提示词脚本,就能生成记者第一视角下采访西游记的视频特辑。
最近,一条魔性视频在X(推特)上火了。效果be like:创意很抽象,但不得不说视频效果很惊艳。丝滑的动作、流利的口条以及整体的合成效果……有3D大片那种感觉了。如此效果,基于一个AI创意引擎实现——Creati。
企业级低代码开发平台Superblocks 的 CEO 布拉德·梅内塞斯认为,下一批价值十亿美元的创业点子几乎就藏在眼前:现有 AI 独角兽企业所使用的系统提示词中。
AI还能做到更多,为手游官号做运营的小杨,在刷抖音找热点时发现一支舞蹈上了热门。她立马想到,可以让一个游戏角色跳这支舞。
一家名为 Krea 的初创公司正致力于服务设计师及其他视觉创意工作者,解决一站式生成难题,并已为其平台筹集了 8300 万美元资金,该平台旨在让生成式 AI 的使用更加流畅。
如果你让当今的 LLM 给你生成一个创意时钟设计,使用提示词「a creative time display」,它可能会给出这样的结果:
Intangible,现已获得 400 万美元的种子资金支持,提供了一款 AI 驱动的创意工具,让用户通过文本提示创建 3D 世界概念,助力跨行业创意专业人士。a16z Speedrun、Crosslink Capital 和几位天使投资者领投了本轮融资。
AI落地,已经过了“拿着锤子找钉子”的阶段。任利锋的选择,是用现有AI技术,结合成熟的电商+社区形态业务,寻求更具确定性的增长。