2024最wow的AI生图工具出现了!
对“青春纪念手册”下手,你就说这味儿正不正宗:
不信谁没有,谁也别说谁。
别着急,下一秒“啪”的一下:
……什么情况?
这,就是最近摄影圈不少人都在玩的AI修图神器——超能画布。
据说只需一句提示词就能分分钟修出创意大片,无需事先上传多张图训练专属模型,打开直接上传一张图随便P。
最近它还快速迭代升级了一波产品,圈子里更热闹了。有网友试过后直呼内行,毕竟用它来应对顾客的奇葩需求简直不要太降 本 增 效。
像是服务丝巾阿姨这类客户,超能画布的生图效果也绰绰有余了:
这么神奇的AI工具量子位自然也是不能错过(doge)。
深入体验一番,原来这个AI不仅可以全图修还能局部修,一键换发色也是可以的:
就算随便穿件小碎花:
也能分分钟变成沙漠公主、藏族少女,关键是人长得一毛一样。
那以后岂不是可以实现人在家中随便穿件睡衣,朋友圈九宫格一键凑齐。
这到底是怎么做到的?
打听了一圈,如上提到的超能画布其研发团队来自百度网盘,主打专业摄影修图一条龙服务。
传统专业人物摄影需要的改妆造、换服饰、搭景通通不需要,超能画布出大片就是一句话的事儿。
总的来说,有三条工作流:
下面带大家一起探一探这个AI工具到底有何超能力。
先看AI写真部分。
拿来一张我闺蜜中关村全智贤分贤照片上传。接下来一幕立刻让我们眼前一亮,图中的人物动作、轮廓被一键绘制了出来。
往下看,原来这是超能画布的条件控制功能:动作捕捉、轮廓控制。
除了这两种,还有景深、风格参照、强化细节,这五种条件控制都可以上传控制图并设置强度来控制生成,默认是原图控制。每次生图至多可组合三个条件控制使用。
接下来,界面右侧可选的基础模型有真实摄影模型、胶片摄影模型两种。前者偏真人写实风格,注重细节;后者包含景深效果,注重氛围感。
提示词支持中英文,且权重均可调整,还有灵感联想供用户直接选择。高级设置中有一系列可控参数以及反向提示词;生成设置可修改画布尺寸和生成图片的张数。
有一说一,相较于国产大多数类似AI修/生图工具,超能画布可供用户自行设置的细节可真不少。
这一整套设置有专业需求的可以自行DIY,保存成“我的配方”。
没有灵感的,官方也提供了现成“灵感配方”,配方和实际生成场景的匹配性也很高:
我们选择了沙漠风的驼铃少女灵感配方,然后直接点击生成,原本的中关村分贤照片一键变身。
就这,亲妈看了都说真。面部、身体姿态都能保持一致性:
再来看局部重绘板块。点击“编辑选取”,可以看到有局部元素更改和一键换背景两种用法。
其中局部元素更改也就是哪里不好改哪里,可新增、删改元素。
而一键换背景功能,适合已经有成熟服饰只需构建场景时来用。
更多细节玩法,官方提供了一份知乎教程,可点击“帮助文档”查看。
其中不仅详解了每个可控组件的作用效果,还提出了一些小tips:
技术方面,超能画布的背后是百度网盘研发团队基于百度智能云千帆大模型平台构建的美学AI图像生成大模型。
大模型加持下,超能画布的特点也就相当突出了。
首先,该模型主打的功能就是高质量人像写真生成。支持通过将参考图像作为控制条件,对生成结果的人物姿态、图像结构、景深乃至画面光影、面部妆容进行细粒度控制。
保持成片和原图的相似度,超能画布还有杀手锏:智能人脸融合算法。
该算法可以将用户面部信息作为控制条件参与到图像生成流程中。
它通过分析画布生成结果的面部光照、肤色、纹理等特征,结合用户输入图像中的五官、脸型,实现在生成图像中“无缝”保留用户面部形象。
除了“真”,百度网盘团队在打造超能画布时,也赋予了其对“美”的理解——美学评价模型。
为让模型对齐到人类的美学认知,团队构建了基于用户反馈的模型优化链路,从而让生成的图像更加符合用户的审美偏好。
可以说,通过以上三个模型,超能画布为摄影师群体提供了一站式的人像摄影修图方案。
当然,在这些模型的“超能力”的背后,我们熟悉的老朋友——百度智能云千帆大模型平台——提供的强大的底层模型和算力支持也功不可没。
千帆大模型平台是一个面向企业开发者的一站式大模型开发及服务运行平台,提供了多种大模型服务,还包括各种AI开发工具和整套开发环境,让开发者一站式完成应用开发。
说回超能画布,它带来的全新体验,让试用过的网友感叹说:摄影的ChatGPT时刻要来了。
这也不禁引发了我们的思考,何谓“摄影的ChatGPT时刻”?
一年前国产大模型竞技场百箭齐发语言模型。现如今,图像生成似乎也成了国内大模型厂商的兵家必争之地。
超能画布的出现,可以说从一个全新的角度杀入了这场大战——AI修图/AI生图很常见,但“GenAI修图”这块在国内似乎还是一片蓝海。
再往具体点说,超能画布盯准的是国内摄影师痛点。
像摄影师等非AI密接的行业,也许没有办法使用到SD、MJ等工具,而超能画布是国产应用,“国产”的含金量大伙儿都懂,让用户更加触手可得。
在摄影师遇到不按套路出牌的顾客时,超能画布可一键帮助他们省去大部分P图工作,轻松满足cos写真、客片、商业影片等用户需求。
据了解,之后随着产品优化升级,超能画布也能应对客片二销,老客复购这类需求。
比如,拍写真赠送AI写真,确实是个不错的招揽顾客的方法?
更方便的是,超能画布无需训练、无需部署,也无需下载安装,省去了自行搭建工作流的技术等方面门槛,同时也破除了自行部署模型的硬件壁垒。
只需打开网页,就能即点即用,界面简洁明了,无论是AI小白还是大咖,任何一名摄影师都有机会上手使用,面对各类新式场景都不再束手无策。
若你是AI深度用户,还有机会凭借你高阶的提示词技巧,将应用中的控制条件随意搭配,探索出更多样的大咖级玩法。
本文来自微信公众号“量子位”
有木有被戳到,不妨亲自动手试试。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0