ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
Midjourney V6.1再进化!人像逼真细节拉满,摄影级画面秒生成
5764点击    2024-08-02 14:27

Midjourney几个月前画的饼终于端上来了!他们今天刚刚发布了最新版本v6.1!


此次更新总结四个大字:细节狂魔。



网友纷纷发推测试最新版本的Midjourney,摄影级画面先睹为快!


这张图被取名为《天窗》,构图、色彩、光影、明暗,各方面都极度舒适,湖面波光粼粼细节生动,简直可以直接用来做屏保



继续看一幅风景,曙光拨开云层,远处群山连绵,积雪未消;植被茂密,松树纹理逼真,一片静谧祥和。



接着看一组静物,原本需要大量人力物力财力和精力拍摄的商业图,Midjourney几十秒轻松搞定。


每张图片不仅清晰,还能围绕一个配色、主题和风格展开。



人像生成自然也不在话下,五官立体,妆容精致,堪比杂志图。



生成人物与街景图自带复古ccd效果,落日余晖打在人脸上清晰真实,没有过度美化的假面感。



甚至还能生成定制风格的图片,下图就是一个千禧风格的老式计算机。



网友都上手尝鲜新版本的同时,也有人感叹Midjourney进化速度之快。


有人po出一张Midjourney V2和Midjourney V6.1的对比,从画面模糊到清晰,摩托车与人的轮廓从诡异到炫酷,仅仅经过了两年时间。


细节狂魔


之所以把Midjourney这一版的亮点称之为「细节狂魔」,是因为V6.1着重强调了以下新功能:


- 更连贯的图像(手臂、腿、手、身体、植物、动物等)

- 图像质量更好(减少像素伪影、增强纹理、皮肤、8 位复古效果等)

- 更精确、更详细、更正确的细节特征(眼睛、小脸、远处的手等)

- 新的图像放大器具有更好的图像/纹理质量

- 标准图像作业速度提高约 25%

- 提高文本准确性(在提示中通过「引号」绘制单词)

- 新的个性化模型,具有令人惊喜的细微差别和准确性

- 个性化代码版本控制(将旧作业中的代码用于当前作业的个性化模型和数据)


一句话总结,就是让画面整体上看起来更和谐、精致。


尤其是在人像的处理方面,几乎已经无可挑剔。


以图为证,左边V6生成的已经足够逼真,V6人物的眉毛纹理更加精细,眼球红血丝清晰可见。


可以说将AI生成图与摄影大师作品同场竞技也丝毫不输。


V6.1对比V6


产品介绍得再天花乱坠,用户最为关注的,还是上手使用时性能是否真正提升。


接下来我们直接与前一代横向对比,看看千呼万唤的V6.1在上面提到的更新升级做的怎么样了。


提示词:冬天,一个金渐层小猫在壁炉前的沙发上玩毛线球,平视角度,主体形象直视镜头,写实逼真。



两幅画对比可以看出,右边的小猫看上去更加毛茸茸的,毛线球的质感也更加真实不死板,背后的原因就在于V6.1版本在于对细节和纹理的处理更加真实细致。


提示词:阳光明媚的日子里,经典福特野马在海岸附近的道路上行驶的高角度镜头,温暖的阳光照亮了汽车的底盘,逼真,高分辨率。


V6.1的版本清晰度就眼前一亮,画面构图更加和谐,远处山脉纹理也更加真实。


提示词:JC Leyendecker 风格的插图,年轻运动员在行动中,复古足球服,大学橄榄球场的初秋午后,动态照明突出肌肉形态,光影对比,低角度,饱和色彩,程式化和流畅的笔触。



JC Leyendecker是上世纪美国著名插画师,风格偏写实风,注重线条流畅程度以及灯光质感,善于借用灯光打造人物效果,烘托出主人公。


JC非常注重用笔触打造衣物、皮肤和头发的质感,绘画线条流畅,擅长运用松节油混合颜料,创作出丰富、流畅的笔触和发光般的表面质感。



可以看出,V6.1的版本更符合JC Leyendecker的绘画风格,棒球运动员的衣服和皮肤都有微微光感。


再看下面这个例子,展示了V6.1最引以为傲的人像处理部分,首先画面一眼看去更加和谐且具有电影质感。



提示词:电影拍摄画面,可疑的人,灯光昏暗的街道。在晚上,人物紧张地环顾四周。人工街道照明,前角,双色调,绿松石和红色,营造紧张的气氛,Cinestill 50D。


V6版本对于皱纹形态和手部细节的处理还都比较死板,V6.1版本中,人物的肌肉线条明显更加真实。


深究人像细节可以发现,V6版本的人脸被遮挡且晦暗不清,V6.1中,人物打湿微卷的头发、脸部光影和皮肤的沟壑纹理都极其真实。


经过以上四组动物、外景、人物和强烈绘画风格的对比例子来看,Midjourney V6.1都较上一代呈现出了高质量的画面和丰富的细节,并且还能定制生成艺术家风格的作品。


自然,Midjourney依旧不会满足于V6.1的进步,在上新的同时也透露下一步消息——V6.2将会在下个月推出。


参考资料:

https://x.com/midjourney/status/1818342703618482265


文章来自于微信公众号“新智元” 作者 耳朵 乔杨





AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0