# 热门搜索 #
搜索
Midjourney V6超进化,大神网友深度评测来了!画质逼真到可怕,人像图片令人惊呆
8597点击    2024-01-20 16:21


Midjourney大神的超深度测评来了!V6比起V5.2究竟有哪些改进?来感受一下吧。


最近,国外的一位名叫Andrei Kovalev的大神网友,做出了一份Midjourney V6的超深度评测。


指南很专业,V6和V5.2有什么不同,很直观地就能看出来。


下面,就让我们来跟随大神的脚步,深入感受一下Midjourney V6的性能有多强吧。


V6模型,究竟比V5.2强在哪


在以往,当我们看一张AI生图时,可能马上就会感觉到这是AI画的。


但在Midjourney V6中,你很少会有这样的感觉。


在这一部分中,Kovalev介绍了V6的优势、劣势,以及和V5.2相比的主要变化。


Tim Walker的高级时装正面肖像,清澈的白色空灵机器人,半透明的皮肤淹没在电线的海洋中。红色和青色色调,发光的高光,深色阴影


V6



V5.2

Kovalev发现,V6有以下升级(因为当前还处于Alpha测试,以后还会发生变化)。


在遵循提示时更准确了,并且使用更长的提示时,效果会更好。

新模型的一致性大大增强了。

V6改进了图像提示功能。

现在V6有了两个新的升频器,具有微妙和创意模式(都将分辨率提高了两倍)。

有一个「unopinionated」的 --style raw模式(类似于 V5.2)。

此外,还可以在图像中添加文本了。

所以,V6究竟变成了什么样子?


超现实主义


以往每次的Midjourney升级,都会提升照片的真实感,V6也不例外。


最能定义V6的关键词,恐怕就是超现实主义。


川内凛子的少女太空飞行员摄影肖像


V6



V5.2


总而言之,V6的逼真度爆表,上升到了一个新台阶,尤其是在摄影风格上,已经到了让人迷惑的程度。


Kourtney Roy的老海员摄影肖像


V6


而Midjourney V6中逼真图像功能之所以如此惊人,恰恰是因为存在缺陷:镜头像差、故意过度突出的区域、意外的失焦元素以及各种胶片效果。


Mitsuo Katsui拍摄的初音未来照片 --stylize 175


当然,V6不止是人像画得好。


第比利斯的延时摄影 --stylize 175


而且,在某些情况下需要更微妙的外观和感觉,这时V6的超现实主义就显得有些尖锐,显得有些矫枉过正。


Ara Guler对1970年代伊斯坦布尔赌场赌徒的肖像


V6



V5.2

细节很疯狂


每次在Midjourney的下一个模型发布之前,许多人都会屏住呼吸,想看看他们会如何处理细节。


V6中的细节,很疯狂。而新的upscalers功能,则让细节更进一步。


Ivan Bilibin的画作,描绘骑着白狼的冬季领主



V6



V5.2


不过,虽然图像的复杂性随着每个新模型的出现而稳步上升,但在此过程中,却丢失了一些东西,比如纹理。


比如,V4的精细程度在V5+中提高了十倍,因此几乎不可能实现胶片颗粒或真实笔触这类效果。


虽然离真正的颗粒感似乎仍然遥不可及,但V6显然朝着以前失去的原始性,迈出了明确的一步。


它的纹理令人惊叹,比起V5来大放异彩(在V5中,需要选择「non-refined」的视觉风格)。


Marianna Rothen的梦幻女孩


V6



V5.2


另一个能很好地描述V6的概念,是非常规组合(unconventional composition),这导致了V5.2中结构化和平衡方法的重大转变。


以前的模型追求几何完美、黄金比例和中心主体,而V6追求不对称,经常将主体从画面中间移开。


Tyrus Wong的跨维度神秘野兽


V6



V5


这可能会提供更具动态性和吸引力的视觉效果,但也需要相应地调整提示。即使是很小的调整,也可以恢复中心构图和对称性。


可变性增强


可以看到,在V6中,同一提示结果的可变性增强了。


与早期模型相比,单个提示的四个变体,通常显示出更明显的差异。


Jessie Willcox Smith的《银术士》


V6



V5.2


许多情况下,这会产生一种更具创意、更有趣,有时甚至更忠实于现实生活中原型的多样性的艺术风格表现。


艺术风格


在提示中,我们可以引用「Style modifiers」的名称,召唤图像的特定视觉风格、技术、流派、主题或上下文。


像素艺术


V6



V5.2


现在,每个新模型都更善于了解源材料,并且在输出中重新创建它,这已经是一个传统。


然而,Midjourney从未停止这种戏剧性的变化。


by Jody Bergsma



V6



V5.2


无论这些风格本身多么伟大,真正将它们从对原作的单纯解释转变为独特的东西的,是我们添加的提示。


图片中添加文本


双手拿着报纸,标题为「Midjourney的文本 - 真实还是骗局?」



V6



V5.2

更多详解,还请参考原文网站。


参考资料:

https://midlibrary.io/midguide/midjourney-v6-in-depth-review-part-1-overview


文章来自于微信公众号 “新智元


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda