这周,Midjourney即将带着全新V7强势归来。内部模型已训完,目前开启了评分系统,进入最后微调阶段。网友已放出生图,效果惊艳,画质细腻度拉满。
GPT-4o热乎劲儿还未过去,Midjourney估计这周要带着V7杀回来了。
最新的官方博文发出正式邀请,参与V7最后微调评分派对。紧接着,又开启了第二轮评分。
付费用户皆可参与,评分时一次两张图片进行对比,可根据个人喜好/品味去选择最优图。
第一轮的评分,主要教会V7学习什么是「不好的」,而第二轮评分,主要侧重学习什么是「好的」。
一些网友已经放出了许多评分中的图像,效果非常惊艳震撼。
V7在画面细腻感、解析力上大幅提升,伪影大幅减少,在人物生成皮肤细节上得到极致进化。
就连时尚杂志VOGUE的封面,可以一键生成,气场十足。
最关键的是,V7可能是Midjourney首个Omini模型。
23年底V6面世后,Midjourney内部几乎陷于沉寂,随后被FLUX、Grok、Gemini 2.5等相继杀出的模型,取代了AI生图王座之位。
再到近来,GPT-4o「吉卜力」全网疯玩,人们或许已经忘了Midjourney这个曾经在AI生图领域神一样的存在。
奥特曼警告:想要AGI快点来,停止用GPU生图
历经一年多的沉淀,Midjourney能否凭借V7扳回一局?
其实,就在OpenAI推出GPT-4o的第二天,网上便有传言称,V7即将在4月初解禁。
大佬Alain Astruc在长文中表示,从2022年2月的V1版本,到2023年12月的V6版本的进化,用时1年零10个月。
而从V6再到如今的V7,1年零4个月,几乎用上了前5个迭代版本总共的时间。
同一个提示,V1-V6版的生成效果
相较于此前节奏,这次步伐稍稍放缓,但并不意味着停滞。
Alain进一步表示,自己着实被全新4o图像模型的精准响应能力所震撼,但即便如此,依然无法取代Midjourney。
他将Midjourney比作一只具有独特魅力的猫,带着几分任性、优雅,甚至是不可预测的灵动。
它不会机械地执行指令,而是机会变幻、会带来惊喜,这种特质是其他模型难以复制的。
这不,全网已经开始疯传V7的评分图了。
需要说明的是,Midjourney官博备注称,这些图片并非是V7生成,也不代表V7的最终质量。网友解读:V7届时发布后,效果一定比这个还要高。
不如,先来一场demo的视觉盛宴。
网友@GenIArt_Fr发布了一些自己参与评分系统,图片两两对比打分的界面。
他对V7初步体验的反馈是:
背景中的面部细节定义大幅提升
杂乱的伪影和不一致现象明显减少,非常少
皮肤纹理表现更出色
真实感令人印象深刻
创意者@Rob101Ai分享了一段基于Midjourney V7创作的一段视频合集,汇聚了所有惊艳的图片作品。
而且,他还用Ukiyo制作了一首原创歌曲「Don’t Stop」。
这不仅是一次视觉与听觉碰撞,更是让人类创作边界再次被拓宽。
@Rob101Ai表示,人们在争论哪个模型更优秀或许并不重要。与其纠结「谁是第一」,不如接受一个事实:让AI工具发展出属于它们自己的独特价值。
有人反讽道,如果这就是V7令人惊叹的效果,那么晚安。
如前所述,这次评分故意展示了糟糕的图片,以便让模型理解什么是不好的内容。
这一次,V7可能在真实人物生成方面,实现了超进化,仅用肉眼根本无法辨出。
最关键的是,新版本在皮肤自然度有了很大提升,比以往蜡像感减弱了很多。
请看大图:
在亚洲人物图片的生成上,V7也到了真实呈现。
其他的人物生成效果的demo:
当然了,Midjourney真正的强大所在,便是创意设计,比如广告、抽象艺术、各种风格的家居设计等等。
尿不湿广告,一人,一个Midjourney就够了。
装修内饰,各种风格皆可拿捏。
还有动漫3D卡通角色的设计,呆萌少不了。
正如上面@GenIArt_Fr网友所总结的那样,V7在真实感方面,令人印象深刻。
如下这张工人修水管的实景图,若不说AI生成的,你能看出来么?
除了人物,V7在动物、昆虫的图片生成中,细节真的是拉满了。
生成的三明治、米其林美食,看着就非常有食欲。
另有人放出了一些奇怪的图片demo。
比如,六个脚趾、长满牙齿等各种畸形的手、还有嗜血恐怖风格的......
以下是V7更多demo的合集:
虽并非最终V7生图demo,但这些案例足以让人震撼。
AI生图的王座,说不定又要易主了。
凭借4o强大生图能力,就在昨晚,ChatGPT搜索词条,正式超越了谷歌。并且,「吉卜力」已经成为全网焦点。
直到现在,全网还是有很多人玩到停不下来。
最新实测中,4o已经能够生成无缝纹理/材质,甚至是完整的PBR贴图。
AI吉卜力潮的兴起,一方面争论最多的是版权问题,另一方面便是艺术家真能被AI取代了吗?
IMAGES的最新社评文章中称,AI吉卜力就是对艺术和艺术家的一种侮辱。
艺术家耗费多年才打磨出了艺术表现力与技艺,这些心血结晶却被AI的一个指令轻易剽窃,这种「工业化流水生成」正在消解艺术价值。
他们批判道,GPT-4o生成的吉卜力图片徒有其表,本质确实艺术的降维,剥离了吉卜力作品真正的灵魂。
真正的吉卜力艺术,绝不仅仅是呆萌的角色:从《萤火虫之墓》战火中的兄妹求生,到《千与千寻》对贪婪人性的刻画,每部作品都凝聚着匠心。
手绘动漫家Usman Riaz直言,「AI是工具,而非艺术家」。
不过,GPT-4o目前真正的价值,并得是取代什么人,而是成为人们创意的一个源泉和脚本。
沃顿商学院教授Ethan Mollick对其,给予了极大的肯定——AI图像生成迎来了「无大象」革命。
他用AI去生成一个没有大象的房间,并标注说明为何不可能存在大象。
传统微软Copilot工具生成效果下图左,而GPT-4o生成不仅精准,还准确遵循了指令。
提示:show me a room with no elephants in it, make sure to annotate the image to show me why there are no possible elephants
甚至是,自己的一张手绘图,GPT-4o就能直出一张创意海报。
家居设计,根据指令逐一完善图片。
还有无人机广告,4o都展现出无可比拟的优势。
Midjourney V7来袭后,人类又将达创意新里程碑。
参考资料:
https://updates.midjourney.com/v7-rating-party/
https://x.com/alanxtruc/status/1905009099013521554
文章来自于“新智元”,作者“桃子”。
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner