Midjourney V6,正在紧急RLHF中。上线倒计时,已经开始!
今天早上,Midjourney V6开启了第二次社区评价。用户需要做标注,标注200张送1小时时长。
网友们纷纷甩出神图,图片细节逼真,效果惊人:张张都是大片。
这次V6的出图效果怎么评价呢,简单来说就是——图像和照片之间的差别已经消失。
果然,能超越昨天的Midjourney的,只有今天的Midjourney。
这些神图再次证明:在AI生图领域,目前没有谁能撼动Midjourney的地位。
要知道,Midjourney V5的发布,是在2023年3月,网友们已经整整等待9个月了。
咱们啥时候能用?
好消息:Midjourney V6正在进行最后一轮RLHF。风格微调完成后,会赶在圣诞节前发布。
据官方消息,V6很可能在今明两天就上线!
这个圣诞节礼物也太棒了。
龙妈的皮肤纹理、脸部肌肉走向,已经非常接近电影的真实感。
经过史诗级增强的皮肤质感让人惊叹。
就说下面这些图,哪张不像真人?
要不是人骑着这么大的猫,马斯克出现在瓶子里,绝对看不出这是一张AI图。
Cybertruck渲染图也很逼真。
光影效果也是一绝,很难找到不自然的地方。
对光线和反射的处理,找不出破绽。
随便出图一张,就是电影大片的质感。
图中人物的血管、护臂的细节、皮肤的纹理,都自然得没有AI感。
无论是Groot还是动物,细节上都没有失真。
猫咪、狗狗的毛发和胡须,效果都画得太赞了。
Midjourney V6画起食物来,也是无比逼真,相同的分辨率下,增加了许多细节。
图中一切配色,都是按照梵高的《向日葵》。
画起自然风景,也很写实。
V6的画风也进一步扩展了,国画也画得更好了。
有网友表示,我是真的有点害怕Midjourney V6了。
得到下面这样的图,是用我以往的提示风格就可以,还是必须学习一门新语言?
没啥可说的,这就是real life。
有人说,我们从此再没有理由为素材付费了。
保真度和质量都很棒,分辨率和DPI让人印象深刻。
V6已经把我们带入了一个全新的领域,普通的消费者,就可以做出专家级的内容。
作为AI生图工具数一数二的神器,Midjourney之所以偶尔被DALL-E和Adobe Firefly的光芒盖过,就是一个因为一个致命的问题:无法很好地理解自然语言提示。
毕竟,要写出专业prompt,还是有一定门槛的。
但现在,随着V6的推出,状况很可能被改变。
根据设计师「Tatiana Tsiguleva」的分析,Midjourney V6可以更精准地理解用户的提示指令,而这也意味着我们不再需要输入那些奇怪的短语或单词。
以下是一个基于典型语言框架设计的简单结构:
目的:为作品提供具体的审美或艺术风格。
需要包含的细节:偏好的风格或历史时期。
目的:明确图片的核心焦点。
需要包含的细节:主要对象的特征,如人物、物体、动物等,包括其外观、颜色等。
目的:营造适合主题的环境或背景。
需要包含的细节:地点(如室内、户外、虚构场景),环境元素(比如自然景观或城市景象),一天中的具体时间和天气状况。
目的:规划主题及其元素的展示方式和视角。
需要包含的细节:观看角度(如特写、全景、鸟瞰),拍摄角度,以及特定的构图偏好。
目的:营造图像的氛围和视觉效果。
需要包含的细节:光线类型(明亮、昏暗、自然光),所传达的情绪(如欢快、神秘),以及氛围效果。
目的:丰富图像的层次感和深度。
需要包含的细节:次要元素、角色、动物,以及它们与主要对象的关系或位置布局。
显然,这种类似DALL-E 3的prompt方式,会让V6变得更确定,可以让我们更好地控制想要的图像内容。
接下来,就是搓手期待V6的正式上线了。
有网友表示,自己已经准备就绪。
不眠不休激动等待中。
参考资料:
https://twitter.com/op7418/status/1737445886165451227
https://twitter.com/op7418/status/1737445353002344532
https://twitter.com/ciguleva/status/1737573077633085584
https://twitter.com/BeezyManzell/status/1737516209988604289
https://twitter.com/doganuraldesign/status/1737398934073385346
https://twitter.com/giffboake/status/1737533263671853462
https://twitter.com/ai_artworkgen/status/1737588573778432406
https://twitter.com/dnaijatechguy/status/1737617371454701950
https://twitter.com/Anima_Labs/status/1737592798390460567
https://twitter.com/PhotoGarrido/status/1737479363476525377
文章来自于微信公众号“新智元”
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0