ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
Midjourney V6史诗级升级,网友惊呼太逼真!神图接连曝出,传今明两天上线
2298点击    2023-12-21 15:02


Midjourney V6刚刚开启了第二次社区评价,网友们被各种神图震惊到失语。光影效果逆天,皮肤和毛发质感细腻,让人惊呼图像和照片的差别已经彻底消失!


Midjourney V6,正在紧急RLHF中。上线倒计时,已经开始!


今天早上,Midjourney V6开启了第二次社区评价。用户需要做标注,标注200张送1小时时长。



网友们纷纷甩出神图,图片细节逼真,效果惊人:张张都是大片。




这次V6的出图效果怎么评价呢,简单来说就是——图像和照片之间的差别已经消失。



果然,能超越昨天的Midjourney的,只有今天的Midjourney。


这些神图再次证明:在AI生图领域,目前没有谁能撼动Midjourney的地位。


要知道,Midjourney V5的发布,是在2023年3月,网友们已经整整等待9个月了。



咱们啥时候能用?


好消息:Midjourney V6正在进行最后一轮RLHF。风格微调完成后,会赶在圣诞节前发布。


据官方消息,V6很可能在今明两天就上线!



这个圣诞节礼物也太棒了。


这真不是真人?


龙妈的皮肤纹理、脸部肌肉走向,已经非常接近电影的真实感。



经过史诗级增强的皮肤质感让人惊叹。


就说下面这些图,哪张不像真人?



要不是人骑着这么大的猫,马斯克出现在瓶子里,绝对看不出这是一张AI图。



Cybertruck渲染图也很逼真。



光影效果也是一绝,很难找到不自然的地方。




对光线和反射的处理,找不出破绽。



随便出图一张,就是电影大片的质感。



图中人物的血管、护臂的细节、皮肤的纹理,都自然得没有AI感。



无论是Groot还是动物,细节上都没有失真。



猫咪、狗狗的毛发和胡须,效果都画得太赞了。



Midjourney V6画起食物来,也是无比逼真,相同的分辨率下,增加了许多细节。



图中一切配色,都是按照梵高的《向日葵》。



画起自然风景,也很写实。



V6的画风也进一步扩展了,国画也画得更好了。



网友:我真的害怕了


有网友表示,我是真的有点害怕Midjourney V6了。


得到下面这样的图,是用我以往的提示风格就可以,还是必须学习一门新语言?



没啥可说的,这就是real life。



有人说,我们从此再没有理由为素材付费了。


保真度和质量都很棒,分辨率和DPI让人印象深刻。


V6已经把我们带入了一个全新的领域,普通的消费者,就可以做出专家级的内容。



全新的提示结构


作为AI生图工具数一数二的神器,Midjourney之所以偶尔被DALL-E和Adobe Firefly的光芒盖过,就是一个因为一个致命的问题:无法很好地理解自然语言提示。


毕竟,要写出专业prompt,还是有一定门槛的。


但现在,随着V6的推出,状况很可能被改变。



根据设计师「Tatiana Tsiguleva」的分析,Midjourney V6可以更精准地理解用户的提示指令,而这也意味着我们不再需要输入那些奇怪的短语或单词。


以下是一个基于典型语言框架设计的简单结构:



风格


目的:为作品提供具体的审美或艺术风格。

需要包含的细节:偏好的风格或历史时期。


主题


目的:明确图片的核心焦点。

需要包含的细节:主要对象的特征,如人物、物体、动物等,包括其外观、颜色等。


环境


目的:营造适合主题的环境或背景。

需要包含的细节:地点(如室内、户外、虚构场景),环境元素(比如自然景观或城市景象),一天中的具体时间和天气状况。


构图


目的:规划主题及其元素的展示方式和视角。

需要包含的细节:观看角度(如特写、全景、鸟瞰),拍摄角度,以及特定的构图偏好。


光线

目的:营造图像的氛围和视觉效果。

需要包含的细节:光线类型(明亮、昏暗、自然光),所传达的情绪(如欢快、神秘),以及氛围效果。


额外信息


目的:丰富图像的层次感和深度。

需要包含的细节:次要元素、角色、动物,以及它们与主要对象的关系或位置布局。

显然,这种类似DALL-E 3的prompt方式,会让V6变得更确定,可以让我们更好地控制想要的图像内容。



接下来,就是搓手期待V6的正式上线了。


有网友表示,自己已经准备就绪。



不眠不休激动等待中。



参考资料:


https://twitter.com/op7418/status/1737445886165451227


https://twitter.com/op7418/status/1737445353002344532


https://twitter.com/ciguleva/status/1737573077633085584


https://twitter.com/BeezyManzell/status/1737516209988604289


https://twitter.com/doganuraldesign/status/1737398934073385346


https://twitter.com/giffboake/status/1737533263671853462


https://twitter.com/ai_artworkgen/status/1737588573778432406


https://twitter.com/dnaijatechguy/status/1737617371454701950


https://twitter.com/Anima_Labs/status/1737592798390460567


https://twitter.com/PhotoGarrido/status/1737479363476525377


文章来自于微信公众号“新智元”

AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0