ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
最新AI生图模型Flux1.1刷屏!添加单反相机文件名获得超写实图像,网友:我分不清啊
5682点击    2024-10-06 21:00

最新AI文生图模型Flux1.1,一夜刷屏。


只需一个简单技巧,就能去除图中的“AI味”,无论人物还是风景都能达到照片级效果。



评论区网友的反应be like:我分不清,真的分不清啊。



这个技巧用起来也非常简单,在提示词中模仿单反相机的文件命名格式即可。


比如“CR2”就是佳能相机使用的原始图像文件格式,输入“IMG”+随机编号+“.CR2”,再加指定的内容,就能获得一张写实图像了。



后面也陆续有尝试过的网友反馈,换成索尼相机的“ARW”、尼康相机的“NEF”,甚至苹果的“HEIC”格式,都能获得不错的结果。



以至于有人都开始怀疑,不会是模型随机吐出来一张训练数据里的真照片吧?



不过放大看一些特定细节,还是很容易看出确实是AI生成的,比如车牌号上的文字都是乱码。



那么是否Flux1.1模型本身能力就很强大,这个技巧在其中起到了多大作用呢?


一位资深修图师傅晒出了对比,左边加了IMG_1018.CR2,对比右边不加的,他认为差别巨大。



我们的实测结果也能看出,加上这个技巧能显著提升画面真实性。


现在想免费试玩这个Flux1.1模型,可以来到together.ai平台,注册即送5美元的积分。



随便生成一张在长城的游客自拍照,乍一看像那么回事,但仔细观察人物皮肤质感、背景山和植物都有还是有一股AI味。



换成“IMG_0314.cr2: selfie on The Great Wall”,是不是立马就不一样了?



代号蓝莓,最新SOTA文生图模型


随着FLUX1.1的正式发布,此前在文生图模型排行榜上屡占榜首的两个无人认领的“蓝莓”模型的神秘面纱也被揭下,正是它。



官方不藏了,直接放出数据,在Artificial Analysis image arena上,FLUX1.1 [pro]以“blueberry”为代号,超越所有其它模型,获得最高的整体Elo评分。



相比之下,FLUX1.1 [pro]价格也更低,速度更快,各项指标超越Midjourney、SD3、Ideogram等。



生成速度上,FLUX1.1 [pro]在保持图像质量、指令响应和多样性提升的同时,速度是前代FLUX.1 [pro]的6倍。


顺便提一下,现在FLUX.1 [pro]也进行了更新,速度是之前的2倍,FLUX1.1 [pro]的速度是目前可用的FLUX.1 [pro]的3倍。


此外,官方表示即将推出快速高分辨率生成,FLUX1.1 [pro]可原生支持的那种,在不牺牲任何指令响应情况下,能生成2k图像。


FLUX1.1 [pro]将通过Together.ai 、Replicate 、fal.ai、Freepik等在线平台提供。


同时官方还推出了BFL API,可供其他开发者集成到自己的应用程序中,API定价是:


  • FLUX.1 [dev]:每张图2.5美分(约RMB 0.18元)

  • FLUX.1 [pro]:每张图5美分(约RMB 0.35元)

  • FLUX1.1 [pro]:每张图4美分(约RMB 0.28元)

Stable Diffusion原班人马打造


FLUX1.1 [pro]的背后是Stable Diffusion原团队,成员包括Robin Rombach、Andreas Blattmann、Dominik Lorenz等。



Robin Rombach


其实Stable Diffusion最初是一个学术研究项目。


由Björn Ommer教授领衔,Robin Rombach、Andreas Blattmann、Dominik Lorenz等几位慕尼黑大学机器视觉与学习研究小组成员,以及Runway的研究人员Patrick Esser完成。



研究论文发表七个月后,Stability AI开始介入,提供计算资源,以进一步开发文本到图像生成模型。2022年,上述几位论文作者加入Stability AI。


团队一同创建了Stable Diffusion XL、Stable Video Diffusion等。


ICML 2024最佳论文之一、Stable Diffusion 3技术论文的Rectified Flow Transformers,还有SDXL-Turbo使用的对抗扩散蒸馏方法(Adversarial Diffusion Distillation),也是这帮子人在研究。


今年三月份这些核心研究团队成员被曝集体辞职。


而后,他们组成了新团队名为Black Forest Labs(黑森林实验室),总部位于德国。



今年8月初刚刚宣布成立,并发布了其初代文生图模型FLUX.1,FLUX.1有三个变体:FLUX.1 [pro]、FLUX.1 [dev]和 FLUX.1 [schnell],平衡了性能和可访问性。



目前黑森林实验室已完成种子轮融资,共融资3100万美元,Andreessen Horowitz领投,Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun等跟投。


据说他们还已经收到General Catalyst、MätchVC的后续投资。


黑森林实验室和马斯克还有合作,将其图像生成模型引入xAI的Grok助手中。


接下来,团队透露将推出SOTA级文本到视频生成模型


据说他们正在以10亿美元的估值筹集1亿美元资金,比之前1.5亿美元的估值大幅上涨。


从Pika 1.5到Meta Movie Gen,今年下半场视频生成赛道爆火,黑森林实验室的加入,或许会带来不一样的火花。



文章来源于“量子位”,作者“梦晨 西风”


关键词: AI , 文生图 , Flux1.1 , Flux
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
Flux

【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目,该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目,效果堪比midjourney。

项目地址:https://github.com/black-forest-labs/flux

在线使用:https://fluximg.com/zh

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0