ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
神秘「蓝莓」登顶文生图竞技场,疑似Flux.1续作,网友:都来免费打广告了
6737点击    2024-09-29 13:41

都来玩这套。


继OpenAI“草莓”之后,又有神秘模型蓝莓来“霸榜”。


在文生图模型排行榜上,两个“无人认领”的模型blueberry_0blueberry_1力压Flux.1、Ideogram v2、Midjourney v6.1等知名模型,成为最新榜一榜二大哥。



一些生成效果be like,确实不错。



不过这一次,未必是OpenAI跨界来搞事,背后公司更可能是打造了Flux的黑森林实验室。


为啥?


来看这组PK。blueberry_0生成的大胡子男人,和Flux Pro的几乎一模一样。



有人猜测,难道是Flux的新版本?



我们实测时也发现了类似的情况,blueberry_1在同一提示词下,生成图像从构图、光线到细节,与Flux.1[pro]非常像。



有网友就评论说,这真的很有意思。


公司在发布新模型之前先把它放在模型竞技平台上,大多数时候用户也能猜的出来它来自哪家公司。
……
这几乎是一种免费打广告的形式了。而且就是能吸引到目标用户。


对提示词理解更精准


现在,在竞技场中随机匹配即可“偶遇”两个蓝莓模型。


从实际生成效果中可以找寻出蓝莓模型的一些特点。


比如和Midjourney v6.1对比,blueberry_1在细节和真实性上更好。


Midjourney生成的人物手部不够自然,眼睛看着的是桌子而不是收银机,背带裤扣子也很奇怪。
相对而言,blueberry_1整体更协调,光线更自然。



和Stable Diffusion XL 1.0比较,写实性更好。



和FLUX.1[dev]对比,blueberry_0对提示词的理解更精准,细节处理能力更强。


提示词中提到的山谷中充满神秘物种,FLUX.1[dev]只画了一个。



但是也有一些情况,blueberry_0的表现不算突出。觉得谁更好或许就见仁见智了。



除此之外,还有网友发现蓝莓模型在生成图像中的文本上表现不佳。



从数据上来看,两个蓝莓模型之间的差距并不大。从生成质量和速度两个维度评判,它们也都处于第一梯队。



相对而言blueberry_0的生成质量更高一点点。如下结果是基于模型在竞技场中PK10000次以上后进行评定。



生成速度上也是blueberry_0更快。



竞技场胜率上,blueberry_0排第一,Flux.1[pro]第二,blueberry_1第三。



网友:是OpenAI还是黑森林?


目前还无人认领“蓝莓”模型,网友们的猜测还在继续。


有人觉得它在细节上还有很多问题,不太可能是OpenAI的模型。


比如小屋出现了两个门把手。



下图人物被挡住的胳膊和手有问题。



但也有人说,最近OpenAI员工透露会有新模型,有可能是OpenAI悄悄发布。



当然,也有人质疑“蓝莓”模型分数虚高,在一些情况下它的表现不及Dall·E 3。


我感觉结果被操纵了,这样它们就能拿着这些成绩去给投资人看。“蓝莓”很明显就是参考了“草莓”的做法,而“草莓”模型就很可疑。



你觉得呢?


现在也可以去竞技场上实测“蓝莓”模型效果。


传送门:


https://artificialanalysis.ai/text-to-image/arena


参考链接:


[1]https://www.reddit.com/r/singularity/comments/1fpwuu7/a_new_mysterious_image_gen_model_called_blueberry/


[2]https://x.com/search?q=Blueberry%20Black%20Forest%20Labs&src=typed_query


—  —


文章来源“量子位”,作者“明敏”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
Flux

【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目,该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目,效果堪比midjourney。

项目地址:https://github.com/black-forest-labs/flux

在线使用:https://fluximg.com/zh

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0