ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
一个默默无闻的文生图模型,直接给 DALL·E、Midjourney 和 FLUX 秒了?|AI横评
6122点击    2024-08-26 10:11

前两天Ideogram 更新了 2.0版本,并且现在可以免费体验。



体验链接:https://ideogram.ai/t/explore/design


网友:什么?干嘛的?


一年前发布的Ideogram 确实在AI生图领域没什么太大水花,甚至很多人都不知道它。


但Ideogram在更新2.0版本后直接点名挑战前几天爆火的FLUX和DALL·E3以及众多文生图模型????。


Ideogram 官方声称,2.0版本要比FLUX和DALL·E3要强,并且在生成逼真图像、图形设计、排版等方面具有行业领先的功能。还在许多质量指标上都显着优于其他文生图模型,包括图像文本对齐、总体主观偏好和文本渲染准确性。



优于其他模型?口说无凭,我们先来测测实力,让Ideogram和最近爆火的FLUX以及、DALL·E3、Midjourney一起接受我们的考验。


我们按照以下统一标准进行测评,每个标准设置1分,每题5分共4题,总分20分。


(PS:prompt统一使用英文投喂,仅在文中翻译为中文。)


评价标准:


  1. 准确性:生成的图像是否准确地反映了文本描述的内容和细节。


2.清晰度:图像的分辨率和细节清晰度,是否能够清晰地看到图像中的元素。


3.逼真度:图像的逼真程度,包括颜色、纹理、光影效果等是否接近现实世界。


4.创造性:AI在生成图像时展现的创造性,是否能够根据文本描述创造出新颖和有趣的图像。


5.多样性:AI在生成图像时是否能够提供多种风格或视角的图像,以适应不同的需求。


写实风格


prompt:小丑在专业摄影环境中优雅行走的特写镜头。他沐浴在霓虹红、蓝色和紫色的灯光中。


点击查看大图



Ideogram、FLUX、DALL·E3和Midjourney四家对小丑????的理解一致性还挺高的,基本都还原了杰昆·菲尼克斯饰演的亚瑟·弗莱克的形象,并且基本还原了提示词中的内容。


Ideogram和FLUX在整体的画质和人物的真实感和一些细节(比如衣服褶皱,光影明暗对比)方面表现比较好;DALL·E3生成的效果有点生硬,不够自然真实;Midjourney生成效果风氛围强,但光影对比效果不明显。


Ideogram:FLUX:DALL·E3:Midjourney ???? 5:5:3:4


广告创意设计


prompt:一辆豪华跑车停在光线昏暗的高端车库中,光束突出跑车的曲线和光泽饰面。汽车的前灯发出强烈的光芒。顶部用粗体字写着“Unleash the Beast”。标语“Engineered for Excellence”位于下方。


点击查看大图



Ideogram对于提示词中的文字生成最准确,画面的真实感表现的最好,光影反射也符合物理规律,图片的质感和设计感表现突出;其次是FLUX,环境背景真实,但汽车的线条有点不自然,文字生成有一点错误;Midjourney生成的汽车背景和光影还算自然,但文字生成与提示词有明显出入,最后DALL·E3,背景真实感强,但是主体汽车生成不自然,文字生成有些模糊。


Ideogram:FLUX:DALL·E3:Midjourney ???? 5:4:2:3


漫画海报设计


prompt:为《这个杀手不太冷》设计一张宣传海报,以现代城市为背景,雾霾的夜晚。马路中间一名大叔身穿黑色风衣的,神色凝重,手捧盆栽,目光深邃。一个穿着红色外套,拿着手枪的小女孩,眼神坚定,神色固执。背景中隐约可见城市的高楼大厦和霓虹灯,营造出一种紧张不安的气氛。海报下方用粗体写下电影片名“Leon: The Professional”,并底部附上标语:"Cold appearance, warm heart, a wonderful killing journey!"


点击查看大图



整体来说还是Ideogram和FLUX表现较好,但Ideogram文字生成漏掉了一个字母,FLUX的大叔形象不太符合漫画风格;DALL·E3的海报设计感强,但文字生成错乱严重;Midjourney与最贴合原著,但是背景生成与提示词不符,而且文字生成不准确。


Ideogram:FLUX:DALL·E3:Midjourney ???? 4:4:2:4


3D风格


prompt:主题是《黑神话:悟空》中的悟空,他身穿华丽的铠甲,上面饰有金色的龙鳞,肩甲和护腕上都饰有古老的符文。他手持一根金箍棒,散发出强烈的光芒。他的头发如火焰般飘扬,面部表情坚毅而威严。背景是充满神秘色彩的古老战场,断断续续的山脉和神秘的光影环绕,呈现出史诗般的氛围。整体风格将中国传统元素与现代3D渲染技术相结合。


点击查看大图



虽然他们生成的都不像悟空,但整体看来DALL·E3的表现较好,审美在线,背景最符合中国传统风格,只是人物的武器不是金箍棒;Ideogram的生成效果更偏向于Q版可爱风格,立体感强,整体画面比较符合提示词;FLUX生成的质感不错,但右手有点变形;Midjourney的审美也很在线,人物贴合提示词。


Ideogram:FLUX:DALL·E3:Midjourney ???? 3:4:4:4


总结


最终得出总比分为:


Ideogram:FLUX:DALL·E3:Midjourney ???? 17:17:11:15


Ideogram和FLUX的生图效果相差无几,但都明显比DALL·E3和Midjourney的效果好,尤其是在文字生成方面。但它们的中文生成能力还是有待提高。


总的来说,我也是没想到Ideogram的能力还挺强的,不管是专业摄影、广告创意还是海报宣传,整体表现的一副完全可以商业化落地的样子,逼的Midjourney都限时免费了。


文章来源“硅星GenAI”,作者“丸丸柚贝”




关键词: AI , AI生图 , AI绘图 , Ideogram
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。

项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file

在线使用:https://aicomicfactory.app/

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0