去年十一期间,我们推出了选题《全球流量Top50的“AI网站”出炉:C端用户都愿意用AI干什么?》,基于第一期 a16z Top50 AI 网站的榜单,盘点了各类别网站的流量表现、主要功能等。在这份榜单中,AI 生图产品有 10 款,是上榜产品数最多的类别,时隔一年,我们就来看看它们现在怎么样了。
2023 年 8 月,a16z 推出的第一期 AI Web Top50 榜单,红框中是上榜的生图产品,注:我们将参考 2024 年 8 月推出的第三期 a16z Top50 榜单,观察一年前能够登上第一期榜单的生图产品近一年的表现。(如果读者对其他类别的产品感兴趣,我们也会视情况推出选题)
首先,来看看这些产品的整体情况。
红色方框中是 6 款仍在榜的产品,蓝圈内的产品是新上榜的生图产品
上榜产品数量方面,登上去年榜单的 10 款产品,有 6 款产品仍在榜,而 Lexica、Stable Diffusion、Pornpen.ai 和 DeepSwap 则掉出了 Top50,它们的网站流量均已低于 200 万(全球达到月访问量 200w 的 AI 图片类网站,大概有 50 家左右)。而在这 10 款产品之外,还有三款新产品上榜,包括 Yodayo(生图+角色聊天)、SeaArt 及 ideogram,新榜单中的生图产品的总数为 9 款,只比一年前少了一款。
虽然 60% 的“存活率”还可以,但如果将每款产品的流量分别与一年前相对比,则可以看到,所有上榜产品的流量都有不同程度的下滑。由于目前生图产品的灵活性与可控性距离实际的应用场景,还有一定的距离,经常需要用户频繁“抽卡”,在新鲜感褪去后,一批用户流失。
但是最近,在 SD3 和 Flux.1 等新基座模型纷纷推出,引发了大量用户的关注和讨论,各产品的流量在 8 月份也都有所回暖,还出现了 Tensor.art、Openart.ai 等逆势上涨的产品,两者的流量也接近 Top50 的水平(第三期榜单的第 50 名 AI-Novel list 8 月份的流量为 508 万)。但从流量大盘来看,仍明显不如去年。
下面我们就来逐一看看每款产品的情况(CivitAI 近一年的改动主要在优化社区体验方面,但限于篇幅,这里就不多做赘述了,如果读者感兴趣,我们会视情况推出选题)。
Midjourney近半年流量和访客数据,单位:万
Midjourney 从 2022 年 8 月上线开始,一直是“王者”级别。但是在今年 3 月,我们观察到,Midjourney 的网站流量相比去年 7 月下滑了 30%,被 Leonardo.ai 超过了,而后续它的流量也没什么起色,一直在 1100 万左右徘徊。
Midjourney 8 月份流量数据,注:Similarweb 将 8 月内每 7 天的总流量加合统计,最后一个节点因为只统计了 3 天的流量,因而较低
8 月份的翘尾,是因为 Midjourney 在 22 号左右面向全部用户开放了网站访问权限,22 号之后的一周时间内,流量上涨尤其明显,8 月份环比实现了 200w 左右的访问量提升,这么看来,Midjourney 还是有点实力在的,只是随着其他模型的迭代和不断有新模型出现,差距没有那么大了。
即刻上用户对 Midjourney 和新基座模型 Flux.1 的评价|图片来源:即刻,侵删
Midjourney 所遇到的问题,其实和各种闭源 AI 模型相同,出现了技术曲线不再那么陡峭的情况,由于价格更高,竞争力变弱。根据即刻上用户的分享,现在的新基座模型 Flux.1 和 SD3,在各个领域已经与 Midjourney V6 旗鼓相当了,除此之外,开源模型还有价格便宜、部署灵活、可以靠微调模型和 Lora 控制生图效果等特点。质量上拉不开差距,又叠加闭源产品的劣势,Midjourney 的用户增长出现停滞的情况,也属正常现象。
但是有消息称,Midjourney 将在年内推出 Midjourney V6.2,甚至是 Midjourney V7,新版本的模型能否和市面上的现有模型拉开技术差距,让Midjourney 重新具备竞争优势,我们拭目以待。
数据来源:Similarweb,Leonardo.ai近半年流量和访客数据,单位:万
对于 Leonardo.ai,其实最大的新闻并不在功能更新、流量等层面,而是被收购。7 月 31 日,Canva 宣布收购 Leonardo.ai,据传,收购金额达到 3 亿美金左右,收购之后,Leonardo.ai 会保持独立运营,但其创始人和 120 名员工都将加入 Canva,其技术也会整合进 Canva 的 AI 功能 Magic Studio 中。
Leonardo.ai 生图功能的主页
除了被收购之外,相比之前,Leonardo.ai 的产品也发生了一些变化,Leonardo.ai 的最初瞄准的是游戏美术设计这个垂类场景,不仅生图效果偏向奇幻风格,也推出了线稿生图、画幅修改、3D 纹理生成等功能。
而目前,Leonardo.ai 正在横向扩展功能与场景,添加了按参考图片生图、角色一致性生图等更容易落地的功能,也推出了视频生成模型 Motion 和自研生图模型 Phoenix。社区画廊中也有为数不少的海报、Logo,甚至是建筑效果图等内容,从用户行为来看,Leonardo.ai 的落地场景更广泛了。
数据来源:Similarweb,单位:万
PixAI 的开发者是来自北京的创企时代传浮,产品主要面向二次元群体,生图风格也主要是动漫风格。PixAI 总体功能比较简单,基本就是文生图和模型训练,以及配套的社区功能。
PixAI 界面,主要功能就是生图和模型训练
PixAI 的流量算是比较稳定的,8 月份网站流量达到 590 万,虽然同比去年下降了 30%,但从近半年的流量数据看,基本都能保持在 500 万左右。能够保持较为稳定的流量的主要原因就是因为动漫主题的用户粘性较强,从月人均访问次数来看,PixAI 是所有产品里最高的。另外访问时长也不短,仅比 Midjourney 低一点。
数据来源:Similarweb,计算方法:访问量/独立访客数
但从目前的情况来看,PixAI 主打动漫生图的思路可能已经无法吸引增量用户了,继续深度服务好现有用户,还是横向破圈,历史难题再次放到团队面前,但从市场目前的境况来看,前者貌似是更好的选择。
数据来源:Similarweb,单位:万
之前,NightCafe 算是纯粹“套壳”SD 的工具,其平台上集成了 SD 和各种 C 站上的 Checkpoint 与 Lora,并给出各种预设风格,通过 Prompt Engineering,让用户使用很简单的提示词就生成能够符合要求的图片。
NightCafe 主要控制生图的功能就是Style
NightCafe 除了文生图外的其他功能
而近期,NightCafe 主要的更新集中在新功能和模型社区方面。不仅扩展了线稿生图、图生图、主题风格生图、特定姿势生图、图片风格化等功能,还支持了 Flux.1 等新基座模型及其变种模型,此外,NightCafe 还上线了各种训练模型和 Lora 的版块。
NightCafe 官方提供的新基座模型(上),NightCafe 训练模型的页面(下)
从数据上来看,NightCafe 的这些更新还是挡不住流量和用户出现下滑,虽然下滑幅度并不大。但根据 NightCafe 创始人的说法,公司一共只有 9 名员工,每月的订阅用户有 2 万左右,按照每人每月 10 美金计算,也有 20 万美金的月收入。
数据来源:Similarweb,单位:万
在去年我们观察 Playground 时,它还是一款比较典型的文生图产品,接入了 Stable Diffusion 系列模型,而且也应用了自研的 Playground V2 模型,感觉总体差异并不是很大。
Playground 旧版界面(上),Playground 新版界面(下)
但当我们时隔一年再次观察 Playground 时,发现它的界面已经发生了很大改变,似乎更像一款设计产品了。而体验过后发现,它最重要的变化就是从“生图”变成了“改图”。
Playground 界面
“改图”的主要流程是,用户上传一张基础图片,或者从系统图库里选一张,然后通过输入 Prompt 让 AI 来修改图片,通过多次迭代来完成需求,相比直接生图的“抽卡”,Playground 更加灵活,如果用户对修改不满意可以一键返回上一步,优化 Prompt 重新生成,而不需要从头开始。笔者体验下来在基础的改颜色,改背景等方面,Playground 做得不错,但有一些较为复杂的 Prompt,AI 执行得并不太好。
结合笔者自己的体验和用户反馈,Playground 总体的效果是不错的,“AI 改图”的新模式也被用户所接受。但从总体流量来看,由于新版 Playground 很难承接一些偏“娱乐”的生图用户,叠加生图赛道整个流量都有所下滑,Playground 的网站流量同比去年仍下降了一半左右。
Techjockey 上的某条用户评论,总体用户评论也比较正面
但我们观察到,目前生图赛道偏“生产力”的用户数量增加明显,部分产品中占比能达到 40% 以上,Playground 重视可控性和落地场景的“改图”模式,感受下来是更贴近落地的,只是关于落地场景的流程设计,还很欠缺,例如手机壁纸的设计和导出,没有适配手机型号,其他设计板块也都是如此,只能单纯地导出图片。
数据来源:Similarweb,单位:万
我们在今年 2 月的选题《AI 元年,被 C 端用户“证伪”了的 AI 产品(上)》中就有观察过 Lexica,这款产品的两大特点就是自研的 Lexica Aperture 模型,以及靠卡商用条款的商业化策略,当时我们下的结论是“生图效果尚可,但商业化策略可能跑不通”。
Lexica 的订阅条款
就其他产品的条款来看,Midjourney 是允许将自己做的图用于商业用途,年收入超过 100 万美金的企业,也只需要订阅 Pro 或 Mega 方案就可以商用,而 Leonardo.ai 等产品则是,无论用户是否订阅均可商用,所以 Lexica 用这点打差异化,很难行得通。
而除了商业化化外,Lexica 的产品表现也不太行,从数据来看,相比去年 12 月,Lexica 2024 年 8 月的流量又下降了 67%。主要原因一如 Midjourney,随着各种开源模型效果越来越强,闭源产品势必受到冲击,但是 Lexica 的生图质量远远不如 Midjourney,功能上也没有对可控性等层面进行优化,综合能力相比主流水平已经落后了,Lexica 被市场所淘汰,也是顺理成章的。
DeepSwap&Pornpen.ai:灰色生意还做得下去吗
数据来源:Similarweb,单位:万
DeepSwap 和 Pornpen.ai 属于两个位于法律灰色地带的赛道,换脸和色情图片生成。无论是 DeepFake 还是色情图生成,在 AI “野蛮增长”的时代是有一定市场的,但是目前,在各国监管机构已经盯上 AI 产品的当下,其道德、隐私、法律风险是越来越大的。
Stable Diffusion:经历了“破产”边缘,积极改变商业化策略
数据来源:Similarweb,单位:万,注:由于 SD 主要的应用方式是官网的 API、各模型托管平台及云计算平台,官网流量并无法反应 SD 的使用情况,所以这里我们将重点放在 Stability.ai 公司和业务层面
Stable Diffusion 作为跟 Midjourney 齐名且走开源路线的生图模型,市面上大多数生图产品其实都接入过 SD。但是就算拥有如此高“江湖地位”,其母公司 Stability.ai 仍在今年遇到了巨大困难,濒临破产。
在 4 月份我们观察到,Stability.ai 的财务状况相当糟糕,今年一季度的利润率是-600%,还欠了超过 1 亿美元的外债,加之 CEO 与核心研究团队相继离职,Stability.ai 一度已经寻求出售。但峰回路转,今年 6 月底,Stability.ai 获得了包括 Facebook 前总裁 Sean Parker 为首财团的注资,总注资额超 8000 万美元,而且,投资人之一的 Prem Akkaraju 亲自下场担任 CEO,来收拾这个“烂摊子”。
公司层面一片混乱的情况下,Stability.ai 在业务层面却一直没有停止变革的脚步。今年 4 月,Stability.ai 宣布在其官方 API 平台上首发最新基座模型 Stable Diffusion3,而到了 6 月份,SD3 的开源版本 SD3-medium 才姗姗来迟,该模型只是 SD3 的小参数蒸馏版本,“满血”版仍必须在官方 API 和其他模型托管平台使用。Stablity.ai 在用时间差和限制更强大的模型开源等方式,帮自己的 API 找差异化。
而在“自行部署”方面,Stability.ai 也一改之前“全面开源”的策略,限制了 SD3 的商用条款。年收入 100 万以上的企业或机构无论是否将模型商用,都需要缴纳部署费用,普通用户和小企业也有相应的商用限制。而对各模型托管和分享平台,Stability.ai 也开始收取授权费用,模型部署平台 Tensor.art 的运营负责人思禹告诉我们,当 SD3 改变商用条款时,业内最开始处于一种对抗的状态,CivitAI 也一度禁止了 SD3 生成的内容,以及 Checkpoint、Lora 的发布,后来才慢慢接受了新条款。
Stable Assistant 需要订阅才能使用
而在其他方面 Stability.ai 也进行了密集的探索,包括推出 ChatBot Stable Assistant,音频生成模型 Stable Audio Open,视频生成模型 Stable Video 4D 等等,而且这些模型也都给出了很明确的商业化路径。不论是在 ChatBot、音视频等“新”赛道,还是一直深耕的生图赛道,Stability.ai 的最大目标,就是“赚钱”了。
总结完这 9 款产品后发现,相比一年前,靠生图质量、生图风格打差异化的市场,今年,由于各家生图模型的水平差距逐渐缩小,各家竞争的焦点也转向了功能的丰富度,交互方式的变革,与场景的结合,及社区建设等方面。
但总体来看,生图赛道的技术与生产力的结合的确尚未达到令人满意的程度,想要回到去年同期的“繁荣”,可能还要等待技术的突破。
文章来自于微信公众号“Founder Park”,作者“白鲸小编”
【部分开源免费】FLUX是由Black Forest Labs开发的一个文生图和图生图的AI绘图项目,该团队为前SD成员构成。该项目是目前效果最好的文生图开源项目,效果堪比midjourney。
项目地址:https://github.com/black-forest-labs/flux
在线使用:https://fluximg.com/zh
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0