最近,OpenAI宣布DALL—E 3正式上线ChatGPT Plus和企业版,这意味着,AI绘画对于OpenAI不再只是个图新鲜的玩具,而是开始实打实地赚钱了。
从行业的角度来说,这似乎是一种必然。
质量越高,性能越好的AI绘画,所具有的技术壁垒也就越高,而在此基础上构筑的”付费墙”,也就成了顺理成章的事。
可问题是,目前的AI绘画赛道上,除了三巨头之外,仍存在着数量庞大的开源AI绘画。
在绝对实力相对较弱,且处于开源的状态下, 这些种类各异的AI绘画,究竟是如何找到自身的差异化优势,并实现盈利的?
在目前国内外繁茂的AI绘画生态中,各大中小企业的盈利模式,可大致分为两种。
其中最常见的一种,是定位于下沉市场,着力于不断降低用户使用成本,并以此为付费点的模式。
而在这方面,以下这些国内外AI绘画,可以说是一个典型的例子。
作为国内诸多的同类AI网站中,海艺AI最大的亮点,就是通过一系列“辅助功能”,让许多没有美术知识,也不掌握专业提示词的用户,能够最大限度地按照自己的想法,创作出想要的作品。
目前网络上流传的各种看似精致的AI绘画,往往是由十分庞大且复杂的提示词堆砌而成。
有时候,用户看到了别人用AI生成的图片,觉得效果很好看,也想创作一张类似的,但却因无法明了背后的提示词,而难以下手。
因此,海艺AI推出了一系列诸如“语义分割”、“边缘检测”、“深度检测”功能,旨在让用户能找到那些“自己叫不出名字”的效果。
如此一来,用户就无需跟复杂的提示词较劲,只需上传自己中意的图片,AI就会智能解析其中的关键元素。
目前,海艺AI采用的商业模式,是VIP与免费并行的做法,免费用户仍可进行图像生成,不过将受到生成数量、速度方面的限制,而VIP用户在解锁无限生成的同时,还能开通最新的海艺2.1版本。
如果用一句话来形容无界AI的特点,那就是其巧妙地找到了一种解决AI绘画“提示词”痛点的办法。
具体来说,在无界AI的生成页面中,用户只需点击输入框上方的“咒语生成器”,就能在弹出的页面中明晰地看到各种物品、风格乃至镜头和视角等效果的提示词。
如前所述,如何让普通用户在进行AI绘画时,通过一个个提示词,精准地画出自己想要的效果,已经成了AI绘画普及的最大阻碍,以至于这些玄之又玄的提示词,在外行人看来已经成了一种“咒语”。
然而,通过对这一个个提示词的拆解,无界AI让整个文生图的过程透明化了,从角色、五官、表情,再到姿势、动作或环境,用户都能在其中找到对应的提示词,从而极大地降低了整个创作过程的门槛。
目前,无界AI与海艺AI一样,采取的是VIP与免费并行的商业模式,开通会员后,用户不仅可以获得更多的专业版使用时长,同时还能解锁更多专属模型、参数和训练空间等等。
这种手把手的,细致入微的“关照”,也许对AI绘画经验丰富的老手来说根本不值一提,但对下沉市场中大量的,几乎从未或很少接触生成式AI的用户来说,这样低门槛的体验,就成了其“用与不用”的重要界限。
实事求是地说,自生成式AI大火以来,虽然AI的易用性、通用性虽然一直在提高,但社会离“大部分人都会用AI”这一现状,其实还有很远的距离。
笔者曾于某个微信群中得知,某些位于二线城市的用户,虽然也对midjorney、DALL-E3之类的AI绘画感兴趣,想尝尝鲜,但是仅仅翻墙、注册账号等繁琐的过程,就直接劝退了大部分人。
因此,在AI绘画领域,有时比技术壁垒更重要的,是触达的速度和范围。
除了降低使用门槛外,另一类AI绘画,则走上了更注重个性化、风格化的路线。
毕竟,Midjorney、DALL-E3之类的顶流AI绘画,尽管性能虽强,但却未必能满足用户各种细微的、多样化的需求。
而这些未能满足的个性化需求,则成就了如下AI绘画得以繁茂生长的生态位。
在个性化方面,Artguru.ai的亮眼之处,就在于其不仅在AI绘画方面,提供了多种备选风格,如动漫、油画、卡通、赛博朋克等,而且用户还能在Artguru.ai上用一种类似妙鸭相机式的AI头像生成器,创建风格鲜明的艺术头像。
可以说,这种将AI绘画与头像生成相结合的功能,精准地戳中了目前AI图像领域的盲区:
目前能换脸的AI应用,如Deepface、Faceswap等,无法做到在换脸的同时进行个性化、风格化的图像处理,而这样的需求盲区,就给了生成式AI与换脸技术相结合提供了契机。
目前,Artguru.ai采用的是订阅制的商业模式,用户可按周,或按年进行付费,开通付费后,用户可以体验更快的生成速度,并且每一张生成的图片都能得到私有的商业版权。
作为一个SD(Stable Diffusion)生态网站,Liblib提供了各种风格迥异、样式独特的SD大模型。在这里,除了一些众所周知的热门模型外,你还可以找到多种如赛博轻机甲、蛛网婚纱、手办风格转换等冷门、小众,或垂直性较强的模型风格。
而这种依靠用户自发定制、微调,并主动上传模型的做法,也造就了其活跃的社区生态。
诚然,这些多样化的风格与效果,用户也可以自己在SD上通过复杂的提示词实现,然而,一个活跃的社区生态,总是能源源不断地涌现新的、更具创意的模型。
而这样的“惊喜”和“意外”,是单纯的技术壁垒所无法造就的。
在商业模式上,liblib.ai 采用了以模型为主的盈利方式,在开通会员后,用户就可以训练自己的专有模型,这对于许多有定制化需求,以及追求个人风格的用户来说,是一个十分具有吸引力的付费点。
如果连“个性化”、“差异化”这种事,也变成了一种内卷的、同质化的竞争,那怎么办?
在目前各大AI绘画网站均推出模型定制功能的当下,秒画AI给出的答案是:在一个垂直方向精耕细作,直至达到惊艳的效果!
在内置了全新的美学引导系统后,最新的秒画Artist v0.3.5能够生成更具艺术性且媲美专业摄影级别景深效果的画作,使得画作内容更有镜头感,纹理细节更有美感。
同时,秒画AI针对二次元风格和亚洲人像进行了大幅优化,提升了图片质感和画面观感,使其在人像生成、动漫角色等方面更具优势。
目前,秒画尚未开通自身的盈利模式,是一个免费的AI绘画社区,但根据其存在的“模型广场”、“图片广场”等模 块来判断,随着用户的增多,其将来也有可能采取类似UGC社区那样用户驱动的商业模式,像liblib.ai那样以模型训练次数为主要付费点。
由此可见,在当下的AI绘画赛道上,虽然竞争者众多,且三 巨头(MJ、SD、DELL)仍在不断深挖护城河,但众多厂商仍找到了自己独特的生态位,并由此构建出了一个百花齐放,纷繁迥异的行业格局。
从目前AI绘画的生态来看,所谓“壁垒”的意义,在此前着实被行业高估了。
此前,业内一直有人认为,AI绘画,尤其是开源AI绘画,想要盈利往往是困难的。
因为技术门槛不高,就意味着人人都能抄,人人都会用。
按照这样的认知,在这种情况下能实现盈利的,就只剩下了Midjourney、Dall-E这样拥有绝对优势,且模型闭源的AI绘画应用。
Midjourney付费页面
然而,市场却告诉人们,除了“绝对强大”的绘画性能外,用户更希望使用门槛更低、体验更好,以及多样化、个性化的AI绘画应用。
无论是提示词辅助、模型定制,还是垂直领域的精耕细作,都显示出了AI绘画这条赛道上各种盈利的方向与可能。
从这个角度上说,所谓的“竞争者众多” 、“门槛被抬高”,不仅是一个无需多虑的情况,甚至反而还是行业繁荣的标志。
因为只有在一个经过验证,有盈利可能的赛道上,才会涌现出如此繁茂的景象。
本文来自微信公众号“AI新智能”(ID:alpAIworks),作者:AI新智能
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0