本文汇总了过去一年,我在社群里分享的,关于AIGC商业化的13个非共识认知——
1、AIGC的核心指标,不是节省了多少时间/人力(效率属性),而是提高了多少“转化率”(利润属性)。
2、不是技术不够,而是缺乏深度的“行业know-how”。
3、情感AI,可能反而是现阶段的低枝果实。
4、对于转化率的提升,虚拟人很可能会有“巨大”的增量空间。
5、关于Agent:目前主流的“单体智能”思路有隐患,可能的突破口是“多体智能”——类似复杂系统/鸟群,单个智能体可能很简单(不一定要超过单个人类),但整体有非凡的智慧(AI Agent 团队 >人类团队)。
6、AI产品方法论之“由用户来完成AI产品设计的最后一公里”。
7、品类!——现在并没有到AI 2.0 的“iPhone时刻”(那只是行业大佬的PR用语)
8、“场景-用户-需求”之外,需要增加一个关键词,“关系”——定义了关系,就定义了约束条件和需求属性。
9、使用AI时,把AI当成人;设计AI时,把人当成AI。
10、未来AI企业,方向定位将不是按照To C/To B来划分,而是按照To 人/To AI 来划分。
11、AI商业模式,不是短期、一下子能够搞定的——要么是打井模式(足够深、打穿为止)、要么是毛毛虫模式(不断跃迁)。
12、现阶段做AI,要对标的不是互联网,而是通信/IT。
13、未来真正的AI 2.0/元宇宙社交产品形态,核心差异化的点,不仅是人和AI社交,更在于“AI和AI交互、人去看(消费)这些AI产生的内容”——那不是“游戏”,而是“生活”。
下面8000多字,慢慢看,一定是值得的——
ps,其中很多内容源自“黄钊的AI日报”,今天是早鸟价最后一天,具体介绍和操作入口,详见文末或“阅读原文”。
一、背景:去年Lensa日入300万美金、今年妙鸭爆火,但昔日脸萌们的本质隐患,并未解决
去年12月,Lensa日收入300万美元(详见《Lensa!ChatGPT之后,又一个有破圈能力的AIGC产品》。
某开发者做的AvatarAI,上线2天、收入1万美元(详见《一天赚一万美元,这个AI图片生成工具火了》。
这类产品,其实本质上都是“AI头像生成器”,提供的是个性化/炫耀价值,核心是“社交”两个字——虽然确实短期容易爆、吸金能力很强,但问题在于,这类产品都需要依附于某个成熟、强大的社交平台(类似QQ秀生长于QQ),才可能“长期”巨额盈利。
要想通过AIGC,自己来沉淀社交关系链到一定数量级,短期是不现实的。
最近“妙鸭相机”的微信搜索指数,已经在大幅下滑了——
当然,如果能够赚一波流的钱,也挺不错的了;但总有人希望更能稳定、长期的赚“系统”的钱。
二、一个非常有价值的案例:PhotoRoom
PhotoRoom具体是做什么的?服务于二手电商卖家,去掉图片背景、并增加各种细分电商应用场景所需的背景和效果。
PhotoRoom的数据表现如何?去年12月的数据是:下载量4000万,月活MAU 700万,每天处理的图片300多万张;基于订阅费9.99美金/人/月,2020年8月突破100万美金ARR,每个月的增长基本上都在 50%以上(详见这篇报道)。
问题是,PhotoRoom仅仅是给用户节省了时间,就能让用户这么心甘情愿的付钱吗?NO——
PhotoRoom的价值,不仅是节省大量时间,还能提高卖家的销售转化率——针对各个细分场景,提供具有专业设计感的照片,用户使用后,平均提高了31%的转化率!
比如社交媒体(它还细分出了 Twitter、Instagram 等)、各种电商网站(具体再细分为 Ebay、Poshmark、Depop、Etsy、Shopify 以及亚马逊等各种类型的电商平台)、网络小店、杂志风格(再继续一大堆细分)、直接具有销售文案的图片以及各类风格类型模版,各种模版超过了1000个!整个优化生成的图片非常的有专业设计感,操作也是非常简单。
这个案例对咱们的“底层参考价值”在于,这是一个AIGC商业化的靠谱思路——
1)切细分场景、切细分用户;
2)AIGC出的东西,要能明显有助于其商业活动——不仅能节省时间,还要能提高客户商业路径上的转化率;
3)基于2,所以一开始就可以收费!(因为用户算的过账,整体是值得的)
4)要做到3,创始团队需要对该行业具备深度know-how(就能够拿着锤子敲钉子了)
这里有一个非常微妙的地方:PhotoRoom的功能,既能节省用户时间,又能提升转化率,到底哪个指标是最core的??
回忆下那个经典的对比案例:智能手机(iPhone)也有电话、短信等通信功能,但是其真正决定成败的差异化价值,其实是娱乐/社交/购物等等其他功能,重点指标也变成“占有用户时长”等等,而并不是打电话的通话质量等通信指标了!
也就是说,降本增效类指标也有用,但不是“决定成败”的关键,因为人类天然更愿意为开源付费,而不一定是节流,特别是在中国,特别是小B和大C。
1、不是技术不够,而是缺乏深度的“行业know-how”!
传统互联网的各种网络营销功能,也会通过优化标题、图片来提高转化率,但有一个问题,就是总觉得颗粒度太大,做不到真正的“千人千面”。
为什么做不到呢?我认为,关键不是模型、算法、算力不够,而是因为真正要做到足够细分人群/场景的千人千面,需要对那个最细分领域具备深度know-how!
比如在9月2号的「AI日报」里(https://t.zsxq.com/11bvl2Gbd ),分享过某篇文章里的这几段话——
a)设计一个直播数字人,如果没有行业理解,很可能是一个端庄、颜值高、说话语气舒缓、手部有一些简单动作的产品,事实上直播完全不是这样的!
b)你必须知道大家平均在直播间停留的时间有多长、必须知道直播有忙时有闲时、必须知道什么时候全身出镜/什么时候半身出镜、必须知道直播间里的人的分工和配比,模型训练要结合主播的语气/风格,甚至要跟这个行业相匹配的方式做对应的串联,这样才能保证大家看到的是一个真实的东西。否则就会出来一个傻傻的主播。
c)很多专业领域,要知道哪个环节是容错率高的,哪个环节是容错率低的,这样才能保证是一个好的应用,否则就是一个泛泛的、拉平的东西。
d)做垂类的话,除了模型外,还要了解行业Know-How,否则是做不出来的。
另外,特看科技CEO乐乘最近分享过——
a)做了一个AI生成视频的系统,可以细分为脚本生成、画面生成、声音生成和组装编辑四个层面,对应视频的三个维度和故事线。
b)客户向我们表达需求,或者选择一个参考视频案例,我们给客户生成结构化的脚本、是有语义标签的一套协议,比如分镜一是一个人在讲文化,分镜二是产品展示,分镜三又是讲其他什么,类似给一条视频打码,再加上客户给的一些产品视频,或者我们生成的图片素材,以及数字人,就可以以脚本为依据去,一键组装出一条视频来。
c)我们的脚本,来自过往平台里已经爆了的爆款视频,微调之后生成我们自己的语料库,它爆款概率和人比有优势(10条里,跑爆的概率有两到三条)
(详见8月25日星球推送 https://t.zsxq.com/11nNjUV0w )
我虽然没怎么做直播,但做IP/社群6年,有不少经验教训,能一眼看出,他们真的是深入行业了的,因为——
一方面, 里面有一些核心关键词:复制爆款、公域引流、私域转化等等,这些,直接指向的就是“转化率”!
另一方面,里面有很多很多的细节——真正的牛人,不是那种抽象词汇满天飞,而是非常“乐于”诉说细节的;不是因为细节里有魔鬼,而是因为细节背后有认知,而且是能“从底通到天”的那种认知。
2、情感AI,可能反而是现阶段的低枝果实
为什么情感AI重要?这里涉及很多个认知点:
a)“情感”是比NLP更底层的东西。
b)AI/机器人在(多模态)表达时,人“必然”会被动的有“情感体验”,这不是以人的意志为转移的。
c)“真正的情商是理性的……一个有情商的人,会让别人如沐春风。”
d)对于有情感亲密度的对象,我们更容易信任他的推荐(转化率更高)。
e)总之,“情感”很可能是未来AI真正的突破方向之一,未来会有很多的“黄金机会”——效率最优,升级为情感最优。
……
为什么说,情感AI可能反而是现阶段的低枝果实?
可能是因为,一方面,“情商”本身是更稀缺的素养,另一方面,情感价值,是用户侧更加普世、更容易被感知的价值。
比如,大众情商平均水平是60分、人性需求是至少75分,而ChatGPT默认有70分的水准——这里就有60分—>70分之间的低枝果实可以摘取。
在6月15日的AI日报中(https://t.zsxq.com/11Lt2XYHu ),分享过一个“医疗+ChatGPT”相关例子——
另外,在专业领域,ChatGPT类产品的准确度、稳定度,可能暂时只有6、70分、反而达不到95分的商用标准线(人类平均水准是92~98%,所以95%是可感知、可接受的那根线)。
3、为了提升转化率,AIGC的最佳产品形态,可能是“虚拟人”
why?因为虚拟人是文字、声音、图像(表情/动作)等多模态信息的集大成者,是最自然的情感沟通形式。
小冰CEO李笛提到过,几年前开始,他们和MSN以及Lawson做了大量实验,实验内容就是让AI Being和人交流,最终目的是把商品准确地推送给人,同时让人能够更愿意接受消费的商品。“最终测试表明AI推荐的商品购买率达到68%,与绝大多数人类员工推荐的购买率差不多”。
要知道,互联网/移动互联网时代,常规的推荐系统或AI 1.0时代的人机交互系统,即使把推荐算法、NLP做到极致,购买率据说也不超过20%——这里面有多么大的增量空间!这是很多做AI的人,之前没意识到的认知维度。
多说一点,比虚拟人再进一步的本质形态,就是最近非常火的“Agent”;但这不是本文重点,这里只说一点:
目前主流的“单体智能”思路会有隐患,可能的突破口是“多体智能”,类似复杂系统/鸟群——单个智能体可能很简单(不一定要超过单个人类),但整体有非凡的智慧(AI Agent 团队 >人类团队)。
具体详见星球文章《开眼:复杂科学可能将暗中推动AI 2.0时代_20230904》https://t.zsxq.com/118AIpLpk
4、除了产品侧的优化,还需要“由用户来完成AI产品设计的最后一公里”
AI产品设计=AI+人工+用户——用户拿到产品后,还需要完成“个性化”的设置过程(主动+被动),补齐最后的5~10分。
这背后详细的认知思考,以及5个具体案例(4个To C、1个To B),详见我之前分享的这篇文章《AI产品方法论之“由用户来完成AI产品设计的最后一公里”》
核心指标背后,其实有更重要的一层认知——品类。
只有“量”、没有“质”的产品,其实都是还没有真正“立住根”的,比如之前的智能音箱,都还不算真正成为一个“新品类”。
在《如何从“品类”角度做AI产品(2C)的需求定位》一文中我提到,“新品类,往往意味着新指标、新标准(交互/OS/硬件)以及新应用(杀手级)”。
很明显的,这些都还没有“立”起来,篇幅有限,本文主要先探讨一个重要问题,新交互标准是什么?——
今年Sam Altman就说过,
“我认为提示工程不重要,未来通过文字或者通过语音来进行交互……如果只是在提示最后加上一个非常傻的magic word,然后以是否知道这个magic word来作为工作好坏的标准,这实在是太蠢了。”
说到新交互的本质,V神的这句话,是比较精炼的:human describes, AI builds, human debugs。
网上很多关于CUI(有的用VUI或LUI)的探讨,大多是what层面的内容、有点绕。这里分享一些我之前没公开说的相关“认知”——
1、过去互联网/移动互联网时代,典型的思考格式是“场景-用户-需求”(什么场景下,怎样的典型用户画像,有什么痛点需求)。
AI 2.0时代,需要增加一个关键词,“关系”。
某个Agent,在这个场景里,和用户(或者其他Agent)之间,是什么关系?定义了关系,其实就定义了约束条件和需求属性。——比如老板/领导对下属,家长对子女,天然就有“优势地位”,同样的话,会比其他人份量更重;还比如,同样的话,夫妻之间可以说,但对外人,就得换个方式表达了。
2、使用AI时,把AI当成人;设计AI时,把人当成AI
源自我星球分享《使用AI和设计AI,其实是镜像_20230511》(https://t.zsxq.com/0fNoeJ8yR )
1)使用AI时,把AI当成人
使用ChatGPT时,初阶是当成“搜索/工具”来获取信息,更有价值的方式,是把她(AI)当成一个人,是为了“激发”自己的灵感。
这方面,网上有些同行也在说,就不多谈了。不过重点推荐一个1.5小时的干货视频——我的朋友文君讲的《从n走到n+1:未来5年,AI创业公司CEO和产品经理的生存法则》
下面重点说第2点——
2)设计AI时,把人当成AI
在设计“XXX+ChatGPT”类产品体验时,应该怎么去思考呢?
完全跳过目前的技术局限性,直接去回想/体会,自己平时工作/生活中,是怎么跟一个活生生的人在对话交互的。
还包括,今后和自己身边的人对话时,可以让自己把他当成一个AI,去体会你们之间的对话过程,会自己冒出很多的feature思路和认知出来的。
3、“什么情况下用默认 GUI,什么情况下用CUI?”
高频、用户需求已经很明确、用app已经能够很好解决的需求,默认用app/GUI;
低频长尾、用户需求模糊的场景,更适合用CUI。
当然,未来CUI习惯了,是否还需要GUI,不确定。或者说,在ARVR世界里,可能会很自然的统一交互体验。
ps,多说一句,提“LUI”(L-language,语言),可能是最近1、2年接触AI的朋友说的比较多;5~10年前第一批AI从业者,当时说的都是“CUI”(C-conversation,对话),个人认为更切中关键。
早期,2B的公司,不用那么考虑最终2C产品的体验好不好,反正我把工具提供给你,怎么用客户自己的事;
后来(5~8年前),我们给客户公司提供AI解决方案时,不仅需要考虑产品体验设计问题,甚至由于太超前了,所以需要引领客户(该怎么做),弊端就是,10家头部公司里面,可能只有1~2家认可你的非共识。
这里面背后原因,可能是因为曾经没有人(公司)可以hold整个端到端的落地打通,或者没办法把各种能力足够打散、原子化。
而大模型天生就是干这事的。
现象上,从需求侧来说,2B/2C的融合已经有所苗头。比如,我个人非常需要RPA+LLM的功能,但目前各家公司就是优先做2B,我就得等;但其实,我只是需要那些功能逻辑而已,本质来说,不是一样的吗。。。
所以未来可能是,LLM提供基座能力、中间层提供原子能力、用户完成最后一公里(按需、自己攒一个“趁手”的工具)。
用户侧,就这么打通了。2B、2C,融为一体。
然后呢?
然后,是另外一片天空——机器和机器交互。
比如在另外一篇文章里提到的,“agent 如何被主 agent 发现,如何被合理调度,如何获取商业价值……以及,为了交付好的结果,应该如何主动去搜寻、评估和整合其他 agent。”
还有,机器和机器交互,所需要的数据格式标准(比如3D相关)、存储和传输等等基础设施,以及应用层面的很多东西, 都是非常非常有价值和商业前景的。
只不过,现在,大家还看不清。
(本小节,详见我的星球分享《未来AI企业,方向定位将不是按照To C/To B来划分,而是……_20230614》 https://t.zsxq.com/11m0gcuvO )
不过,知道这一步还不够,还有一个非常非常重要的AI商业化认知——
1、打井模式
在8月28日“AI早报”里(https://t.zsxq.com/115X6C3bD ),介绍过李智勇李总的相关分享——
2、毛毛虫模式
去年12月,我在星球文章《AI落地的本质是管理咨询,服务能力和工程化能力才是商业模式跃迁的基础》(https://t.zsxq.com/11j3Em1OM )中,摘录过某篇干货文章中的要点:
基于毛毛虫模式,还有一个非常有意思的引申认知——
在模式上,把AI看成传统的通信/IT行业,更容易让我们拨开迷雾、认清路径和边界。
1、上面文章《AI落地的本质是管理咨询,服务能力和工程化能力才是商业模式跃迁的基础》(https://t.zsxq.com/11j3Em1OM )里还提到——
1)通信行业人才,更容易具备服务能力和工程化能力,因为也是一直服务于大B客户……给客户完整的、交钥匙级别的解决方案。(有软硬件集成、运营能力和大客户服务能力)
2)关键在于,服务能力和工程化能力一样,是创业团队要在之前的人生旅程中实践获得的。(hanniman评注:速成不来)
3)AI项目里边,其实只有5%是AI,其他都是业务梳理和场景工程。……这真的跟SaaS项目很类似,都要帮助客户梳理流程,整理业务边界。
2、类似的,在上周星球推送《始于2010年前后的AI 1.0 创业浪潮,实际上是集体失败了》(https://t.zsxq.com/11PZWBdKa )中,我还介绍了李智勇李总的相关思考——
1)……IBM System/360这类大型机就是这么干的。那时候人们不太知道什么是IT技术,和现在人们不知道人工智能到底干什么的类似。
2)那时候的大型机是一种复杂整合,从硬件到系统到应用。最终以一种方案的形式去解决大型机构的问题,比如银行、保险等。
3)在贵的领域完整整合新技术、创造此前没创造过的价值,然后再围绕着这个基点完善售前、产研、供应链、售后等各方面,这就构建了起点上的商业模式。
4)分析起来就用五力模型。一定不能用平台模式。所以前面才提到IBM System 360。
5)AI潜力的关键在于其背后的技术具有共通性。当累积到一定量之后,就具有变成系统型超级应用的机会。这在过去一样发生过。微软当年给IBM配套的时候,其实就是供应链的一环,等到Windows平台化之后,产业中心就转移。PC厂商被边缘化,大型机没落。
3、补充说明下,最近有位产品经理来找我做“1v1咨询”,他原本对未来的个人发展机会看不太清,但他早年在中兴工作过几年,所以我给他点出的4个机会之一,就是可以想想:
(以上这个小节,详见星球分享文章《做AI,对标的不是互联网,而是通信/IT?!_20230815》https://t.zsxq.com/11bceBcP9 )
1、7月26日“AI日报”里(https://t.zsxq.com/11EVR0mkf ),分享过投资人王煜全老师的观点:
2、未来真正的AI 2.0/元宇宙社交产品形态,是怎样的?
我的非共识认知是:核心差异化的点,不仅是人和AI社交,更在于“AI和AI交互、人去看(消费)这些AI产生的内容”,类似电影《失控玩家》里男主角在虚拟游戏世界里逛——本质来说,并不是在“努力/精神紧张”的玩游戏,而是在放松的过一种虚拟生活。
有这种产品出现吗?我很早在社群里分享过的小冰岛app(来自小冰公司),其实是有苗头和机会的;可惜,由于一些不方便公开说的原因,据说继续做下去的机会不大了。
另外,我6年前分享过,真正的“AI原住民”,至少是“10后”——至少等他们成年之后,才是To C方向AI产品真正爆发的timing。
3、具体的AIGC/LLM产品落地方向,本文不细说了,详见我之前的星球分享文章——
-我看到的AIGC落地机会 1)Summary AI Service https://t.zsxq.com/0dOqlnIpx
-我看到的AIGC落地机会 2)AI陪伴 https://t.zsxq.com/0dV6sEyOm
-我看到的AIGC落地机会 3)IP知识库+ChatGPT https://t.zsxq.com/0dCRzYnIE
-我看到的AIGC落地机会 4)和用户社区结合 https://t.zsxq.com/0db51xXLf
-我看到的AIGC落地机会 5)_外语学习+ChatGPT https://t.zsxq.com/0enF8mbwb
文章来自于微信公众号 “ hanniman ”,作者 “ hanniman ”
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales