AI创业进行了大半年后,除了大模型的进展,整个市场都在等着AI创业交答卷——交出爆款应用,但似乎不够多,原因是什么?
本质原因是基础模型处于1岁还是18岁。
躬身入局,真的在模型层和应用层投了一些项目后,我们有了一些新的认知,对AI里有巨大创业机会更坚定,也对AI发展的timing更有体感了。
现在过千万日活的AI应用有四个,ChatGPT、Midjourney、Character.ai、Github Copilot,但充分验证的应用还不够多,为什么?因为行业的年龄,年龄决定了能力框架。
移动互联网的发展有三个关键时间点:
2007年,iPhone1发布,mobile一岁,打响了发令枪,移动互联网的产业链从零开始构建。
2010年,iPhone4发布,mobile发育到了18岁,有了清晰的能力框架,我们今天用的iPhone相比iPhone4是没有质变的,只有性能上的量变。同年,美团成立,小米成立。
2012年,是移动互联网应用爆发年,智能手机的渗透率跨过20%。同年,字节、滴滴、小红书成立,快手开始转社区,饿了么开始起量,2013年美团开始立项做外卖。
2012年的春节,PC端的流量跌下去后,再也没有反弹回来,流量的接力棒交到了移动互联网手里,从此移动互联网开始了为期七八年的狂飙。2012年是PC互联网的“万历十五年”,承上启下,草蛇灰线,伏脉千里。
AI行业发展起来,也会有这三个关键时间点。
2022年,GPT-3.5发布,生成式AI一岁,基于大模型的产业链从零开始构建。
当下,可以对标到mobile 2009年,正在等待AI的“iPhone4时刻”,一个能力框架更成熟的大模型。AI和互联网很不一样,互联网是从拨号上网开始就在支撑很多应用场景了,即便网速是龟速,而AI需要达到一个较高的智商才能应用,一个模型的50分和60分,在用户眼里是0分和1分的差别。
18岁的大模型应该有哪些能力?它需要具备更强的推理能力、更长的文本记忆能力、更少的胡说八道、以及多模态的理解和生成能力,尤其是视频生成。也需要更低的计算成本,更快的推理速度,逐步实现秒回。大模型将会有自己的“摩尔定律”,每年能力提升百分之多少,以及token成本降为几分之几,这个定律很快会变得清晰起来。
国内的头部的大模型厂商,基本今年年底到GPT-3.5的水平,基于GPT-3.5可以做写广告写总结的应用了,但更复杂的应用需要更强的推理,明年下半年到GPT-4的水平,这时应用开发的格局会打开很多。OpenAI明年也会发布下一代大模型,乐观来看,半年到一年后,模型可能会到18岁。
iPhone在迭代到iPhone4后,能力天花板就打住,不再有质变了,之后几年都是量变。但很可能,大模型的能力质变放眼数年不会打住,从GPT-1到GPT-4 turbo的每一次迭代都有质的变化,scale up还没碰到天花板。当下,大模型的能力约等于普遍意义上实习生的能力,未来会进化到一个科学家的水平,最终超越所有人类的智力上限,这是模型的纵向进化。
横向来看,大语言模型只是AI版图的一部分,基础模型的第一性原理已经出来了——“predict next token”,这个原理有可能带来其他模型:
如果未来transformer或者另外一套算法能够准确预测下一帧,那么视频模型就出来,就有机会解锁下一个抖音级别的内容平台;如果能准确预测下一串动作序列,那么具身智能模型就出来了,就解锁通用机器人了;如果能准确预测下一个蛋白质序列,那么蛋白质模型就出来了,新药研发又可以迈进一大步了;如果能准确预测下一个像素,那么3D模型就出来了,就解锁元宇宙的构建了。
版图完全解锁后,我们会看到多个基础模型,而很多方向的边际成本会趋近于零,不断解锁新的应用层的机会。
一个平台从1岁走到黄金年龄,会经历很多真伪机会。回头看移动互联网的早期,有四类机会都曾霸榜。
第一个类机会叫“手电筒”,是伪机会。2010年之前,手电筒这类小应用经常霸榜,用手机照明确实是个大需求,但这种小工具太简单了,后来成为手机系统的标配,手电筒应用也就消亡了。
第二类机会叫“汤姆猫”,是小机会。汤姆猫很巧妙的用到了手机的麦克风,你说什么话,它就会用猫的语气来复述。当时日下载量到了百万级别,但没有长期留存率,因为玩法单一,和猫对话几天后就没有新鲜感了。后来汤姆猫被中国的一家上市公司收购了,作价70亿人民币。
第三类机会叫“91手机助手”,是阶段性机会。在移动互联网早期,应用商店谁做谁起量,当时有91手机助手、豌豆荚、安智等诸多玩家,91是其中做的量最大的,退出上做的最漂亮的。2013年,91手机助手作价19亿美金卖给了百度,当年19亿美金是一个破纪录的价格,创始团队和投资人皆大欢喜。
2013年前后,买了手机的第一需求是什么?是下载很多应用尝鲜,神农尝百草。应用商店因为刚需高频,又有分发能力,被很多人想象成移动互联网入口。十年过后,手机上的killer App收敛为十几个,这十几个应用成为移动互联网入口。应用商店最大的历史使命是把那十多个killer App扶上宝座,很少有人会想起当年的91和豌豆荚了。
第四类机会叫“抖音快手”,是真机会,有长期的留存率,能构建商业模式,且有一定的护城河。这类机会放在mobile早期,是张“暗牌”,很难估算市场规模,更难想象未来是千亿美金的公司,可遇不可求。
今天在AI的早期阶段,摆在我们眼前的依然是这四类机会,我们需要想清楚,谁是AI时代的手电筒,谁是AI时代的抖音快手。基于大模型的套壳应用是新时代的手电筒,很短的时间就会被大模型的能力击穿;基于AI做出的一些原生小爆款应用,如果玩法过于单一,无法形成自己的资产,很可能成为新时代的汤姆猫;而新时代的抖音和快手,还很难想象长什么样子,更大的可能是,未来的抖音今天还刚开始做今日头条,甚至内涵段子,这是一个进化的过程。
每个平台崛起时,都有属于它的native应用,这是给到创业者最大的机会了。
早期的mobile native App长什么样子?2011年时,KPCB的合伙人John Doerr把mobile native总结为SoLoMo—Social、Location、Mobile,当时很符合SoLoMo的应用叫FourSquare,你可以用FourSquare在一个地点签到,比如你经常在一个酒吧打卡,就会获得这个酒吧的荣誉勋章,经常出现在一个地方的人可以相互交友。当时这个应用的下载量一度很高,但留存率很低,因为玩法太单一了,不够好玩。若干年后,位置定位成了每个应用的标配功能。
什么是真mobile native应用呢?美团外卖肯定是了。但在外卖应用的整个价值链中,location定位起到的作用只有20%,80%的价值是靠线下的商户资源和物流配送创造的,但location起到作用是画龙点睛的,这20%的作用撬动了整个业务流程,因为手机的location属性,我们才能查到方圆几公里的餐馆,外卖小哥的位置才是实时可调配的。
什么是mobile native?不是100%原生于手机的应用,而是因为有手机,体验和价值被放大100倍的应用。
AI native也是一样,AI native并不一定100%依赖于大模型,大模型在其中可能只起到20%的作用,但这20%是画龙点睛的作用,解锁一个之前完成不了的任务,这才是真AI native。
任何一波平台机会起来的时候,首先被创造出来的是工具。
回头看mobile上最终立住的十几个高频应用,微信、淘宝、拼多多、抖音、快手、美团外卖、滴滴、小红书等,很少有纯工具,他们最终是靠核心资产立住的——微信靠关系资产,抖音快手小红书靠内容资产,美团外卖和滴滴靠线下资产、淘宝和拼多多靠商户资产,这些资产形成了产品的供给,也就是供给即产品。
为什么纯工具很难立住,必须要构建自己的核心资产?纯工具的用户价值100%靠代码传递,代码的复制成本很低,最终大家功能类似。对C端产品来说,一定要找到代码之外的优势,微信的价值来自于通讯录,抖音快手的价值来自庞大的视频库存,美团的价值来自商户和骑手网络,最终资产上形成差异化。
同样的道理,也适用于AI。未来,ChatGPT不应该是单纯的问答形式,而是可以调用各种Agent完成任务,有点像all in one的微信。Midjourney不应该单纯的做一个“图片设计师”,而是生产有情节、有意思的内容,它的价值来自内容消费,有点像今天的内容平台。
工具与资产之间,往往是动态变化的。很多产品day one就不是工具的定位,抖音day one就是短视频内容社区,美团外卖day one就是外卖交易平台,他们的产品界面从第一天开始就没有大的变化,最牛的产品往往是大轮廓不变,里面的资产反复迭代的。也有一部分产品day one是工具,很快做了转型,比如gif快手最初是一个视频转gif的工具,一两年后转为短视频社区,而他的爆发也是在转了社区之后。
北坡上,南坡上,都有机会,但不要长期在工具形态恋战。起步可以是工具,但终局拼的一定是资产。如果这个问题第一天就想清楚了,那么最好起步就做资产。
前面有很多AI和移动互联网的类比,但真的在参与了一些AI项目后,我发现AI和移动互联网的创业规律很不一样。
首先,AI创业的0到1的验证的时间更长。做移动应用时,我们可以把产品缩减到单一功能,两三个月做出一个MVP,上线就可以验证了。移动应用限定了场景,比如我们做一个打车软件,因为产品定位和特定的交互逻辑,用户只会用它打车,肯定不会在里面搜新闻。
但AI产品不一样,用户面对一个有AI属性的聊天框,会输入任何内容,试图探测它的边界,一旦这个产品接不住,用户就有可能会离开。MVP在AI上一定程度是失效的,或者说AI产品的MVP构建的时间拉长了。
移动产品往往面对的是用户确定性的需求,打车就是打车,外卖就是外卖,AI产品面对的是用户的不确定性需求,面对一个框,用户会和模型聊everything,怎么管理用户预期是个重要命题。年初的时候,大家惊叹于ChatGPT的能力,是因为看demo容易感受到模型能力的上限,而真实使用时,能否留的住用户,是由模型能力的下限决定的。
第二,一旦PMF找对后,AI创业1-10的发展速度会更快。之前PC和移动互联网两波平台级创业,都是一边铺终端,一边铺应用,应用普及的速度受限于铺终端的速度,而AI创业是在现成的手机和PC上做应用,只要是个惊艳的产品,就会以闪电的速度铺开,ChatGPT、Midjourney用小几个月时间突破亿级用户,已经验证这个规律了。
但因为每个终端的位置都被占满了,没有流量红利,这就要求新的AI产品必须十倍好于之前的产品,最好是解决了之前一直无法解决的问题,才有机会冒出来。
之前PC和移动互联网创业的早期,商业设施是不成熟的,没有现成的支付体系、变现方式、流量投放。移动互联网早期,大家根本不知道如何在手机上赚钱,feed流广告是绝对想不到的。放在AI创业的今天,这些商业设施都是现成的,但模型这个发动机是不成熟的。
这会发生一件事,一些聪明人会先拿一款50分的AI产品练兵,一上线就开始商业化,摸索增长方式,一通实战后把这个产品本质看透,等到基础模型的18岁到了后,换上新款发动机,直接起飞。之前互联网的那种纯圈用户,没有变现模式,纯烧钱的情况不太会在AI创业里发生了,AI应用自带赚钱模式。
第三,大的竞争会提前,创业公司在突围的时候很可能首战即决战。2010年的时候,很少有大厂提出移动优先,直到2012年,一些大厂还在观望移动互联网的机会,这给了创业公司猥琐发育的时间,暗牌变明牌的时候,大厂已经按不住创业公司了。字节之于百度,拼多多和美团之于阿里,米哈游之于腾讯,都是创业公司从边缘走到核心地带,对着大厂掀桌子,这让大厂的管理层多了一层VC思维——相信非共识的力量,不要轻视一些看似微小的切入点。
所以大厂对AI的共识来的早很多,几乎所有大厂都把AI视作新的增长曲线,和创业公司的竞争会提前。AI创业上会发生一件事,0到1一旦验证,接下来的一两年时间就会变得尤为重要,1-10的增长、商业化的铺开、组织能力的打造,会在一个很短的时间窗口里发生。之前做完这套动作的时间可能是四五年,现在会缩短为两三年,既要创始人的初速度,还要加速度。
之前和42章经的曲凯讨论过,一致的答案是,更高的人才密度,更卷的竞争环境,会让“AI 2012”更快到来,若干年后回头看,还是会看到有一批创业公司在主牌桌上,对着大厂掀桌子。
对投资人来说,何时入场投AI呢?过去的一点经历给了我答案。
我是2010年计算机系毕业,进到百度做移动互联网产品经理的,那时移动流量只占大盘的百分之个位数,2013年年末开始做VC投移动互联网,当时所在的机构主要投资天使轮。回头来看,对移动互联网投资来说,2014年开始做早期投资已经晚了,已经错过绝大部分移动互联网大赢家的的最早期阶段了。对一个VC新手来说,起码用两三年构建自己的人脉和认知,等到构建的差不多的时候,移动互联网已经狂飙到2016年了。
有了这种真切的体感后,在看到OpenAI打响了第一枪,AI行业有了质变后,我更愿意守着智能化这片田地从一开始就参与。有一个朴素的逻辑,想淘到金子必然需要一万小时理论,这一万小时发生在今年,还是明年,会截然不同。
对创业者来说,何时入场做AI?是不是等模型长到18岁再下场做呢?
我的答案是,只要想好做什么了,越早越好,但要注意节奏,尽量少的花钱,尽量多的获取认知,一旦看到好的机会,随时转型,等待关键的一把牌All in。
为什么我觉得要尽早入场?AI创业和mobile创业的差异,远大于mobile创业和PC创业的差异,这里面有很大的认知gap,需要靠实战来填gap。智能手机的能力边界在哪里,这个答案放在移动互联网早期是相对清晰的。但AI的能力边界在哪里,答案是不清晰的,一边是技术层在变动,一边是开发应用层,需要对模型的能力边界有充分的理解和预判。其次,前面提到的竞争问题,这对创始人准备的ready程度提出了更高的要求。
AI的1岁到18岁是个不断解锁新机会的过程,但不需要18年,按照当下AI以日计的发展速度,可能很快。人们往往高估最近一年的发展,低估未来十年的变化,此时此刻这一情形正在准确上演。
面对一个未知的巨大市场,我们习惯预判。历史经常轮回,但绝不相同,AI不是另一个mobile。我这里写的想法,回头看可能一半是错的,这种错既来自路径依赖,更来自想象力的限制,就像站在2010年,我们无法想象mobile带来的变化是今天这样子。
我们是无法准确辨别当下是14岁还是16岁的,既然它离18岁不会太远,干就完了,最好的预测未来的方式是去创造它。
本文来自微信公众号“AI大航海”(ID:inceptionnnn),作者:吴炳见 吴炳见,心资本Soul Capital合伙人,三年百度mobile产品经理+战略分析经验,十年风险投资经验,之前就职于险峰和联想之星。重点投资AI、机器人、硬件行业。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md