ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI中的1岁和18岁
4380点击    2023-11-14 10:03


AI创业进行了大半年后,除了大模型的进展,整个市场都在等着AI创业交答卷——交出爆款应用,但似乎不够多,原因是什么?


本质原因是基础模型处于1岁还是18岁。


躬身入局,真的在模型层和应用层投了一些项目后,我们有了一些新的认知,对AI里有巨大创业机会更坚定,也对AI发展的timing更有体感了。


三个时间点


现在过千万日活的AI应用有四个,ChatGPT、Midjourney、Character.ai、Github Copilot,但充分验证的应用还不够多,为什么?因为行业的年龄,年龄决定了能力框架。


移动互联网的发展有三个关键时间点:


2007年,iPhone1发布,mobile一岁,打响了发令枪,移动互联网的产业链从零开始构建。


2010年,iPhone4发布,mobile发育到了18岁,有了清晰的能力框架,我们今天用的iPhone相比iPhone4是没有质变的,只有性能上的量变。同年,美团成立,小米成立。


2012年,是移动互联网应用爆发年,智能手机的渗透率跨过20%。同年,字节、滴滴、小红书成立,快手开始转社区,饿了么开始起量,2013年美团开始立项做外卖。


2012年的春节,PC端的流量跌下去后,再也没有反弹回来,流量的接力棒交到了移动互联网手里,从此移动互联网开始了为期七八年的狂飙。2012年是PC互联网的“万历十五年”,承上启下,草蛇灰线,伏脉千里。


AI行业发展起来,也会有这三个关键时间点。


2022年,GPT-3.5发布,生成式AI一岁,基于大模型的产业链从零开始构建。


当下,可以对标到mobile 2009年,正在等待AI的“iPhone4时刻”,一个能力框架更成熟的大模型。AI和互联网很不一样,互联网是从拨号上网开始就在支撑很多应用场景了,即便网速是龟速,而AI需要达到一个较高的智商才能应用,一个模型的50分和60分,在用户眼里是0分和1分的差别。


18岁的大模型应该有哪些能力?它需要具备更强的推理能力、更长的文本记忆能力、更少的胡说八道、以及多模态的理解和生成能力,尤其是视频生成。也需要更低的计算成本,更快的推理速度,逐步实现秒回。大模型将会有自己的“摩尔定律”,每年能力提升百分之多少,以及token成本降为几分之几,这个定律很快会变得清晰起来。


国内的头部的大模型厂商,基本今年年底到GPT-3.5的水平,基于GPT-3.5可以做写广告写总结的应用了,但更复杂的应用需要更强的推理,明年下半年到GPT-4的水平,这时应用开发的格局会打开很多。OpenAI明年也会发布下一代大模型,乐观来看,半年到一年后,模型可能会到18岁。


iPhone在迭代到iPhone4后,能力天花板就打住,不再有质变了,之后几年都是量变。但很可能,大模型的能力质变放眼数年不会打住,从GPT-1到GPT-4 turbo的每一次迭代都有质的变化,scale up还没碰到天花板。当下,大模型的能力约等于普遍意义上实习生的能力,未来会进化到一个科学家的水平,最终超越所有人类的智力上限,这是模型的纵向进化。


横向来看,大语言模型只是AI版图的一部分,基础模型的第一性原理已经出来了——“predict next token”,这个原理有可能带来其他模型:


如果未来transformer或者另外一套算法能够准确预测下一帧,那么视频模型就出来,就有机会解锁下一个抖音级别的内容平台;如果能准确预测下一串动作序列,那么具身智能模型就出来了,就解锁通用机器人了;如果能准确预测下一个蛋白质序列,那么蛋白质模型就出来了,新药研发又可以迈进一大步了;如果能准确预测下一个像素,那么3D模型就出来了,就解锁元宇宙的构建了。


版图完全解锁后,我们会看到多个基础模型,而很多方向的边际成本会趋近于零,不断解锁新的应用层的机会。


真机会与伪机会


一个平台从1岁走到黄金年龄,会经历很多真伪机会。回头看移动互联网的早期,有四类机会都曾霸榜。


第一个类机会叫“手电筒”,是伪机会。2010年之前,手电筒这类小应用经常霸榜,用手机照明确实是个大需求,但这种小工具太简单了,后来成为手机系统的标配,手电筒应用也就消亡了。


第二类机会叫“汤姆猫”,是小机会。汤姆猫很巧妙的用到了手机的麦克风,你说什么话,它就会用猫的语气来复述。当时日下载量到了百万级别,但没有长期留存率,因为玩法单一,和猫对话几天后就没有新鲜感了。后来汤姆猫被中国的一家上市公司收购了,作价70亿人民币。


第三类机会叫“91手机助手”,是阶段性机会。在移动互联网早期,应用商店谁做谁起量,当时有91手机助手、豌豆荚、安智等诸多玩家,91是其中做的量最大的,退出上做的最漂亮的。2013年,91手机助手作价19亿美金卖给了百度,当年19亿美金是一个破纪录的价格,创始团队和投资人皆大欢喜。


2013年前后,买了手机的第一需求是什么?是下载很多应用尝鲜,神农尝百草。应用商店因为刚需高频,又有分发能力,被很多人想象成移动互联网入口。十年过后,手机上的killer App收敛为十几个,这十几个应用成为移动互联网入口。应用商店最大的历史使命是把那十多个killer App扶上宝座,很少有人会想起当年的91和豌豆荚了。


第四类机会叫“抖音快手”,是真机会,有长期的留存率,能构建商业模式,且有一定的护城河。这类机会放在mobile早期,是张“暗牌”,很难估算市场规模,更难想象未来是千亿美金的公司,可遇不可求。


今天在AI的早期阶段,摆在我们眼前的依然是这四类机会,我们需要想清楚,谁是AI时代的手电筒,谁是AI时代的抖音快手。基于大模型的套壳应用是新时代的手电筒,很短的时间就会被大模型的能力击穿;基于AI做出的一些原生小爆款应用,如果玩法过于单一,无法形成自己的资产,很可能成为新时代的汤姆猫;而新时代的抖音和快手,还很难想象长什么样子,更大的可能是,未来的抖音今天还刚开始做今日头条,甚至内涵段子,这是一个进化的过程。


每个平台崛起时,都有属于它的native应用,这是给到创业者最大的机会了。


早期的mobile native App长什么样子?2011年时,KPCB的合伙人John Doerr把mobile native总结为SoLoMo—Social、Location、Mobile,当时很符合SoLoMo的应用叫FourSquare,你可以用FourSquare在一个地点签到,比如你经常在一个酒吧打卡,就会获得这个酒吧的荣誉勋章,经常出现在一个地方的人可以相互交友。当时这个应用的下载量一度很高,但留存率很低,因为玩法太单一了,不够好玩。若干年后,位置定位成了每个应用的标配功能。


什么是真mobile native应用呢?美团外卖肯定是了。但在外卖应用的整个价值链中,location定位起到的作用只有20%,80%的价值是靠线下的商户资源和物流配送创造的,但location起到作用是画龙点睛的,这20%的作用撬动了整个业务流程,因为手机的location属性,我们才能查到方圆几公里的餐馆,外卖小哥的位置才是实时可调配的。


什么是mobile native?不是100%原生于手机的应用,而是因为有手机,体验和价值被放大100倍的应用。


AI native也是一样,AI native并不一定100%依赖于大模型,大模型在其中可能只起到20%的作用,但这20%是画龙点睛的作用,解锁一个之前完成不了的任务,这才是真AI native。


工具与资产


任何一波平台机会起来的时候,首先被创造出来的是工具。


回头看mobile上最终立住的十几个高频应用,微信、淘宝、拼多多、抖音、快手、美团外卖、滴滴、小红书等,很少有纯工具,他们最终是靠核心资产立住的——微信靠关系资产,抖音快手小红书靠内容资产,美团外卖和滴滴靠线下资产、淘宝和拼多多靠商户资产,这些资产形成了产品的供给,也就是供给即产品。


为什么纯工具很难立住,必须要构建自己的核心资产?纯工具的用户价值100%靠代码传递,代码的复制成本很低,最终大家功能类似。对C端产品来说,一定要找到代码之外的优势,微信的价值来自于通讯录,抖音快手的价值来自庞大的视频库存,美团的价值来自商户和骑手网络,最终资产上形成差异化。


同样的道理,也适用于AI。未来,ChatGPT不应该是单纯的问答形式,而是可以调用各种Agent完成任务,有点像all in one的微信。Midjourney不应该单纯的做一个“图片设计师”,而是生产有情节、有意思的内容,它的价值来自内容消费,有点像今天的内容平台。


工具与资产之间,往往是动态变化的。很多产品day one就不是工具的定位,抖音day one就是短视频内容社区,美团外卖day one就是外卖交易平台,他们的产品界面从第一天开始就没有大的变化,最牛的产品往往是大轮廓不变,里面的资产反复迭代的。也有一部分产品day one是工具,很快做了转型,比如gif快手最初是一个视频转gif的工具,一两年后转为短视频社区,而他的爆发也是在转了社区之后。


北坡上,南坡上,都有机会,但不要长期在工具形态恋战。起步可以是工具,但终局拼的一定是资产。如果这个问题第一天就想清楚了,那么最好起步就做资产。


AI创业的新特点


前面有很多AI和移动互联网的类比,但真的在参与了一些AI项目后,我发现AI和移动互联网的创业规律很不一样。


首先,AI创业的0到1的验证的时间更长。做移动应用时,我们可以把产品缩减到单一功能,两三个月做出一个MVP,上线就可以验证了。移动应用限定了场景,比如我们做一个打车软件,因为产品定位和特定的交互逻辑,用户只会用它打车,肯定不会在里面搜新闻。


但AI产品不一样,用户面对一个有AI属性的聊天框,会输入任何内容,试图探测它的边界,一旦这个产品接不住,用户就有可能会离开。MVP在AI上一定程度是失效的,或者说AI产品的MVP构建的时间拉长了。


移动产品往往面对的是用户确定性的需求,打车就是打车,外卖就是外卖,AI产品面对的是用户的不确定性需求,面对一个框,用户会和模型聊everything,怎么管理用户预期是个重要命题。年初的时候,大家惊叹于ChatGPT的能力,是因为看demo容易感受到模型能力的上限,而真实使用时,能否留的住用户,是由模型能力的下限决定的。


第二,一旦PMF找对后,AI创业1-10的发展速度会更快。之前PC和移动互联网两波平台级创业,都是一边铺终端,一边铺应用,应用普及的速度受限于铺终端的速度,而AI创业是在现成的手机和PC上做应用,只要是个惊艳的产品,就会以闪电的速度铺开,ChatGPT、Midjourney用小几个月时间突破亿级用户,已经验证这个规律了。


但因为每个终端的位置都被占满了,没有流量红利,这就要求新的AI产品必须十倍好于之前的产品,最好是解决了之前一直无法解决的问题,才有机会冒出来。


之前PC和移动互联网创业的早期,商业设施是不成熟的,没有现成的支付体系、变现方式、流量投放。移动互联网早期,大家根本不知道如何在手机上赚钱,feed流广告是绝对想不到的。放在AI创业的今天,这些商业设施都是现成的,但模型这个发动机是不成熟的。


这会发生一件事,一些聪明人会先拿一款50分的AI产品练兵,一上线就开始商业化,摸索增长方式,一通实战后把这个产品本质看透,等到基础模型的18岁到了后,换上新款发动机,直接起飞。之前互联网的那种纯圈用户,没有变现模式,纯烧钱的情况不太会在AI创业里发生了,AI应用自带赚钱模式。


第三,大的竞争会提前,创业公司在突围的时候很可能首战即决战。2010年的时候,很少有大厂提出移动优先,直到2012年,一些大厂还在观望移动互联网的机会,这给了创业公司猥琐发育的时间,暗牌变明牌的时候,大厂已经按不住创业公司了。字节之于百度,拼多多和美团之于阿里,米哈游之于腾讯,都是创业公司从边缘走到核心地带,对着大厂掀桌子,这让大厂的管理层多了一层VC思维——相信非共识的力量,不要轻视一些看似微小的切入点。


所以大厂对AI的共识来的早很多,几乎所有大厂都把AI视作新的增长曲线,和创业公司的竞争会提前。AI创业上会发生一件事,0到1一旦验证,接下来的一两年时间就会变得尤为重要,1-10的增长、商业化的铺开、组织能力的打造,会在一个很短的时间窗口里发生。之前做完这套动作的时间可能是四五年,现在会缩短为两三年,既要创始人的初速度,还要加速度。


之前和42章经的曲凯讨论过,一致的答案是,更高的人才密度,更卷的竞争环境,会让“AI 2012”更快到来,若干年后回头看,还是会看到有一批创业公司在主牌桌上,对着大厂掀桌子。


入场与节奏


对投资人来说,何时入场投AI呢?过去的一点经历给了我答案。


我是2010年计算机系毕业,进到百度做移动互联网产品经理的,那时移动流量只占大盘的百分之个位数,2013年年末开始做VC投移动互联网,当时所在的机构主要投资天使轮。回头来看,对移动互联网投资来说,2014年开始做早期投资已经晚了,已经错过绝大部分移动互联网大赢家的的最早期阶段了。对一个VC新手来说,起码用两三年构建自己的人脉和认知,等到构建的差不多的时候,移动互联网已经狂飙到2016年了。


有了这种真切的体感后,在看到OpenAI打响了第一枪,AI行业有了质变后,我更愿意守着智能化这片田地从一开始就参与。有一个朴素的逻辑,想淘到金子必然需要一万小时理论,这一万小时发生在今年,还是明年,会截然不同。


对创业者来说,何时入场做AI?是不是等模型长到18岁再下场做呢?


我的答案是,只要想好做什么了,越早越好,但要注意节奏,尽量少的花钱,尽量多的获取认知,一旦看到好的机会,随时转型,等待关键的一把牌All in。


为什么我觉得要尽早入场?AI创业和mobile创业的差异,远大于mobile创业和PC创业的差异,这里面有很大的认知gap,需要靠实战来填gap。智能手机的能力边界在哪里,这个答案放在移动互联网早期是相对清晰的。但AI的能力边界在哪里,答案是不清晰的,一边是技术层在变动,一边是开发应用层,需要对模型的能力边界有充分的理解和预判。其次,前面提到的竞争问题,这对创始人准备的ready程度提出了更高的要求。


AI的1岁到18岁是个不断解锁新机会的过程,但不需要18年,按照当下AI以日计的发展速度,可能很快。人们往往高估最近一年的发展,低估未来十年的变化,此时此刻这一情形正在准确上演。


面对一个未知的巨大市场,我们习惯预判。历史经常轮回,但绝不相同,AI不是另一个mobile。我这里写的想法,回头看可能一半是错的,这种错既来自路径依赖,更来自想象力的限制,就像站在2010年,我们无法想象mobile带来的变化是今天这样子。


我们是无法准确辨别当下是14岁还是16岁的,既然它离18岁不会太远,干就完了,最好的预测未来的方式是去创造它。





本文来自微信公众号“AI大航海”(ID:inceptionnnn),作者:吴炳见 吴炳见,心资本Soul Capital合伙人,三年百度mobile产品经理+战略分析经验,十年风险投资经验,之前就职于险峰和联想之星。重点投资AI、机器人、硬件行业。




AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md