ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI 应用之路:质疑汤姆猫,成为汤姆猫,超越汤姆猫
8169点击    2024-03-08 10:23
汤姆猫是移动互联网时代的典型应用代表,凭借硬件或者系统的新功能,迅速出一个有一定可玩性但没有长期留存的会蹭上热度的 app。而在当下的 AGI 时代,也有很多类似汤姆猫的应用,但要不要做汤姆猫,以及如何看待汤姆猫,心资本 Soul Capital 合伙人吴炳见提出了自己的看法。

或许,理解汤姆猫,才有可能真正超越汤姆猫。

作者介绍:吴炳见,心资本 Soul Capital 合伙人,三年百度 mobile 产品经理+战略分析经验,十年风险投资经验,之前就职于险峰和联想之星。重点投资 AI、机器人、硬件行业。

过去一年,我对 AI 应用的看法经历了这样一个过程:质疑汤姆猫,理解汤姆猫,成为汤姆猫,超越汤姆猫。


什么是汤姆猫?汤姆猫是 2010 年移动互联网早期的一款应用,迅速走红,又淡出视野。这是一个比喻,指代那些很好玩,一度成为现象级,但没有长期留存的产品。拍出海马体的妙鸭相机,让郭德纲说英文相声的 Heygen,都有点 AI 时代汤姆猫的意思。


坦率讲,最开始我是质疑汤姆猫的,这类产品一度热闹,但玩法单一,没有长期留存率,很难持续。在我写的《今天的AI创业,与移动互联网时代的区别在哪里?》中,有一段对汤姆猫的讨论:


一个平台从 1 岁走到黄金年龄,会经历很多真伪机会。回头看移动互联网的早期,有四类机会都曾霸榜。

……

第二类机会叫「汤姆猫」,是小机会。汤姆猫很巧妙的用到了手机的麦克风,你说什么话,它就会用猫的语气来复述。当时日下载量到了百万级别,但没有长期留存率,因为玩法单一,和猫对话几天后就没有新鲜感了。后来汤姆猫被中国的一家上市公司收购了,作价 70 亿人民币。

今天在 AI 的早期阶段,摆在我们眼前的依然是这四类机会,我们需要想清楚,谁是 AI 时代的手电筒,谁是 AI 时代的抖音快手。基于大模型的套壳应用是新时代的手电筒,很短的时间就会被大模型的能力击穿;基于 AI 做出的一些原生小爆款应用,如果玩法过于单一,无法形成自己的资产,很可能成为新时代的汤姆猫;

后来为什么理解汤姆猫了?因为更理解大模型的能力边界,和当下所处的阶段了。


01

理解汤姆猫,

是因为理解了当下大模型的能力边界



大模型的发展规律和互联网有很大差异,更应该参照芯片行业的发展规律。


50 年代,仙童发明了半导体后,随着芯片能力的提升,先后出现了计算器、PC、游戏机、移动手机、MP3、智能手机这些国民级的电子产品,这背后是摩尔定律的推动,「处理器的性能每两年翻一倍,价格下降为之前的一半」。


这些电子产品横跨几十年,依次解锁,半导体刚出来的时候,它的能力只能用来做计算器,随着计算能力的提升,才能造出 PC。


OpenAI 推出 ChatGPT 只有一年多时间,基于大模型的应用的出现也是有先后顺序的,在要出计算器、随身听的时候,不要硬造 PC;在要出汤姆猫的时候,不要硬造抖音,造不出来。历史无法跳跃,只能经历。


Scaling Law 会成为 AI 时代的摩尔定律,堆算力,堆参数。随着模型能力的提升,基于大模型不是造应用,而是造虚拟人,起初是本科生,之后是白领,之后是某些领域的专家比如医生、律师,后面会造出科学家,最终极的形态是 AGI,随着模型智能程度的提升,这些虚拟人会依次解锁。


以造人的标准来看待当下大模型的能力,就知道需要多少智能,和中间的差距了。


而现在我们常说的「AIGC 应用」,可能只是 AI 发展史上的过渡阶段,是因为当下的模型还造不出虚拟人,所以先造辅助软件。


02

成为前千分之一的汤姆猫,

完成能力蜕变


理解汤姆猫后,我认为应该尽快「成为汤姆猫」,且做前千分之一的汤姆猫。


这缘于我的一个观察。


和很多投过的早期项目相处后,我发现创始人的能力不是线性增长,而是跳变的,忽然之间上了很大一个台阶,可能就一个月时间,隔壁老王已经不是我认识的老王,我得管他叫王哥了。


发生跳变的时间点往往和 PMF 跑通有关系,跑通后,整个人的思考水平、决策的犀利程度、心态的平稳度都有一个质变,再之后,就和业务量爬到几层楼相关了,月收入 1000 万、月收入 1 亿、月收入 10 亿是完全不同的思考水平,爬楼的中间,会有很多正负反馈,往往深刻又惨痛,反馈越大,能力跳变越明显。这才有了士别三日当刮目相看的感觉。

这让我明白了一个朴素的道理,产品是创始人的实验室,首先要跑通 PMF,让自己有个实验室,哪怕这个实验室小了点


然后要寻找更大的实验室,基于 10 万日活和 1 亿日活能做的实验是不一样的,一个人天天基于几亿日活做商业实验,他的水平能不高吗?为什么一些平台级产品的大佬思考水平极高,像开了天眼一样,因为他有几个亿的用户啊。


人人都想做有终局的产品,做下一个微信和抖音,但别忘了,张小龙是做 Foxmail 被腾讯收购的,Foxmail 是个邮件客户端,是那个年代最知名的套壳应用了。


基于这一观察,和 AI 现在所处的极早期阶段,在寻找 PMF 的时候,先不要嫌弃它是汤姆猫,找个具体且收敛的切入点,跑通它,让自己有个实验室,先完成能力跳变。


AI 和移动互联网的差异,远大于移动互联网和互联网的差异,先跳下来,刷一遍自己的 ROM 很重要。在 AI 这个全新的世界中,大多数人是从头学,今年完成能力跳变,还是明年完成能力跳变,会遇到截然不同的机遇。


但即便以汤姆猫的标准看 AI 应用,只求爆款,不苛求留存率,也只有前千分之一的产品能成汤姆猫。


03

超越汤姆猫,

才有机会成为 Super App


前千分之一的选手成为汤姆猫后,会面临两个选择:


一是基于汤姆猫继续绣花,迭代产品,希望做出长期留存,这很难,因为这个产品的地基很薄,就是绣花绣上天,也是个绣花版汤姆猫,基于汤姆猫建成一个迪斯尼娱乐王国是不现实的


二是通过做汤姆猫实现了团队能力升级,走出汤姆猫,去做新的事情。人站在一层楼和一百层楼看到的机会是不一样的,做过十亿的业务,自然会发现百亿业务的机会,这或许会找到更厚的地基,做出 super App。这是所谓的「超越汤姆猫」。


选一还是选二,是一道分水岭。很多耳熟能详的平台级产品,初创时都有过类似汤姆猫的阶段,又推出新产品超越了汤姆猫


2012 年 3 月,字节跳动成立,先推出的是内涵段子,同年 8 月推出了今日头条,2016 年 9 月,抖音上线。


2015 年 4 月,拼好货上线,做的是拼团买水果,同年 9 月,拼多多上线,切到了电商的主战场,2022 年 9 月,Temu 上线,开始海外的征程。


2010 年 3 月,美团团购上线,2013 年 11 月,美团外卖上线,2015 年 10 月,美团合并大众点评,从交易平台延伸到了信息平台。


好了,即便我们懂了「超越汤姆猫」这个道理,依然难过好这一生。


绝大多数情况下,人们很难大大方方承认自己是个汤姆猫,面对低留存率、低商业价值的时候,会做很多设想,是不是自己功能不够完善?是不是用户数量不够多?是不是应该把汤姆猫升级成社交产品,就有网络效应了?这种事情在移动互联网发生过很多了,做日历的、做滤镜的、做小游戏的,都有过平台梦。


「成为汤姆猫」是块石头,用好了可以踩着石头过河,实现「超越汤姆猫」;用不好是阻拦前行的巨石,做一辈子的汤姆猫。


04

Scaling Law 会成为 AI 时代的摩尔定律


上面是从质疑到成为的心路历程,也是感受当下,认清当下,抓住当下的过程。


那么更具体的聊聊当下,现在处于什么 timing,会推演出哪些信号?


最关键的信号,Scaling Law 会成为AI时代的摩尔定律,模型的智能程度每年增长百分之 X,价格降为之前的 1/N,现在还只有一个定性的描述,当 X 和 N 都成为一个定量数字的时候,这个规律就开始正式运转了。


Scaling Law 会把模型送上一个个新高度,从而会依次解锁上层应用,也就是造人。这些虚拟人需要替代真人,端到端的完成任务,做到「L4 级别」。在真实工作环境中,我们 90% 的时间是在解决那 10% 的难题,大模型能否解决好那 10% 的难题是一道及格线,过不了这个及格线,大模型只能做副驾 copilot,充其量是一个好用的软件;过了这个及格线,大模型就是主驾,我们开始为主驾付工资。


基于造人的标准,需要有一套图灵测试 2.0。在 ChatGPT 出来后,模型已经通过图灵测试 1.0,接近人的回答水平,以假乱真了。图灵测试 2.0 是一套基于工种的测试,比如文案策划、剧本杀小姐姐、程序员、医生,如果这个虚拟程序员能听懂你的需求、写出完整代码、修正 bug,那他就通过程序员图灵测试了。当下的大模型基本通过剧本杀小姐姐的图灵测试了,大家在 Character.ai、星野这些应用上和 AI 聊的很欢。


如果以图灵测试 2.0 来衡量当下的 AI Agent,真正的 Agent 尚未出现,真正意义上的 Agent 是可以自己规划任务,端到端的完成任务的。


如果第一个 Agent 出现,大概率是出在 OpenAI,因为他有最领先的模型,Agent 的出现主要和模型的智能程度相关,OpenAI 什么时候出 Agent 的 demo 产品,会是应用层百花齐放的关键信号


基于上面的这些推演,AI 还在很早期的阶段,如果硬要类比互联网的话,此时此刻对应 Yahoo 出现的门户时代。


做 AI 应用的创业者经常半夜问自己,我这应用有网络效应吗?放心,没有。


即便是 ChatGPT 也没有网络效应,只有品牌效应。互联网早期,门户网站也没有网络效应,只有品牌效应,Google 出来后才有了规模效应,Facebook 出来后才有了网络效应。


AI 行业什么时候会有网络效应这种城河?可能是 AI Agent 横行天下的时候,比如我们有个秘书 Agent,帮我们和生意上的伙伴约时间排会,双方的 Agent 一通交流,一握手,约好了!对方的 Agent 也必须是同一厂牌的 Agent,才能最大限度的交流,这就是 AI 时代的网络效应。


多久会发展到这个阶段?很难量化,但不要小看 AI 的进化速度。Sora 出来后,带给我最大的触动是,他比想象中来的快,行业里的人认为 2024 年年底或 2025 年才会出高质量的视频模型,OpenAI 直接在今年 2 月就拿出来了。


对 Sora 的热议,又一次体现了我们总是「高估当下,低估未来」,Sora 还没有公测,大家看到的是精选出来的 demo,在公测后,我估计大概率达不到大家的预期,这时又会出现「不过尔尔」的声音。又过一段时间,Sora 又进化的让人惊讶。


这种冷热交替,去年年初的时候已经在 ChatGPT 上上演过了,先是热议,认为要革命了,然后大家用了一段时间后,觉得还是有局限性,智慧程度不够,上层的杀手级应用也没出现,热议之后是冷静。然后 Sora 横空出世,又带来一波热议,如此往复。


别忘了,不管冷热,Scaling Law 永远在那里,在推动着模型成长。


万物自有其规律,没人能越过 1 到 17 岁,一步到位长到 18 岁。我们都知道 AI 带来的机会大,这是共识了。对当下 timing 的研判、对模型能力边界的理解,还处于非共识,这是真正考验创业者的地方


人人都想做有终局的产品,望着终局,恨不能省略中间的过程,跳跃中间的历史,直接做最有价值的事情,这是一种我执,忽略了真实世界运转的规律。


而理解汤姆猫、成为汤姆猫、超越汤姆猫,才是真实世界运转的规律,这是一种去执。


去执后,更容易看清当下,抓住当下。浪潮来的时候,关键是要站在海里,且早早学会游泳,早早习惯海水的味道。


文章来自于微信公众号 “Founder Park”,作者 “吴炳见”



关键词: AGI , AI应用 , 大模型 , AIGC应用
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md