“大模型的开源和Database时代的开源不是一个概念。”源码资本管理合伙人黄云刚说。
目前开源最大的问题在于,社区开发者对于模型架构的贡献非常有限。“Linux、Android当时能跑赢闭源产品,最重要的原因是,他们都有一种‘公共建设’属性,开发者社区的创新能同时促进用户生态。”但对于目前大多数的开源大模型,无论是刚刚推出的Llama 3,还是Grok-1,社区对于模型发展的帮助还是很模糊。
在黄云刚看来,如果针对场景的优化和训练方式都一样,那么开源和闭源的区别就不会特别明显,因为大家都是只有用户没有“生态”,比如Grok-1开源对用户增长可能短期有效,但对未来模型升级有多少帮助很难说;另外最近Llama 3 能力值创新高背后最大的推动力也只来自Meta。
如果开源大模型对于开发者来说只是看到相同的代码,但是不能像Database时代一样让开发者的贡献在更多人之间流通迭代,开源的生态优势就不那么重要,也就是说,AI技术开放最核心的门槛仍然没有降下来。
“对于创业者来说,目前还处于模型技术能力等于产品机会的阶段。”
这个阶段和PC互联网、移动互联网早期很相似,能力上的要求主要体现在技术端。从中国最早的互联网创业者张朝阳、雷军、李彦宏、丁磊、马化腾,到移动互联网时期的张一鸣、王兴、黄峥、宿华,第一批拓荒者基本都是程序员背景。国外互联网早期创业者像Google的Larry Page,还有微软的比尔·盖茨也都是技术出身。
“但现在最大的不同在于技术、产品、基础设施都在同时相互影响地往前走。”黄云刚说。互联网是把已有的东西在线化的过程,不用太担心技术路线上有特别大的调整,更多关注商业模式和产品设计问题。但AI时代技术本身的发展就很快,产品迭代速度也在加快,创业者如果想等到所有基础设施都成熟了再去做产品,可能就晚了。ChatGPT月活突破1亿只用了不到90天,这是之前没有的速度。AI时代的创业者,核心是前瞻性的技术认知能力——在“半山腰”上去构建产品。
有经验的产品鬼才在这个阶段还不太能发挥出来。“AI这一波机会对年龄和技术的要求比以前更高了,以前做PC产品的人转向互联网需要的还只是认知上的转变,走通的人就已经很少了;今天难度更增加一层,即便你有那个认知,没有技术预判,产品刚出来可能就已经落伍了。”黄云刚说。
大模型能力的摸高是未来几年的主线任务,支线任务是创造feature。
黄云刚认为,摸高一方面是取决于Scaling law,即更多的数据、能源,更大的算力创造出“聪明”程度指数级上升的AI。另一条支线则是在技术上的提前投入和布局,比如长文本、比如更易用的prompt(提示词)交互逻辑。
中国大模型创业公司最终都是要“两条腿”走路的,一方面是不断地创造新的feature(功能),去刺激用户和刺激市场。同时,通用能力也要持续领先,证明产品的“厚度”足够“厚”。
“反过来从市场端看,对大模型依赖度越高的场景越有机会跑出杀手级应用。”
比如大模型对下一代搜索引擎的重要程度,黄云刚认为在90%,这类模型即产品的创业公司应该是今年关注的第一梯队;而之后对于内容平台,AI技术的重要性可能在50%,这个判断主要是基于AI生产工具与内容的不对称关系(更好的AI工具不一定能生产出更有吸引力的内容);游戏可能更低,在30%,设计、题材以及游戏产品本身对玩家的意义会比AI更显著。
技术不确定性越大,年轻人的机会越多。最近十几个月中国的年轻创业人群正在快速增长,人才端不匮乏。今年还有可能会成为AI“大成”创业者年龄代际的一个分界线。十年前,iPhone 4的发布催生了移动互联网爆发,80后在21岁到30岁之间选择创业,算是比较年轻的。现在是很多90后,95后高学历、聪明、没有路径依赖的年轻人越来越多地冒出来。
历史不会重复,但总有相似的韵脚。一些人会承认其中的规律,而一些人则有选择地否定。
市场情况越是复杂,就越要保持简单。
一、AI创业现在需要的是哪一类人?
福布斯中国:这一波AI机会对于新一代创业者有什么新要求?
黄云刚:现在对技术要求高的同时,还需要足够年轻的年轻人。
可能是95后给我的感觉,与我们十年前投的那一波80后有很大的区别,那时候80后在20岁到30岁之间。AI这一波机会对技术依赖更高,尤其是这个阶段,大多数还是高学历,然后也非常聪明。但仅仅是一个产品怪才,在今天并不一定能发挥出来。例如,训练模型这个要求对他们就太高了。
这也是AI创业者从年龄上比之前要更年轻的原因。对新东西接受度永远是年轻人最好,要拥抱年轻。
如果年纪大一些的话,原本做PC产品的人也可能转向移动互联网,这属于认知的转变,但成功者比较少。认知的转变,说简单也不简单,有时候,那道隐形的“窗户纸”是很难捅破的。但是,今天又增加了一层难度,即便你有认知,也没有技术能力。所以,只有对快速变化的技术有非常强的预判能力,才能做好一个产品。
福布斯中国:到了今年这个时间点,到底是“人”的机会,还是“事”的机会?
黄云刚:无论是AI,还是其他任何领域,例如机器人、消费或者医疗科技,这些领域都有相似性,人和事情都很重要。
技术在不断变化,投资机会开始越来越多出现在天使、Pre-A和A轮阶段。随着这一批公司的成长,可能3年之后才会开始有大片的成长期投资机会。所以,我们现在肯定将关注重心放在早期的A轮企业上。
在早期,人和事都很重要。所谓“事”,就是创始人对事情的认知,以及他选择方向的能力,但最终肯定还是“人”为主,因为毕竟没有数据,甚至没有产品。
福布斯中国:年轻人投身AI创业的优势在哪里?
黄云刚:产品分为两类,一类是流程性的产品,需求明确,只要把流程梳理清楚就可以了,很多To B产品是这样的。第二类是完全创新的产品,从无到有。尤其是面向To C端、比如social media等,这些都特别需要年轻创业者。
二、在中国投AI应该焦虑吗?
福布斯中国:2024年伊始,资本市场对大模型的态度变得很微妙,AI投资的机会有哪些?
黄云刚:现在除了Open AI这样专注技术和基础设施的公司外,还能分为两类,即AI赋能的应用和AI原生应用。AI原生应用可以理解为新的产品形态对于新技术的耦合性和依赖性较高。
以网约车为例,电脑和移动应用都可以实现叫车,也就是说场景本身并不依赖于这项新技术。但只有移动应用才能推动网约车的发展。当时的“互联网+”,取决于在原来的各个场景,前者如何将新技术用于提效。
To C端的原生应用还未真正实现技术突破。昨天,我还在与一个做数据中心的创始人聊天。他认为,国内做这一块业务有难度,好像是“卖铁”,但“铁”并不是自己造的,是英伟达造的,美国市场发展比较好,主要是场景成熟,相比之下国内的客户就显得比较稀少且分散。
美国目前已经找到了最大的场景,就是To B端,例如各种SaaS工具与AI融合。同时,AI背后的算力消耗,还将带动基础设施的发展。在中国,做To B端仍然比较艰难,成规模的企业级应用还比较少。
目前国内国外对比来看,都是训练端的客户比推理端的更多,目前训练端消耗了很大比例的AI算力。只有当未来更多应用爆发之后,更好地服务用户,才会进一步大幅度降低推理成本。但这个总体还是工程上的难题,总会有办法解决,并且时间也不会太长。
福布斯中国:好像现在的这一批AI应用迭代得很快,比移动互联网时代还快?这是为什么?
黄云刚:我也觉得迭代得很快。因为现在的技术能力是动态的,很多产品在技术变化过程中被快速迭代掉了。所以构建和打造好的产品,需要从半山腰开始思考,如何走到山顶以及在哪个山顶建产品。当所有人都看到了技术摸高的山头,再出发做产品,很可能就来不及了。
福布斯中国:被动去调整和迭代,而不是说主动地去迎合客户?
黄云刚:对的。现在的情况比当年的移动互联网时代更复杂,是因为移动互联网是一个在线化的过程,智能手机和App Store等基础设施的建立催生了大量应用;当时应用完成以后,就不太担心技术会有特别大的变化,因为技术路线已经确定了。其他就是工程、产品设计的问题。但是,现在每天都在发布新东西,让大家都很惊讶。
确实也容易很痛苦,尤其是创业者和应用开发者。上周,我见了一个连续创业者,他也说了自己的痛苦之处。他是一个非常善于做产品的人,但现在把公司卖了。他说,我不是算法大牛,我也不训练大模型,我是做产品的人,我没有能力去做一个大模型,那产品怎么做呢?国内还没有很好用的大模型,但也不能为此卡在这里,更不能坐以待毙。
等模型做好再做产品,看起来很有效率,但可能是个伪命题,因为对技术的理解或对模型的理解,实际上是做应用的前置条件。
福布斯中国:现在大家对于开源闭源哪个更有机会有不同的看法,你怎么看?
黄云刚:我们要相信中国的闭源。大多数人都认为海外的开源比较强大,中国的闭源大模型花时间精力,浪费钱,最后也达不到国外开源的水平。但为什么我们要相信中国闭源?
有两个原因,一个就是闭源对某些场景的优化或者训练效果更好,能在这些点上做得更深更透,而不能都依赖看似强大的开源模型。
第二个,就是要相信中国的闭源从长期来看能够打败开源,或者是应该打败开源,原因是大模型开源这个模式其实跟以前我们理解的开源(open加上crowd source)不同。现在它更多只是大厂为了开源而开源,而不是集中生态的力量去做事——所以它只有开放的代码,但没有相应的生态。
只要有足够的资源、人才和耐心,我们对中国闭源模型有信心和期待。
福布斯中国:只有开源没有生态是什么意思?
黄云刚:现在的开源生态跟过去的开源生态是两件事。
现在的开源,比如说Meta发布Llama的开源,它其实只是把Llama训练好,然后开放出来而已。这个社区里面的开发者对Llama架构的贡献是很小的,他们只是把它用起来。这个生态更多的是大家去用,而没有大家一起来共创这个模型。
模型本身还是得靠Meta不停地往前去做,所以他今天的这个开源生态跟过去DATABASE时代的开源生态是不一样的。
福布斯中国:AI创业最友好的赛道在哪里?
黄云刚:中国是C端。海外To B也是好赛道,有些空间很大的To B赛道,甚至不确定性也没那么高。
不过现在有一个概念很重要,就是模型即产品的创业公司可能最先跑出来。
比如关于AI对下一代搜索引擎的重要程度,我感觉可能是90%,甚至是99%,主要是这两者的依赖度非常高。当年搜索引擎都其实并不算一个产品,但从搜索框和交互能力以及页面检索的ranking(排名)来看,的确有一定的产品属性,但本质上是后端的检索能力来决定的。ranking以及相应的算法,后端非常重要,前端其实相对简单。
福布斯中国:AI还在哪个领域最有可能创造出颠覆性的产品?互联网时期,在搜索引擎成熟之后,机会很快就到了内容平台。
黄云刚:对于内容平台的话,AI的重要性可能是50%,就算做出Sora,也并不代表什么。就像当年的拍照软件或剪辑软件,也不代表就能做出Instagram 或者抖音。
内容平台和生产内容的工具是紧密相连的,但它们不完全对等,两者都得很强才行。类似于今天的AI能力,AI工具能否转换成一个好的内容平台,并不好说。
另外,AI技术对一些行业的贡献还不太能被高估。比如游戏的贡献率可能是30%,另外70%还是靠游戏设计、题材以及游戏产品的本身。电商可能是20%,因为电商离不开供应链,必须连接货、商家等,这些无法被替代。AI只能把前端的匹配和流量运营的工作做好。
福布斯中国:AI原生性的机会呢?
黄云刚:当然有一定的机会。就像原本没有AI机器人的概念,现在称作为“具身智能”,就是原来机器人放到某些场景的专用机器人,或者只是专用设备,还谈不上机器人层面。今天有了AI之后,具身智能才成为全新的机会,几乎是100%的新机会。
现在阶段,各种形态的产品都会有人探索。在海外也一样,各种类型的创业者都会有。就像秘塔这样的创业公司,他们在做法律翻译工具的时候,我理解他们对NLP(自然语言处理)和AI还是有一定积累的,所以更快发现新的产品形态。还是要看最终能不能做出一个持续增长的产品,能不能实现差异化,而且是否具有通用能力。
三、机会与准备
福布斯中国:现在怎么看AI的商业化?什么时候能真正地打开市场?
黄云刚:商业化的前提是产品化,产品化的象限又分为To B、To C,海外、国内。
国内的To B产品应用有机会,但起量会比较慢。海外To B是比较繁荣的,更多的是AI +,或者是AI支持下的Enterprise产品。因为本身落脚点是软件产品,海外商业化路径就非常清晰,而且市场也挺大。
国内To C跟海外To C其实都一样,都没有特别成功。但海外To C有一个好处是订阅市场比较好,所以Midjourney、 ChatGPT的Pro版本都有挺可观的规模化收入。
国内互联网、移动互联网时期一样,都是免费加增值模式。所以在AI这块可能大概率还是跟随,也就是免费加增值的商业模式,还要克服推理成本高的问题。所以现在来看,国内To C的商业化挑战确实是比较大的。
虽然现在从时间点上它肯定不是产出结果的好时机,但它肯定是最好的投入时机。无论是比尔·盖茨(Bill Gates)还是当年Google创始人拉里·佩奇(Larry Page),都是在一个市场非常不确定的时间点入局。同时他们也非常懂技术,通过对技术的了解使他们能更早知道这个技术能用在什么方面,进而做出好产品以及推动商业化。
所以现在对投资人来讲是等不起的,创业者更是这样,完全不懂模型,不懂技术,等到都成熟了,大的机会也不存在了。
福布斯中国:AI C端大规模商业化和以前最不一样的是什么?
黄云刚:以前互联网时代,最早我们是没有推理成本这一项的,或者说我可以做到1000万DAU才开始想怎么商业化都来得及。
现在,因为1000万DAU的维系会特别烧钱。所以只有推理成本大幅降低,才是免费加增值服务模式的基础。
福布斯中国:你觉得服务成本在多长时间内能降到一个多低的规模?
黄云刚:工程上降低成本应该只是时间问题,可能一年之内就能解决。但现在最重要的还是模型能力,所有人都在努力去推进大模型的摸高,然后再去降成本。模型不摸高,它连产品PMF都支持不了,降成本也没有意义。
福布斯中国:最后会是多个模型集成到一个产品里,还是单独一个通用模型,来支持一个产品应用?
黄云刚:最终肯定这个都是多个模型在服务一个产品,不太会一个产品只调用一个模型。因为很多的应用它可能小模型就够了,有一些功能必须得调用大模型。
福布斯中国:从今年AI应用的用户数据来看,一些垂类应用,比如教育类的AI应用的数据涨得很好,但是有些PPT工具,还有Notion这类应用的增长开始变得乏力了。为什么会有这样的现象?
黄云刚:这里也分不同的产品类型,找出这类技术结合的点,就有快速成功的可能。可能只是一个小功能,被整合到一个大产品中,就能获得不错的效果。例如刚才说的Notion,我理解影响它有很多要素,其中就可能包括技术成熟度的问题,可能会让产品的渗透率和增长受限。
目前微软Copilot和很多文档产品比如飞书等都具备了AI功能,供用户使用。所以Notion的特色被稀释了。基于这个原因,创业者需要寻找一个突破点,即有利于增长,但最终还是要积累成一个比较“厚重”的产品,它的“护城河”也会比较高。单一产品还是显得比较“单薄”,容易被“稀释”,就很危险。比如去年2月份,有家公司叫Jasper很火爆,但现在没人提起,就是因为产品太“单薄”了。
福布斯中国:AI投资你最担心的是什么?
黄云刚:有人对AI很悲观。其实也有一定道理,我们属于观点比较综合的那一类人。我们既不会说“AI不能投了”,也不会说“All in AI”。因为“All in”是一件很危险的事情,我们一直选择平衡地看待问题,难度确实存在。就算是AI原生性机会,这种技术以前从没有出现过,更不会被轻易做出来。就算ChatGPT非常成功,但Open AI现阶段距离真正的产品都还有一定的距离。
那剩下的就是“AI+”,就是把AI能力整合到其他现有成功的产品中,使其性能和体验更好,创业者要颠覆AI赋能类的产品,难度可能比AI原生应用更难。所以,在这样的环境中,大家都很痛苦,好像新机会不多,或者说不足以让开发者去做,包括训练大模型。我们倒觉得不必悲观,了解和掌握规律后,就会发现技术迭代和发展需要持续不断的重复,核心就是如何从中真正理解技术和商业的本质。
福布斯中国:源码VC阶段的投资策略有什么变化?
黄云刚:有两个方面,首先是积极应对,有选择性地投资。同时,更专注于年轻人交流,越年轻越好。比如刚毕业的学生、博士生、硕士生;其次是组织形态,刚才提到的基金也更重视这方面,因为新技术在不断变化,尤其是AI。
我们的团队也要引入年轻人。只有作为创业者的同龄人,才能更好地理解新技术。同时,年轻人也会更理解这些同样年轻的创业者,理解同龄人的需求。所以,我们要建立一个团队,既年轻又懂投资,与创业者打成一片,这非常重要。
对我们组织内部来说,也就是我们的manager团队,面对新技术,规划以投早期的A轮为主。
本文来自微信公众号:福布斯(ID:forbes_china),作者:Forbes China,对话嘉宾:黄云刚
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0