刚从美国回来的李开复,想清楚了很多事情,他的大模型公司零一万物也开始发生变化。
在10月16日难得的一次沟通会上,李开复“回应一切”。他提到,最近自己意识到只有基座好的模型才能达到PMF(产品和市场地完美匹配),而如果想激活一个健康的生成式AI生态系统,帮助自身的AI产品提高盈利能力,就需要有白菜价的世界顶级模型。在当天的线上发布会上,零一万物发布了新模型Yi- Lightning,就是李开复心目中最符合这一标准的模型。
目前零一万物模型序列分为开闭源两方,开源模型如Yi-9B,Yi-1.5,Yi-Coder更多打出品牌效应,闭源模型中,千亿参数模型 Yi-Large是零一万物最重要的当家大模型,而本次的Yi- Lightning代替了他的位置。
在全球大模型评测金标准的加州伯克利大模型竞技场LMSYS之上,Yi- Lightning排名总榜第六,超越了硅谷知名OpenAI GPT-4o、Anthropic Claude 3.5 Sonnet,排在中国第一,放在LMSYS这一公开擂台上,这算是中国大模型首度实现超越OpenAI GPT-4o 的最佳成绩。
从评测结果看,Yi-Lightning有相对优秀的模型性,在推理速度和推理成本方面也展现了突破能力,较上一代旗舰模型Yi-Large ,Yi-Lightning的最高生成速度提速了近四成。李开复称,这款模型以每百万token降至0.99元的价格,会带给零一万物“百分之几十的利润”。“我们不会赔钱卖,但也不会赚太多。”李开复进一步表示,“要能让APP使用,就要把性能极高的模型做到白菜价。”他透露,现在Yi- Lightning已经获得几家大型客户订单。
除此之外,零一万物在国内市场决定从C端转向B端。当天,零一发布了一套数字人解决方案。其聚焦零售和电商等场景,将旗舰模型Yi Lightning 实践于具体行业。
而在五个月前,零一万物的重心还在C端AI办公助手万知。彼时李开复曾强调自己不做亏钱的toB生意。
据硅星人了解,零一万物下半年的内部策略为国内主抓toB,国外主抓toC,目前,其内部已经孵化出新的toB产品矩阵,即将在近期线下集中亮相。
国内toB市场主要以API接口调用量和定制化软硬件交付项目进行收费,C端市场则主要通过订阅制进行付费。李开复发布会上强调,零一要做的toB依然不是亏钱的toB。
“零一万物的toB做法是做有利润的解决方案,不只是卖模型不只是项目制。”李开复表示。他进一步称,由于基因问题,一家大模型公司同时做B端和C端非常辛苦,需要多元化的管理方式,也需要差异化的衡量方法。“零一万物选择把toB放在国内做,找破局空间,比如用数字人做零售,做餐饮,会形成完整解决方案,找本地供应商。”
那么toC还做么,toC还做,国内暂时不推新,还在国外做——“toC我们选择做国外,toC产品在国内如果走流量会面临成本的居高不下,”李开复称,会继续维护万知的运营,但此后会把更多精力放在国外,“用更低价买到更高质量用户,或者直接把App卖出,让国外用户订阅收费。”
针对一些头部大模型初创暂停了对基础模型预训练的传闻,李开复也做了回应。他认为,做一次预训练模型的费用在300多万美金左右,这个价位对于头部初创不成为问题。只是“做好预训练模型是一个技术活儿,需要很多有才华的人一起工作。”而如果一个公司有幸拥有这些人才,跨领域合作,中国就有机会做出世界前十的预训练模型。
在大模型头部初创都面临模型能力增长放缓和变现焦虑的当下,零一万物坚持推出基础模型,并剑指B端市场,是为一款经典打法。从李开复的表述中可以洞察,融资难度的加剧以及资源的紧缺并未对这家公司造成影响,模型方面与OpenAI的6个月差距也并不给他形成焦虑。零一万物似乎还在坚持,用基础技术创新的方式,在竞争激烈的市场中谋求新的增长点,这与其他大模型初创的道路已经出现分野。
“如果期待破局,可能需要一个前所未有的算法才有机会。”李开复如是说。
以下为发布会问答环节,有适度删改。
问:此前有消息称AI方面的六小虎中的某几家放弃了预训练,开复曾进行辟谣,但站在行业角度,请您评估,对预训练模型逐步放弃会是行业整个趋势吗?
李开复:做好预训练模型是一个技术活,而且要非常多有才华的人在一起工作,慢工出细活,需要懂芯片的人,懂推理的人,懂基础架构的人,懂模型的人,有很好的算法同学,才能一起做出来。
如果一个公司能有幸拥有这么多优秀的人才,能够跨领域的合作,那我相信中国是绝对可以做出世界排名前十的预训练的通用模型,但不是每家公司都可以做这件事情,做这件事情的成本也比较高,以后有可能会越来越少的大模型公司训练做预训练。不过据我所知,这六家公司融资额度都是够的,我们做预训练的production run,训练一次三四百万美金,这个钱也是头部公司都付得起,我觉得中国的六家大模型公司只要有够好的人才,想做预训练的决心,融资额跟芯片都不会是问题的。
问:OpenAI的o1发布后,很多人认为,从技术上会带来新的范式。这对初创公司来说会有哪些影响?
李开复:我刚从美国回来,跟OpenAI的人有沟通,他们跟我分析公司内部还有好东西,但不急拿出来,因为他们领先行业足够多,到了一定的业务节点才释放出来,这是他们能做而别人不能做的。OpenAI o1 虽然隐藏了所有中间的思考状态,但还是很多人在网上开始猜它怎么做,我们认为有一些揣测比较靠谱。当你发起一个新技术时,这个技术一定会被很多聪明人使用揣测,我觉得五个月以后,应该也有不少类似o1模型的能力会出现在各个模型公司,包括零一万物。
o1的思考模式是把之前只在预训练中 scaling 趋势扩展到了推理的时候,这件事情对行业是最大的认知改变。过去大家觉得谁预训练做好就够了,慢慢大家发现后训练SFT和强化训练都是非常重要。所以零一万物的团队刚开始做的主要是专注预训练,之后又有很多很厉害的人加入,帮我们把Posttrain(后训练)也做出来,现在看来推理也很重要,一年半以前大家觉得大模型最厉害的地方就是预训练,一年以后发现后训练也是同样重要,这感谢OpenAI点醒我们这一点,现在我相信很多中美公司都在往o1方向狂奔。
问:开复前说“不做赔钱的to B”,这次却首次公布了相关矩阵,是否意味着我们也尝试往to B方向进一步深耕?
李开复:我们特别重视给每个用户提供价值,所以我们不会去说有模型,你要拿来做什么,我卖给你,你先给钱,这样对用户是不会满足的。另外一种常见的做法,就是到企业里,企业说我要做客服,模型卖给我,怎么做客服我不会做,你帮我做,这就成为和AI1.0时代一样的可以称为系统集成型的AI,也就是说卖模型给你,先帮你把客服应用做好,这样的情况下很难有利润,之前我说如果做一单赔一单的to B,零一万物宁可不做,这句话我们并没有改变。
我们刚刚发布的AI 2.0数字人解决方案不会做一单赔一单,因为它是专注到用户重大的痛点需求和盈利点,也就是说一个店长或KOL平时做一次直播浪费最重要的资源,就是他的时间,而且这个时间就算做一小时的直播能赚到一千块钱,也就是一千块钱,但如果用数字人直播就不是一小时了,可能可以做一千个小时,哪怕每一个小时只能赚一半的钱,一千个小时还是可以赚五百倍的钱,这样的账就很好算了。如果真的能把数字人做到端到端,只要输入公司内部的东西,这次减价的,选一个形象、声音按一个钮就开始百录甚至千录的直播,等于你是卖给这个企业一个印钞机,印钞机要收租赁费就是可行的了。除了直播以外,我们的AI 2.0数字人解决方案已经跑通了更多业务场景,比如AI伴侣、IP形象、办公会议等等。我们继续执行模应一体战略,将Yi-Lightning模型能力与数字人解决方案结合,不断迭代产品,后续会解锁更多业务场景。
回到国内的SaaS的问题,国内现在很难说到SaaS,整个收费模式和商业模式在美国走通了,但国内还是一直有很大的问题。但也有一些行业可以走通SaaS,SaaS按使用收费,也可以订阅,按照每个月收费,也可以用分成,这些模式都可以综合称为比较好的商业模式,因为它不是一次性卖掉,像一个项目制的公司帮你做一个客服卖给你,你付钱就走了,以后没有钱可以收了,而是可以持续收费。刚才讲的模式,无论分成、订阅的SaaS模式才是可持续的商业模式,今天我们并没有看到一个普遍被接受的SaaS模式的存在。所以在国内,我们大模型to B相对于AI 1.0时代有不同的打法,首要任务就是要寻找少数能够按使用情况收费的方法,而不是项目定制的方法,能得到比较高利润率的订单再去做。
整体来看,零一万物to B整体解决方案会采取“一横一纵”的打法。和Yi-Large相比,Yi-lightning的模型性能又有大幅提升,作为国际 SOTA 的基座模型,他们本身就具备着出色的泛化性,再加上零一万物自身拥有很强大的SFT(监督学习)能力。这些技术能力使得我们的团队能够先将单个行业做深做透,进而以自身技术能力和行业积累为基础,凝练出标准化的to B解决方案,为各行各业的企业客户降本提效,将世界第一梯队的大模型用到实处,真正为企业带来业务增长和新竞争力。
问:上次5月份时,Yi-Large把中美顶尖模型的时间差缩短到六个月,这次我们的发布这边直接击败了GPT4o,把时间差甚至缩短到了五个月,从零一万物到整个中国大模型初创公司来说,预训练模型要有自己怎样的独门特色,才能继续追赶、缩短时间差?
李开复:缩短时间差非常困难,我不预测我们可以缩短。因为毕竟人家是用十万张GPU训练出来,我们用的是两千张GPU训练出来,我们时间差能达到只是因为我们模型、AI infra等团队都热心聪明,去使用和理解对方做出来的东西,再加上我们每家的研发有特色,比如数据处理、训推优化等等,现在这一套方法论在零一万物已经成熟,我们有信心把自己的创新加上一些特长,融合对OpenAI和其他公司发布新技术的关注,把它的能力在我们产品里面发挥出来,我觉得这套方法保持在六个月左右,就已经是很好的结果了。
如果期待破局,可能需要一个前所未有的算法才有机会。我们千万不要认为落后六个月是很羞耻的事情,或者一定要追赶,因为很多美国朋友都认为中国会远远落后,也有美国朋友认为,人家十万张GPU等,我们要被甩掉三年、五年甚至十年都有可能,现在从零一万物证明,不会落后这么多,这次LMSYS榜单也有两家其他中国公司表现不错,不是只有我们一家在做。所以对于奋力图强、勤奋努力、聪明多元化的团队,在国内拥有这样团队的公司,要用类似零一万物的打法,去贴近美国最顶尖的公司,不落后超过六个月,我觉得是可能,而且不只是我们一家可能,但难度是高的,希望再往下减非常困难,除非真的有一个发明和科技上的突破。
问:零一万物在海外市场推出了to C的产品,同时在国内也逐步推出了to B的产品。在这种背景下,如何看待to B和to C产品之间的界限?零一万物从去年开始以来进行尝试把技术产品化,尤其在B端、C端方面有哪些优势?二者有无场景和能力上的复用情况?
李开复:一个大模型公司同时做to B和to C也是很辛苦的,也是需要多元化的管理方式,因为两个团队的基因不一样,做事的方法和衡量KPI的方法都不太一样,我自己在这两个领域有经验,也在试着做,但是也绝对不能什么都做,所以to B选择做国内因为我们找到了一些破局的空间,比如用数字人来做零售,来做餐饮等等,这能做一个完整的解决方案,另外还有两三个领域开始在做,现在还不方便披露。
我们觉得这样的to B工作只能在中国做,因为要触达美国的用户或国外的用户不太可能,所以全世界的范畴来说,to B供应商基本都是当地的,即便在中国要买SAP的产品也是SAP中国卖给你,所以跨国的设立分公司做to B绝对不是我们或其他的创业公司能做的,所以to B的国外就放弃了,做to B就做国内,做to B就做有利润的解决方案,而不只是卖模型,不只是做项目制,这是我们to B的做法。to C我们主要布局海外,有好几个理由。第一个理由,当我们开始做零一万物时国内还没有合适的中文模型,我们只有在国外先尝试,尝试了一段就有了心得,就迭代了一个、两个、三个产品,这些产品现在表现有些很好,有些没有那么好,我们也在不断地调整中。
我们在国内也在观察什么时候适合在国内做什么样的产品,to C的产品在中国国内走流量有一个很大的问题,就是流量的成本越来越高,我们也看到了有些友商的单用户成本从十几块人民币加到三十多块人民币,近来还有相当的流失,在这样一个挑战环境里我们会非常谨慎,先不推出中国本土新的to C的应用,我们已有的产品还会继续维护,但更多的精力会在国外的土壤用更低廉的钱买到非常高质量的用户,或者能直接把App卖出去,让用户来订阅收费,这个订阅的习惯在国外也是比较良好,主要是这几个理由。现在当下最大的理由还是说国外做to C的产品,我们变现能力和消耗用户增长的成本算账可以算得过来,以后再关注国内有什么机会可以推出。
有关这两者有没有相似的地方?相似挺多。首先两边都需要非常高质量、快速的模型,我们有。另外我们会需要用到各种预训练和后训练的技术,这两边都会用上,一个to C的应用,调一个数字人的应用方法都需要类似的技术,我们有技术累积。当我们最终做出产品,比如to B的产品里面需要的各种功能,还有to C需要的功能也有很多可以共用,比如AI阅读、AI撰写、AI PPT、AI搜索是很多to B、to C应用需要的模块,今天看传统的软件底层还有很多是相似的,就是Windows里面提供平台的API都是to B、to C共用,我们也在累积这些共用的地方。
问:你们新发布的旗舰模型以白菜价格公示,这会造成亏本么?
李开复:零一万物在Yi-Lightning的定价上并没有亏本。
从成立的第一天起,零一万物就同时启动了模型训练、AI Infra、AI 应用三大团队。当三个团队都成熟以后,再对接到一起。零一万物这一模式总结为模基共建、模应一体两大战略——AI Infra能力助力模型训练和推理,以更低的训练成本训练出性能领先的模型,以更低的推理成本支撑应用层的探索。出色的模型性能与低廉的推理成本不仅能支撑零一万物开拓绝佳的to B应用场景,还能让零一万物推出的大模型to B解决方案更具性价比。
之前回应行业价格战时,我的回答就是零一万物不参与。另外,我当时提到,不能只看模型价格,还要看模型性能是否足够好。
当时有很多性能较差的模型价格降到非常低,甚至是免费,我相信当时选择接入这类模型API的企业与个人,收获都不达预期。
要接入API,足够好的模型性能很重要,不然产品无法达到PMF。另外很重要的一点,是把高性能模型的价格降到白菜价,0.99元人民币/百万 token 的价格很便宜,但如果一个应用里每个用户每天调掉十几次,累积下来每年的成本还是不容忽视。零一万物也在做App,做App需要控制成本,所以我们不会赔钱卖模型,但也不会赚很多钱,而是在成本线上加一点点小小的利润,就得到了今天0.99元/百万token的价格。
挑选模型API最重要的一点,就是模型性能一定要优秀,在这个前提下去挑最便宜的,实际算一算用户掉用量会是多少,账算不算得过来。我相信,综合Yi-Lightning的模型质量和价格来看,Yi-Lightning很可能是很多开发者最认可、最高性价比的模型了。
问:此次公布的to B解决方案矩阵是完整的吗?近期是否还会公布其他to B解决方案?
李开复:除了我们已经发布的AI 2.0数字人、API之外,零一万物目前还有 AI Infra 解决方案、私有化定制模型等其他to B业务,我们会在近期正式对外发布,敬请期待。
文章来自于“硅星人Pro”,作者“lijingya”。
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales