toC先走海外,国内聚焦toB。
这是大模型初创六小强之一零一万物最近宣布的战略转向。
就在今天,零一万物举行了一场toB战略发布会,会上表示,零一万物坚决走让用户产生价值的路线。
李开复博士表示:“今天不多谈对AI 2.0时代的认知,更多的要看到它的商机在哪里。”
该公司宣布了在toB层面基于“Infra+大模型+应用”三位一体战略;此外,百胜中国、孩子王、图灵新智算等零一万物的合作伙伴也同样出席发布会,围坐一起聊AI、聊这些企业是如何用零一万物的大模型来提升人效、降低成本。
由此看来,这家公司国内业务重点的转向虽然刚刚才宣布,但一切蓄力已久。
从宏观来看过去的每一次技术革命,从PC浪潮到移动互联网再到AI——总之是世界有一个新的载体、新的技术、新的内容时,总有个不变的规律:
即首先能浏览,然后能创造,然后要有更丰富、更多元的内容,然后能靠它赚钱。
李开复称上述的过程是一个不变的定律。
依据这个定律,在AI 2.0汹涌澎湃的浪潮里,下一个阶段必然以多模态的产生为重点。
“我想分享一点,多模态的很多进展都基于很酷的demo。当然我很热爱很酷的demo。”李开复表示,上个世纪80年代他本人就在做很酷的demo,“但是很酷的demo,不赚钱,没有用;不产生商业价值,没有用;没有价值主张,没有用;没有客户愿意买单,不能靠它赚钱,没有用。”
和此前所有以零一万物创始人身份露面有些许不同,李开复在这次发布会上几乎完全用商业思维来评估这个领域,并传递他旗下大模型公司的状态和进展。
李开复表示,生成式AI基础上整个应用都在发生革命性变化,这不仅仅局限在原生AI应用的迭代周期变快,整个用户界面都在革命性变化。
过去multi-touch的用户体验,其背后有数据库、操作系统、CPU;而今天,原生AI应用的用户体验要以自然语言/语音来作为沟通方式(而不是机器的方式),其背后是模型、基础架构。在做toB、toC应用的时候,一定要用Natural UI;OS不再架于CPU而是GPU上,其中涉及各式各样的基础架构问题。
于是,一个问题被抛出来:在这个革命化迁移的过程中,AI 2.0时代,怎么能进入赚钱的商业闭环?
李开复的答案是,第一是进入多模态时代,然后进行商业化;第二是从“OS架在CPU上”转变为“智算中心架在GPU上”。
而这两个巨大的商机都是经典的toB型业务。
PC和移动互联网这前两次技术革命都产生了巨大的价值。
李开复把起原因归于因为最终最赚钱的不是芯片厂商,也不是平台提供商,而是toB、toC的应用。
这条道理同样适用于现在的AI浪潮,不过,他也提出,“应用”这件事不发生,整个生态就是不健康的。
之所以称生态不健康,是因为在李开复看来,如果没有出现贴近用户、贴近企业的应用来创造最终价值、创造经济财富,用户不会甘愿付费从而让应用存活下来。
如此这般,应用也不会对平台、模型、云算中心作出反馈,让这个生态中的各个层面都赚到真金白银。
如果只是执着地把所有资源都用来购买芯片,去烧更大的模型,最后应用没有做起来,带来的生态是相对不健康的。
与此同时,今时今日以生成式AI为基础的toB业务和往昔又有不同。
它不再是单纯项目拿单的模型,而是通过提供解决方案,不断创造商业价值、带来业务增长。
李开复谈道,拥抱AI 2.0的技术,不是说做个智能客服节约人力,不是说丢出个模型让企业自己降本增效。
虽然上述一切都会发生,但最重要的是所有愿意拥抱新技术变革的企业,要从上到下发生思考方式的革命。
而重视生态非常适合中国的情况。
最后,李开复分享了把模型放到真实有价值的应用的公司具备的特性:
第一是明确“怎么样能看到项目的降本增效”。
降本增效一定是技术提供商愿意自己花更多的时间开发很多和模型基座有关的解决方案,更贴近用户的需求。
第二是让AI大模型进入核心业务。
智能客服应用很广,但这并不是核心的机会。
第三是不能站位过高。
训完模型就丢给客户让它们自己微调,其实大部分公司并做不到;如果要继续训练,更不可能。
国产大模型首次在国际最具挑战的“大模型竞技场”榜单上超过GPT-4o(5月版本),成绩就是来自零一万物。
就在十多天前,这家国产大模型公司又推出最新旗舰模型Yi-Lightning,性能超越GPT-4o-2024-05-13,冲上UC伯克利大模型竞技场(Chatbot Arena)总榜第6。
还把每百万token的价格打到了0.99元人民币。
这不到该版本GPT-4o的3%,相比于GPT-4o-mini百万token输入输出价格的均值,也降低了近2/3。
在模型能力、性能价格兼备,并作出属于AI 2.0时代的模型业务思考的情况下,零一万物的toB之路也十分清晰。
核心基于AI Infra赋能AI Native应用,基于(已经发布和未来将发布的)模型,基于多模态能力,提供企业级的模型解决方案和行业解决方案。
后者的核心则是希望聚焦创造高商业价值的垂直行业场景,用大模型原生能力,渗入应用场景,拓展业务场景,差异化赋能、重构。
整理可以总结为:
模型+AI Infra+应用三位一体推进,在行业中形成行业+场景+大模型的原生应用,形成可规模复制、能够帮客户做增长或者做ROI。
零一万物联合创始人祁瑞峰介绍了零一万物目前的三个toB解决方案。
分别是:
以零售行业解决方案为例,基于语言模型、视觉理解模型、文生图片模型、声音模型、文生视频模型,零一万物会针对性提出企业数据激活方案、企业智能体方案、端到端SaaS服务。
在前台,进行包括数字人直播、营销视频生成服务、店员copilot服务的赋能;在后台,则有各种岗位的copilot服务,如HR/客户/市场分析/研发等等。
此外,基于以Yi Lightning模型为代表的系列Yi模型,零一万物搭建起了包含角色大模型、直播声音大模型、电商话术大模型在内的一整套专用模型基座,推出了与AI 1.0时代不同的数字人解决方案“如意”。
与AI 1.0时代的数字人相比“如意”数字人解决方案不仅在形象和声音上更为逼真、更贴合垂直场景的需求,还具备了“AI 大脑”,能够自主完成部分决策任务。
目前,“如意”已经跑通了包含本地生活直播、AI 伴侣、IP 形象、办公会议、媒体营销等场景。
文章来自于微信公众号“量子位”,作者“衡宇”
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales