ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
“AI版Office”年营收过亿,李开复:PMF已经过时了
7816点击    2024-05-15 10:58

时隔半年,李开复再次以CEO的身份站在了大模型独角兽“零一万物”的发布会现场。


上一次李开复现身零一万物发布会现场,还是在2023年11月16日。彼时,零一万物首次秀了一把大模型肌肉:将中英双语大模型“Yi”开源。


李开复的出现,往往标志着零一万物新阶段的开启。显然,用开源模型打磨半年后,零一万物走进了拼产品和商业化的新战场。


在大模型侧,开源只能作为口碑获客的入口,商业化的飞轮只能靠闭源正式开启。发布会上,零一万物发布了首款千亿参数的闭源模型Yi-Large。在Benchmark上,Yi-Large的6项指标优于GPT-4。


不过,如今的零一万物将商业化的厚望,寄托在了产品端。


发布会上,零一万物正式对外推出AI生产力应用“万知”,李开复称其为“AI-First版Office”。这一款产品,在2023年九月已经在海外率先试水,在全球积累了数千万用户。


李开复表示,在AI生产力这个单一产品线上,今年能产生的营收可以达到1亿人民币。


如今,零一万物呈现在大众面前的业务版图,是开源+闭源、ToB+ToC、出海+本土两手抓的“双轨”。



1


业务的版图,折射的是李开复对技术信仰和市场落地“既要又要”的经营观。他认为,两方的观念都对,但并不完整。


在此基础上,他认为AI技术公司最重要的,是验证TC-PMF。T为技术,C为成本,PMF则是产品与市场需求的适配度。


在李开复看来,TC-PMF的反面教材,就是OfO这样的烧钱打法,产品、技术、成本相互脱节,并没有找到“黄金配比”。也正是为了验证TC-PMF,零一万物选择先在海外用高性能模型的API试水“万知”,时隔9个月后才在国内上线。


当然,作为零一万物的CEO,李开复也有了新的变化。为了跟上短视频时代的传播新趋势,这位“中国AI模型最高龄创业者”开通了抖音账号,科普怎么用AI。连这次的发布会,也选择在抖音上直播。


不过,李开复也有自己的坚持。比如,不做直播带货,只做AI科普。再比如,他也对投资人承诺,自己创业,“十年不套现”。


闭源模型6项指标超过GPT-4,成本仅后者1/3


2023年,零一万物切入大模型战局的方式是开源。自2023年11月6日以来,零一万物开源了6B、9B、34B三种尺寸的Yi大模型。


在本次发布会上,零一万物增强了开源模型的能力,同时首次发布了闭源模型Yi-Large。


Yi-Large是零一万物对标GPT-4所训练的千亿参数规模模型。在最新出炉的斯坦福评测机构AlpacaEval 2.0经官方认证的模型排行榜上,Yi-Large模型的英语能力主要指标LC Win Rate(控制回复的长度) 仅次于GPT-4 Turbo。


在中文榜单SuperCLUE对中文能力的测评上,Yi-Large跻身国产模型的榜首,在多项选择题(GPQA)、人类对齐(AlignBench)等6项数据集的评测上超过GPT-4。



斯坦福评测机构AlpacaEval 2.0模型排行榜。



SuperCLUE排行榜。


与此同时,零一万物也开启了自己首个MoE(混合专家架构)大模型Yi-XLarge的训练。目前在MMLU、GPQA、HumanEval、MATH等权威Benchmark上,处于训练初期的Yi-XLarge,性能已经超过Yi-Large,并且与Claude-3-Opus、GPT4-0409等海外主流模型相比,已有上擂台的资格。



Yi-XLarge测评结果。


而在开源梯队上,零一万物将34B、9B、6B三款模型升级到了Yi-1.5版本,并提供了Base(预训练版)和Chat(微调版)两个版本。


1.5版本的Yi,主要在数学和代码的短板上下了功夫。经过微调后,Yi-1.5-6B/9B-Chat在GSM-8K和MATH等数学能力评测集、HumanEval和MBPP等代码能力评测集上,表现甚至优于Llama-3-8B。Yi-1.5-34B-Chat的代码能力则与Mistral-8x22B-Instruct-v0.1 持平。


在模型服务层面,零一万物发布了Yi-Large的6种不同尺寸、性能的模型API:


  • Yi-Large API:优势在于文本生成及推理性能,适用于复杂推理、预测,深度内容创作等场景;

  • Yi-Large-Turbo API:根据性能和推理速度、成本,进行了平衡性高精度调优,适用于全场景、高品质的推理及文本生成等场景;

  • Yi-Medium API:优势在于指令遵循能力,适用于常规场景下的聊天、对话、翻译等场景;

  • Yi-Medium-200K API:可一次性解读20万字文本,适用于超长内容文档处理场景;

  • Yi-Vision API:具备高性能图片理解、分析能力,可服务基于图片的聊天、分析等场景;

  • Yi-Spark API:聚焦轻量化极速响应,适用于轻量化数学分析、代码生成、文本聊天等场景。


1


在API定价层面,零一万物API平台负责人蓝雨川表示,Yi-Large API目前的定价为20元/100万Tokens,这个数字不到GPT-4 Turbo(定价10美元/100万Tokens)的1/3。


零一万物API负责人蓝雨川透露,未来,零一万物也可能照着云平台的思路,提供API工具和行业解决方案。


“AI版Office”发布,支持手机上一句话生成PPT


单一产品2024年收入达1亿人民币,产品ROI接近1,上线9个月,用户数近千万。


在揭晓应用前,李开复先用了一组颇为漂亮的海外成绩单,宣告产品在海外对PMF(产品市场匹配度)的初步验证。


有了这份海外成绩单,零一万物在国内上线了首款应用产品“万知”。这款应用的定位是生产力工具,李开复称之为“AI-First版 Office”。



1


基于海外验证的结果,零一万物生产力产品负责人曹大鹏发现,原有以空白文档开启工作流的工具已经满足不了用户的需求,用户想要的办公产品,需要CUI(Chat UI,聊天界面)和GUI(Graphic UI,图像界面)的结合。


除了最基础的对话式搜索能力外,万知的多模理解能力,可以支持各种图表形式的结果生成。


比如思维导图:



1


再比如PPT生成:



1


同时,万知也支持图表解析和长文档理解。比如,我们用零一万物发布会的速记稿牛刀小试,做一个重点总结:



1


万知还能从文档中搜索到零一万物生产力产品负责人的信息:



1


区别于WPS和Windows AI Copilot,万知在网页版之外,推出了微信小程序端的应用,实现了“多端协同”。用户在通勤等碎片化的时间里,也可以用手机快速处理PPT,并且能将工作进程同步到PC端。



1


用未来的技术,做当下的产品


李开复对零一万物这一年的总结是:狂奔着赶上了美国最先进的模型。而如今,他觉得,大模型厂商要思考怎么进入“长跑模式”。


TC-PMF,是他思考的结果。当产品处于0-1阶段,企业要考虑的是获客和提高粘性;而到了1-100的阶段,任何产品想要实现大规模应用,需兼顾技术路径和推理成本。


零一万物模型训练负责人黄文灏表示,Scaling Law给AGI指明了方向,当到了应用落地阶段,模型的优化目标是给定计算条件下的计算水平,提高Infra对计算效率的提升,以及提高训练数据的质量。


这也对大模型厂商的人才团队建设,提出了更高的要求。黄文灏认为,模型公司竞争力=人才质量×算力,TC-PMF的验证更需要算法、Infra、工程三位一体的人才。




1


为了实现TC-PMF,零一万物总结了3个方法论:


  • 全球化布局:知己知彼,把控区域商业节奏。比如用户量较大的To C AI应用,主要集中在欧美;

  • 模基共建:模型的训练/服务/推理设计,与底层Infra架架构和模型结构必须高度适配;

  • 模应一体:真实用户体验,和模型迭代形成正循环。


回到做产品的层面,一年以来,李开复见证了不少应用,在OpenAI等巨头的技术迭代中沦为炮灰:“和抖音时代不一样的是,今天的模型在非常快速地基于Scaling Law在推进,GPT-4出来已经改写了基于GPT-3.5的应用所具有的能力,所以要不断预测未来技术会怎么走。”


“做一个产品,不能考虑今天的技术,而是要考虑未来的技术。”他总结。


本文来自”36氪“,作者 周鑫雨



AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales