不能承受的「平庸」之重：字节跳动的AI反击战

9277点击 2024-05-22 13:04

不创新，死路一条

字节跳动，已无法再低调。

• 外媒报道，字节跳动2023年营收1100亿美元，可能超过腾讯、逼近Meta；

• TikTok在美国渡劫，作为增长引擎的海外业务遭遇不确定性；

• 字节跳动在AI竞赛上显得“迟钝”，公司内部“到2023年才开始讨论GPT”；

作为估值超千亿美金的独角兽，字节跳动对外信息披露一贯低调，但行动上其疾如风。身处复杂局势正中心，字节跳动能主动

作为、取得战果的突破口，落到了AI。

国内像百度、阿里、华为、科大讯飞等企业布局AI大模型，从去年3月陆续推出测试产品。字节跳动主推的AI智能助手“豆包”，

直到8月份才上线。

然而，据QuestMobile数据，2024年3月，豆包App月活用户2328.2万，在AIGC类应用已排名第一；到4月，豆包在苹果中国区

的AIGC类应用排名最高，在安卓市场累计下载量破1.3亿。

“大力出奇迹”的流量法则，在字节跳动的AI产品上再次生效。

5月，则是AI超级大月。OpenAI更新GPT-4o，谷歌I/O大会全线更新，微软将公布自家AI和Copilot，阿里发布通义千问2.5……预计“王炸”、“颠覆”等词语会持续刷屏热搜。

5月15日，在火山引擎Forece原动力大会上，字节跳动正式发布自研的豆包大模型。

不能承受的「平庸」之重：字节跳动的AI反击战

火山引擎总裁谭待表示，

经过一年时间的迭代和市场验证，豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一，目前日均处理1200亿Tokens文本，生成3000万张图片。

不仅如此，字节跳动更推出“杀手级”定价：豆包主力模型推理输入定价仅0.0008元/千Tokens，比行业价格便宜99.3%。

在AI竞赛的光谱中，OpenAI是典型的高举高打，占据注意力的中心。而中国大厂普遍信奉“慢就是快、大器慢成”的古典哲学，以及应用创新、产品落地的实用主义。

无法低调的字节跳动，正以自己的节奏冲入AI战局。

01

危机感来自哪里？

“最大的危机感，是担心字节跳动作为一个组织，正在变得平庸，无法取得新的突破。”

1月30日，字节跳动CEO梁汝波在年度全员会上进行了批评。

不能承受的「平庸」之重：字节跳动的AI反击战

中国互联网大厂今年集体反思。字节跳动，往往是大厂语境里要防备的对手，一个掌握超级流量、攻入业务腹地的破局者。

而梁汝波认为，字节跳动在AI上更显得“迟钝”：

字节跳动对技术的敏感度不如创业公司，直到2023年才开始讨论GPT。业内做得好的大模型创业公司，都是在2018年至2021年创立的。

2018-2021年，中国互联网大厂经历了一波AI人才流失。吴恩达、张潼、贾佳亚、金榕等AI Lab负责人和科学家大量出走，回归学界或是参与创业。

同期，OpenAI已迭代到GPT-3，展示的对话、下棋、文字等能力，在业内掀起讨论。谷歌也发布BERT模型和Transformer架构，为Scaling law奠定基础。

字节跳动内部也训练了一个几十亿参数的模型，国内也有百度ERNIE模型、阿里M6和Plug、华为盘古模型等跟进，但据业内人士复盘，彼时大厂对AI的投入更偏重特定任务，而不是大语言模

型，因为看不到商业化前景。

直到2022年11月30日，ChatGPT正式发布。改变历史的一夜后，大模型成了“不能错过的革命”。

OpenAI觉得，成功是意料之外；对其他大厂，不存在侥幸一说。

字节跳动在2023年初开始讨论GPT。但随后一年，字节跳动调集了所有力量追赶，并快速取得战果。

公开资料显示：

•2023年2月，字节跳动组建“Seed”团队，从国内外、多部门调集人手攻坚AI，并从新加坡调回TikTok产品技术负责人朱文佳带队。

• 6月，字节跳动旗下云服务平台火山引擎推出“火山方舟”平台，提供模型训练、推理、精调等服务。如月之暗面、智谱AI、MiniMax等明星公司，早期都在火山引擎训练模型。

• 8月，国家首批通过备案的AI大模型名单出炉，字节跳动云雀大模型，与百度、商汤、中科院、MiniMax、智谱AI、百川智能、上海人工智能实验室等8家入选，可正式向公众开放服务。

• 8月，字节跳动内测项目Grace改名“豆包”，作为AI智能助手产品正式上线。

• 11月，字节跳动组建Flow部门，负责AI大模型应用的研发。字节跳动产品与战略副总裁朱骏、技术副总裁洪定坤，分别担任Flow部门的产品、工程负责人。

• 2024年2月，字节跳动上线AI智能体应用开发平台“扣子”，对标OpenAI的GPTs，成为豆包后重要的AI阵地。

• 5月，字节跳动发布自研“豆包大模型”。同时，也意味着火山引擎和微软Azure、阿里云、百度智能云类似，将自研大模型与云服务结合，正式对外提供服务。

02

字节跳动的核心是算法技术，所以他们骨子里自认为是一家AI公司。

在移动互联网时代，字节跳动善于打造爆款应用，被称为“App工厂”。

在字节跳动内部，爆款公式叫作“大力出奇迹”，即：超级流量+超级算法，通过重资本、强运营做热启动，快速获取用户基础。

冲入AI战场后，字节跳动的产品基因依然在发烫，是靠做应用产品在驱动。

一年时间，字节跳动已经推出了AI对话助手“豆包”，AI智能体开发平台“扣子”，互动娱乐应用“猫箱”，AI教育“河马爱学”，AI创作工具“星绘”、“即梦”等11款AI应用产品。

字节跳动推出的AI产品，在市面上基本都能找到对标品，而依靠“大力出奇迹”的方式，字节跳动在用户积累上迅速取得战果。

去年8月上线的豆包，目前月活用户已经超过2600万，豆包App的累计下载量超1亿，支持创建的智能体总量超过800万。

不能承受的「平庸」之重：字节跳动的AI反击战

豆包图片

今年2月上线的扣子，被称为“字节跳动的GPTs”。作为AI应用开发平台，起到了连接大模型和用户场景，组成完整生态的关键作用。用户不需编程技巧，就能在扣子平台上快速搭建基于AI模型

的各类bot，据传日活用户目前已经超过百万。

不能承受的「平庸」之重：字节跳动的AI反击战

扣子图片

一年的狂飙，字节跳动搭建了公司的AI组织队伍，在针对性的业务防御后，通过“大力出奇迹”拿到了初步战果。

应用层多点开花，打造新AI产品工厂，字节跳动在寻找下一个爆款产品，制造AI时代的“抖音”。

此次发布自研“豆包大模型”后，字节跳动也完成了通用大模型和基础设施的关键补位，并将大模型品牌收束到“豆包”名下（原名“云雀大模型”）。

豆包大模型，事实上是一个具备多模态能力的“模型家族”，包括：通用模型pro/lite、角色扮演模型、语音合成模型、语音识别模型、声音复刻模型、Function call模型、文生图模型、向量化模型

等9款模型。

不同的模型，针对不同的场景。最受关注的是2个豆包通用模型：

• pro版本提供窗口尺寸128k、全系列可精调的满血性能。

• lite版本则是快速响应，追求更低延迟和更低单位成本。

过去一年，豆包大模型已经引入了字节跳动内部的抖音、巨量引擎、飞书、大力教育、番茄小说等50多个业务，在营销、电商、办公、创作、编程等多场景进行优化效率和产品体验。

崇尚算法的字节跳动，也在让AI成为业务增长新的“放大器”。

例如，抖音集团前CEO张楠调往剪映之后，也在5月推出了类Sora的视频生成AI“即梦”，为最瞩目的视频领域开辟想象空间。

字节跳动在用自己最熟悉的打法，攻占C端的AI市场。

03

如果大模型是一场马拉松，我们还在起步的100米。

to C的AI应用，制造一个“抖音级”爆款，是马拉松的长远目标；

而字节跳动展露的当下野心，是让加持自研大模型的火山引擎云服务，攻入to B企业服务市场的腹地。

字节跳动对豆包大模型，推出了“杀手级”定价。

以豆包通用模型pro-32k为例，其模型推理输入价仅为0.0008元/千Tokens，远远低于行业价格。市面上同规格模型定价，约0.12元/千Tokens，价格为豆包的150倍。

满血性能的豆包通用模型pro-128k看，价格也是0.005元/千Tokens，而GPT 4-Turbo 128k是0.07元/千Tokens，价格是豆包的14倍。

不能承受的「平庸」之重：字节跳动的AI反击战

现场用一张图片，比较了目前大模型的定价，成为大会最高潮出圈的环节。

根据火山引擎计算，1元钱就能买到豆包主力模型的125万Tokens，大约是200万个汉字，相当于3本《三国演义》。

火山引擎总裁谭待表示，

降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。

大模型从以分计价到以厘计价，将助力企业以更低成本加速业务创新。

大模型这个赛道，字节跳动不是第一个打价格战降价的，但把战况打到了新的烈度。

百度、阿里、腾讯都已通过云服务对外提供自研大模型，并通过降价、用户免费等方式开展竞争。今年4月，百度宣布文心大模型的推理性能将提升105倍，而成本降到1%；阿里云全线下调产

品价格，发布通义千问2.5后，对个人用户开放了免费使用。

价格只是表象，AI大模型赛道想要做大蛋糕，关键还是企业应用场景太少。

大模型的推理成本，随着规模的扩大，之后可能仍会以每年10倍甚至几十倍的速率下降。到了100块钱就能买1亿Tokens的时候，企业有什么想法都可以尝试，不必再受缚于成本预算，这样才

有AI应用爆发的可能。

OpenAI的CEO山姆·奥特曼在最近采访中表示，他相信高质量AI智能的成本将变得非常低廉，最终趋近于零。

OpenAI开放GPT-4o后，金沙江创投合伙人朱啸虎进行点评：

1.大模型的技术迭代曲线明显放缓。

2.开始卷免费，说明GPT的用户和收入增长都已经碰到瓶颈，不是深度绑定大厂的模型公司基本已经出局。

3.应用会迅速爆发，推理成本再降一个数量级就会普及出现AI时代的国民应用。

这也代表了国内在大模型领域，普遍信奉的实用主义：大幅度降低大模型的推理成本，让产品落地和企业使用，在实践中推动AI发展。

火山引擎的总结，更直接：先用起来。只有最大的使用量，才能打磨出最好的模型。

国内AIGC用户渗透率目前只有6%。不管发布会上的AI，有多么“像魔术一样”，AI大模型高昂的成本，最终仍要B端企业来买单。

企业是最为严格的“价格敏感”客户，不会付费购买一个精美的玩具或艺术品，而是需要实打实的工具、效率和规模化。

具体到AI大模型，企业的直观痛点：价格太贵、落地太难、效果有限，还存在安全上合规与信任的问题。

谭待表示，今年行业不再比拼参数规模，因为大家都“悟”了：

大模型降价，不能只提供低价的轻量化版本，主力模型和最先进的模型也要够便宜，才能真正满足企业的复杂业务场景需求，充分验证大模型的应用价值，从而催化出超越现有产品和组织

模式的创新。

字节宣布降价之后，业内纷纷跟进，又掀起了新一轮热潮。

5月21日，阿里云发布降价公告，对通义千问的9款模型进行大幅降价，其中Qwen-Long降价97%，输入价格0.0005元/千tokens，比豆包通用模型-pro 还要便宜0.3厘，仅比豆包通用模型lite 贵

0.2厘；

21日下午，百度智能云公布，将两款轻量化模型ENIRE Speed、ENIRE Lite全面免费，即刻生效。

从全球来看，企业在加码对云服务投入的趋势明显。微软Azure作为OpenAI的独家云服务商，已经吃到了AI需求的红利，过去一年的营收和利润增速极为惊人。

从2021年，火山引擎进军IaaS，代表了字节跳动进军云服务市场，直接与阿里、华为、腾讯竞争的雄心。

在C端的AI应用大力出奇迹后，火山引擎将承载B端的攻坚任务，成为字节跳动的增长引擎。

火山引擎去年6月就发布了大模型服务平台“火山方舟”，此次大会推出了升级版的“火山方舟2.0”，系统性让企业先把大模型用起来。要让企业老板们对AI的热情，像抓抖音流量那样炽烈。

除了价格便宜之外，火山方舟对模型训练、系统稳定、核心插件、安全服务等都做了优化。

在算力层面，字节跳动是目前国内算力储存最为充足的企业之一，火山引擎的海量GPU资源，能够进行潮汐调度，分钟级完成千张GPU扩容的弹性，与秒级响应的精调模型，能有效承载企业的

调用需求。

火山方舟此次重点更新了插件生态，为广大企业调用字节跳动在内容、算法、生态上的核心资源。

•联网插件，提供头条抖音的搜索能力，能实时联网学习，并通过多模态交互。

•内容插件，提供头条抖音的海量内容，支持对视频内容的理解、检索、多模态交互和内容生成。

•RAG知识库插件，提供毫秒级百亿规模的高性能检索，秒级流式知识库索引更新，内置豆包向量化模型，提升搜索能力。

针对开发者，火山引擎同步推出了“扣子专业版”，作为企业级的AI引用开发平台，帮助企业打造自己的智能体，并通过飞书、微信等平台发布，或者直接用API搭载到终端硬件设备。

目前，火山引擎已经在智能终端、汽车、金融、消费等行业展开合作，打开了B端市场的突破口。如OPPO、小米、三星、广汽、蒙牛、招商银行等企业，已经与火山引擎进行了人工智能相关

的业务合作。

用低价开路，技术、算力和服务跟进，火山引擎在形成自己“大力出奇迹”的策略，并通过更大的B端企业群，更大的使用场景，不断打造更聪明的AI，更高的效率提升。

字节跳动想要“逃逸平庸的重力”。

这家最懂打造爆款产品的公司，想制造AI时代的下一个“抖音”，更想要开动火山引擎，让AI成为水电一样的底座、企业增长的引擎。他们调动组织资源、召回技术大将，在大力出奇迹中赶上竞

速的第一梯队，并带头击穿了行业的地板价。

字节跳动，终于又找到一个值得All in、放手去冒险的无边界战场。

文章来自公众号“智谷趋势”，作者：王延鹤

不能承受的「平庸」之重：字节跳动的AI反击战

关键词: 豆包AI , 豆包大模型 , AI , 大模型 , 国产大模型

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。
项目地址：https://github.com/labring/FastGPT

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点，无需魔法付费，即可无限制使用GPT-4o等多个海外模型产品。
在线使用：https://ffa.chat/