# 热门搜索 #
搜索
不能承受的「平庸」之重:字节跳动的AI反击战
7937点击    2024-05-22 13:04

不创新,死路一条


字节跳动,已无法再低调。


• 外媒报道,字节跳动2023年营收1100亿美元,可能超过腾讯、逼近Meta;


• TikTok在美国渡劫,作为增长引擎的海外业务遭遇不确定性;


• 字节跳动在AI竞赛上显得“迟钝”,公司内部“到2023年才开始讨论GPT”;


作为估值超千亿美金的独角兽,字节跳动对外信息披露一贯低调,但行动上其疾如风。身处复杂局势正中心,字节跳动能主动


作为、取得战果的突破口,落到了AI。


国内像百度、阿里、华为、科大讯飞等企业布局AI大模型,从去年3月陆续推出测试产品。字节跳动主推的AI智能助手“豆包”,


直到8月份才上线。


然而,据QuestMobile数据,2024年3月,豆包App月活用户2328.2万,在AIGC类应用已排名第一;到4月,豆包在苹果中国区


的AIGC类应用排名最高,在安卓市场累计下载量破1.3亿。


“大力出奇迹”的流量法则,在字节跳动的AI产品上再次生效。


5月,则是AI超级大月。OpenAI更新GPT-4o,谷歌I/O大会全线更新,微软将公布自家AI和Copilot,阿里发布通义千问2.5……预计“王炸”、“颠覆”等词语会持续刷屏热搜。


5月15日,在火山引擎Forece原动力大会上,字节跳动正式发布自研的豆包大模型。



火山引擎总裁谭待表示,


经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿Tokens文本,生成3000万张图片。


不仅如此,字节跳动更推出“杀手级”定价:豆包主力模型推理输入定价仅0.0008元/千Tokens,比行业价格便宜99.3%。


在AI竞赛的光谱中,OpenAI是典型的高举高打,占据注意力的中心。而中国大厂普遍信奉“慢就是快、大器慢成”的古典哲学,以及应用创新、产品落地的实用主义。


无法低调的字节跳动,正以自己的节奏冲入AI战局。

01


危机感来自哪里?



“最大的危机感,是担心字节跳动作为一个组织,正在变得平庸,无法取得新的突破。”


1月30日,字节跳动CEO梁汝波在年度全员会上进行了批评。



中国互联网大厂今年集体反思。字节跳动,往往是大厂语境里要防备的对手,一个掌握超级流量、攻入业务腹地的破局者。


而梁汝波认为,字节跳动在AI上更显得“迟钝”:


字节跳动对技术的敏感度不如创业公司,直到2023年才开始讨论GPT。业内做得好的大模型创业公司,都是在2018年至2021年创立的。


2018-2021年,中国互联网大厂经历了一波AI人才流失。吴恩达、张潼、贾佳亚、金榕等AI Lab负责人和科学家大量出走,回归学界或是参与创业。


同期,OpenAI已迭代到GPT-3,展示的对话、下棋、文字等能力,在业内掀起讨论。谷歌也发布BERT模型和Transformer架构,为Scaling law奠定基础。


字节跳动内部也训练了一个几十亿参数的模型,国内也有百度ERNIE模型、阿里M6和Plug、华为盘古模型等跟进,但据业内人士复盘,彼时大厂对AI的投入更偏重特定任务,而不是大语言模


型,因为看不到商业化前景。


直到2022年11月30日,ChatGPT正式发布。改变历史的一夜后,大模型成了“不能错过的革命”。


OpenAI觉得,成功是意料之外;对其他大厂,不存在侥幸一说。


字节跳动在2023年初开始讨论GPT。但随后一年,字节跳动调集了所有力量追赶,并快速取得战果。


公开资料显示:


•2023年2月,字节跳动组建“Seed”团队,从国内外、多部门调集人手攻坚AI,并从新加坡调回TikTok产品技术负责人朱文佳带队。


• 6月,字节跳动旗下云服务平台火山引擎推出“火山方舟”平台,提供模型训练、推理、精调等服务。如月之暗面、智谱AI、MiniMax等明星公司,早期都在火山引擎训练模型。


• 8月,国家首批通过备案的AI大模型名单出炉,字节跳动云雀大模型,与百度、商汤、中科院、MiniMax、智谱AI、百川智能、上海人工智能实验室等8家入选,可正式向公众开放服务。


• 8月,字节跳动内测项目Grace改名“豆包”,作为AI智能助手产品正式上线。


• 11月,字节跳动组建Flow部门,负责AI大模型应用的研发。字节跳动产品与战略副总裁朱骏、技术副总裁洪定坤,分别担任Flow部门的产品、工程负责人。


• 2024年2月,字节跳动上线AI智能体应用开发平台“扣子”,对标OpenAI的GPTs,成为豆包后重要的AI阵地。


• 5月,字节跳动发布自研“豆包大模型”。同时,也意味着火山引擎和微软Azure、阿里云、百度智能云类似,将自研大模型与云服务结合,正式对外提供服务。


02


字节跳动的核心是算法技术,所以他们骨子里自认为是一家AI公司。


在移动互联网时代,字节跳动善于打造爆款应用,被称为“App工厂”。


在字节跳动内部,爆款公式叫作“大力出奇迹”,即:超级流量+超级算法,通过重资本、强运营做热启动,快速获取用户基础。


冲入AI战场后,字节跳动的产品基因依然在发烫,是靠做应用产品在驱动。


一年时间,字节跳动已经推出了AI对话助手“豆包”,AI智能体开发平台“扣子”,互动娱乐应用“猫箱”,AI教育“河马爱学”,AI创作工具“星绘”、“即梦”等11款AI应用产品。


字节跳动推出的AI产品,在市面上基本都能找到对标品,而依靠“大力出奇迹”的方式,字节跳动在用户积累上迅速取得战果。


去年8月上线的豆包,目前月活用户已经超过2600万,豆包App的累计下载量超1亿,支持创建的智能体总量超过800万。


豆包图片



今年2月上线的扣子,被称为“字节跳动的GPTs”。作为AI应用开发平台,起到了连接大模型和用户场景,组成完整生态的关键作用。用户不需编程技巧,就能在扣子平台上快速搭建基于AI模型


的各类bot,据传日活用户目前已经超过百万。


扣子图片


一年的狂飙,字节跳动搭建了公司的AI组织队伍,在针对性的业务防御后,通过“大力出奇迹”拿到了初步战果。


应用层多点开花,打造新AI产品工厂,字节跳动在寻找下一个爆款产品,制造AI时代的“抖音”。


此次发布自研“豆包大模型”后,字节跳动也完成了通用大模型和基础设施的关键补位,并将大模型品牌收束到“豆包”名下(原名“云雀大模型”)。


豆包大模型,事实上是一个具备多模态能力的“模型家族”,包括:通用模型pro/lite、角色扮演模型、语音合成模型、语音识别模型、声音复刻模型、Function call模型、文生图模型、向量化模型


等9款模型。


不同的模型,针对不同的场景。最受关注的是2个豆包通用模型:


• pro版本提供窗口尺寸128k、全系列可精调的满血性能。


• lite版本则是快速响应,追求更低延迟和更低单位成本。


过去一年,豆包大模型已经引入了字节跳动内部的抖音、巨量引擎、飞书、大力教育、番茄小说等50多个业务,在营销、电商、办公、创作、编程等多场景进行优化效率和产品体验。


崇尚算法的字节跳动,也在让AI成为业务增长新的“放大器”。


例如,抖音集团前CEO张楠调往剪映之后,也在5月推出了类Sora的视频生成AI“即梦”,为最瞩目的视频领域开辟想象空间。


字节跳动在用自己最熟悉的打法,攻占C端的AI市场。


03


如果大模型是一场马拉松,我们还在起步的100米。


to C的AI应用,制造一个“抖音级”爆款,是马拉松的长远目标;


而字节跳动展露的当下野心,是让加持自研大模型的火山引擎云服务,攻入to B企业服务市场的腹地。


字节跳动对豆包大模型,推出了“杀手级”定价。


以豆包通用模型pro-32k为例,其模型推理输入价仅为0.0008元/千Tokens,远远低于行业价格。市面上同规格模型定价,约0.12元/千Tokens,价格为豆包的150倍。


满血性能的豆包通用模型pro-128k看,价格也是0.005元/千Tokens,而GPT 4-Turbo 128k是0.07元/千Tokens,价格是豆包的14倍。



现场用一张图片,比较了目前大模型的定价,成为大会最高潮出圈的环节。


根据火山引擎计算,1元钱就能买到豆包主力模型的125万Tokens,大约是200万个汉字,相当于3本《三国演义》。


火山引擎总裁谭待表示,


降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。

大模型从以分计价到以厘计价,将助力企业以更低成本加速业务创新。

大模型这个赛道,字节跳动不是第一个打价格战降价的,但把战况打到了新的烈度。



百度、阿里、腾讯都已通过云服务对外提供自研大模型,并通过降价、用户免费等方式开展竞争。今年4月,百度宣布文心大模型的推理性能将提升105倍,而成本降到1%;阿里云全线下调产


品价格,发布通义千问2.5后,对个人用户开放了免费使用。


价格只是表象,AI大模型赛道想要做大蛋糕,关键还是企业应用场景太少。


大模型的推理成本,随着规模的扩大,之后可能仍会以每年10倍甚至几十倍的速率下降。到了100块钱就能买1亿Tokens的时候,企业有什么想法都可以尝试,不必再受缚于成本预算,这样才


有AI应用爆发的可能。


OpenAI的CEO山姆·奥特曼在最近采访中表示,他相信高质量AI智能的成本将变得非常低廉,最终趋近于零。


OpenAI开放GPT-4o后,金沙江创投合伙人朱啸虎进行点评:


1.大模型的技术迭代曲线明显放缓。

2.开始卷免费,说明GPT的用户和收入增长都已经碰到瓶颈,不是深度绑定大厂的模型公司基本已经出局。

3.应用会迅速爆发,推理成本再降一个数量级就会普及出现AI时代的国民应用。

这也代表了国内在大模型领域,普遍信奉的实用主义:大幅度降低大模型的推理成本,让产品落地和企业使用,在实践中推动AI发展。


火山引擎的总结,更直接:先用起来。只有最大的使用量,才能打磨出最好的模型。


国内AIGC用户渗透率目前只有6%。不管发布会上的AI,有多么“像魔术一样”,AI大模型高昂的成本,最终仍要B端企业来买单。


企业是最为严格的“价格敏感”客户,不会付费购买一个精美的玩具或艺术品,而是需要实打实的工具、效率和规模化。


具体到AI大模型,企业的直观痛点:价格太贵、落地太难、效果有限,还存在安全上合规与信任的问题。


谭待表示,今年行业不再比拼参数规模,因为大家都“悟”了:


大模型降价,不能只提供低价的轻量化版本,主力模型和最先进的模型也要够便宜,才能真正满足企业的复杂业务场景需求,充分验证大模型的应用价值,从而催化出超越现有产品和组织

模式的创新。

字节宣布降价之后,业内纷纷跟进,又掀起了新一轮热潮。


5月21日,阿里云发布降价公告,对通义千问的9款模型进行大幅降价,其中Qwen-Long降价97%,输入价格0.0005元/千tokens,比豆包通用模型-pro 还要便宜0.3厘,仅比豆包通用模型lite 贵


0.2厘;


21日下午,百度智能云公布,将两款轻量化模型ENIRE Speed、ENIRE Lite全面免费,即刻生效。


从全球来看,企业在加码对云服务投入的趋势明显。微软Azure作为OpenAI的独家云服务商,已经吃到了AI需求的红利,过去一年的营收和利润增速极为惊人。


从2021年,火山引擎进军IaaS,代表了字节跳动进军云服务市场,直接与阿里、华为、腾讯竞争的雄心。


在C端的AI应用大力出奇迹后,火山引擎将承载B端的攻坚任务,成为字节跳动的增长引擎。


火山引擎去年6月就发布了大模型服务平台“火山方舟”,此次大会推出了升级版的“火山方舟2.0”,系统性让企业先把大模型用起来。要让企业老板们对AI的热情,像抓抖音流量那样炽烈。


除了价格便宜之外,火山方舟对模型训练、系统稳定、核心插件、安全服务等都做了优化。


在算力层面,字节跳动是目前国内算力储存最为充足的企业之一,火山引擎的海量GPU资源,能够进行潮汐调度,分钟级完成千张GPU扩容的弹性,与秒级响应的精调模型,能有效承载企业的


调用需求。


火山方舟此次重点更新了插件生态,为广大企业调用字节跳动在内容、算法、生态上的核心资源。


•联网插件,提供头条抖音的搜索能力,能实时联网学习,并通过多模态交互。


•内容插件,提供头条抖音的海量内容,支持对视频内容的理解、检索、多模态交互和内容生成。


•RAG知识库插件,提供毫秒级百亿规模的高性能检索,秒级流式知识库索引更新,内置豆包向量化模型,提升搜索能力。


针对开发者,火山引擎同步推出了“扣子专业版”,作为企业级的AI引用开发平台,帮助企业打造自己的智能体,并通过飞书、微信等平台发布,或者直接用API搭载到终端硬件设备。


目前,火山引擎已经在智能终端、汽车、金融、消费等行业展开合作,打开了B端市场的突破口。如OPPO、小米、三星、广汽、蒙牛、招商银行等企业,已经与火山引擎进行了人工智能相关


的业务合作。


用低价开路,技术、算力和服务跟进,火山引擎在形成自己“大力出奇迹”的策略,并通过更大的B端企业群,更大的使用场景,不断打造更聪明的AI,更高的效率提升。


字节跳动想要“逃逸平庸的重力”。


这家最懂打造爆款产品的公司,想制造AI时代的下一个“抖音”,更想要开动火山引擎,让AI成为水电一样的底座、企业增长的引擎。他们调动组织资源、召回技术大将,在大力出奇迹中赶上竞


速的第一梯队,并带头击穿了行业的地板价。


字节跳动,终于又找到一个值得All in、放手去冒险的无边界战场。


文章来自公众号“智谷趋势”,作者:王延鹤



AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

4
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

5
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/