ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
字节AI为何凶猛:重启App工厂,争抢“豆包”,连模型也要赛马
2941点击    2024-10-24 11:42


2023年8月18日,字节跳动旗下AI对话产品Grace,更名为「豆包」。


在百模大战一波又一波密集的“重磅发布”中,这条当时看着毫不起眼的消息,悄然开启了字节大模型的多重宇宙。


从时间线来看,字节跳动的确晚了。相比于当时反应迅速的百度和阿里,没有发布基础模型的字节,彼时并无法靠「豆包」来说服质疑它的观众们。


据字节内部人士透露,2023年年初,集团内部才刚刚开始训练基础模型,而后,字节跳动创始人张一鸣明确了“不卷基模,做AI应用”的战略方向,之后字节开始高举高打,内部的组织架构以及外部策略都开始进行了大变革。


11 月 27 日,也就是确认字节将放弃游戏业务的同一天,字节跳动传出已成立了一个新 AI 部门 Flow。


紧接着,字节系各类AI 应用如流水线上的产品一般,快速涌向市场。据硅星人统计,2024年至今,字节在国内外推出包括「豆包」在内的20余款App,从集成式的聊天助手,到图像、视频、音乐等效率工具,加速渗透到教育、办公助手、开发平台、代码生成等行业,而且,这些应用的表现亮眼,一个个在AI应用大乱斗里杀出重围。


今年3月「豆包」的下载量和月活跃用户开始双双登顶。而据a16z发布的全球 Top 100 AI 应用榜单显示,字节系的Cici、Coze、Gauth、Hypic、CapCut五款产品名列前茅。与此同时,字节依然不断在海外推出新的产品进行试点。



10月份,这种势头仍在继续,据Sensor Tower10月份最新数据免费榜前10中,Gauth排名第六、TikTok排名第七、CapCut排名第九。


这些都是令所有AI应用创业者眼馋的成绩。字节AI究竟为何能如此凶猛?


重启“APP工厂”


字节系AI产品全线突飞猛进的同时,许多人越来越明显感到一丝熟悉的味道——“APP工厂”回来了。


在移动互联网时期,“App工厂”的打法是字节快速开疆扩土的重要策略之一。公开数据显示,2018 年-2020 年,也就是字节增长最为迅速的几年间,它自研和收购了大量的项目,其中在App Store上线的应用就有约140个,占其成立以来的七成。


期间,字节通过批量生产,在今日头条和抖音之后,也成功推出了剪映、懂车帝、皮皮虾、番茄小说、轻颜相机等爆款。


从2023年11月,APP工厂在AI时代重启了,字节陆续密集上线了众多APP。经硅星人整理如下表:



值得注意的是,其中海内外产品几乎一比一对应,一部分国内产品如豆包、剪映复制到国外;另一部分则是在海外高排名的产品复制回国内。


在整理的过程中我们发现,不少产品的名字在几个月内频繁变动,比如对标星野的AnyDoor,早期进入国内时名为「话炉」,在今年4月份名称改为「猫箱」,「河马爱学」改名为「豆包爱学」等等。


这背后是字节系产品对于AI产品命名和定位的思考。


彼时大模型产品的命名常常引经据典,与文心、通义、混元、星火、天工相比,「豆包」听起来土味十足。“当时准备将Grace推向市场的时候,内部一致认为必须要改名,要做中国市场,英文名限制太大。陆陆续续起了100多个名字,有一部分有硬伤直接被Pass了,剩下的做了一些田野调查,有负面关联又淘汰了一部分,最终是朱骏拍板定了「豆包」这个名字。”


豆包团队的人员告诉我们:“我们私底下讨论过,豆包这个词在中国的渗透率差不多80%-90%,没有硬伤。字节内部起名字有一整套的流程,再经历田野调查,这个名字有没有什么负面关联。”


相比于创业公司和其他互联网大厂,字节的优势在于成熟的产品方法论,来保证产品的水平在60分以上,形成稳定的产出。


而在场景的选择上,目前根据我们整理的结果发现,字节系产品其实并没有真正在开拓新的场景,它其实很少“教育市场”,而是更多“顺应市场”,在已经被部分验证的场景下进行产品的迭代和优化。同时,海外市场更多承担新产品孵化地的角色,产品在国内和国外是隔离的,通常一侧上线,完成市场和用户数据分析后再在另一侧上线类似产品。


简单地说,它的策略就是复制小爆款,成为大爆款。


比如「豆包」虽然推出得晚,但上线便集齐了对话、Agent、语音通话等当时分散在不同产品中的大模型功能,「猫箱」完全对标「星野」、「星绘」对标「妙鸭」、「海绵音乐」对标「Suno」,在此基础上,结合用户体验对产品进行迭代。


哪些产品要放弃,哪些产品又要继续投入资源?答案依然是,数据。


字节跳动有专门负责产品增长的团队。这个团队构建了一个强大的数据监测系统,他们会花大价钱去买市面上的数据,尽可能监控所有产品,用来指导研发。


基于信息差的实验+地毯式孵化+数据增长,形成了一条新的AI APP生产线。


争夺“豆包”,模型也赛马


App工厂的背后,是字节式的赛马机制。


“Grace是2022年我们团队开发的,在字节内部使用的产品,员工可以用它来学习一下内部资料。”豆包初始团队的同学告诉硅星人:“到了2023年年初,字节内部有好几个团队还有自发组成的新团队,都在尝试新产品,但我们团队因为做得早,有产品雏形,公司开始计划基于原来的框架推一个移动端的产品。”


「豆包」诞生初期,赛马并没有那么激烈,随着AI产品战略逐渐明确,内部也逐渐开始了新一轮的赛马。


据硅星人了解,目前字节内部形成了多轮赛马制:


第一阶段,创新产品中心负责前期孵化、产品创意、内部审核以及完成产品的前期打造,到产品测试上线。在这个阶段几乎不会有流量支持,靠产品自身的形态吸引自然用户;


进入第二阶段的产品,开始可以拿到一部分初始预算进行外部推广,由专门负责增长的团队负责拉新留存,进行产品排名,数据表现好结合内部分析,从创新产品中心进入到具体的产品组;


而第三阶段,成型的产品开始进行大规模推广,如「猫箱」、「星绘」从去年年底开始在抖音投流以及通过KOL推广。



早期产品生产内部架构


“有点内部创业的意思吧,项目做好了团队内部分奖金,大家都希望能获得更好的资源,但产品这边的竞争其实比较良性,毕竟大家并不交叉。”


不过,和移动互联网时期的模式不同的是,当时所有的产品都是基于个性推荐算法团队生长,而如今,在今天的AI产品们底下的模型层,字节其实并没有达到统一。


产品层,豆包已经是一个统一的品牌,所有产品向豆包靠拢。但在模型层,“豆包”更像是一个代号,究竟谁能成为“豆包”,更像是一场争夺行动。


举个例子,9月24日,火山引擎一口气发布了两款视频生产模型,但对外并没有展示详细解释两款模型的差异,我们发现PixelDance和Seaweed在发布前,在Github上发布过对应的模型细节,它们分别属于两个团队,但最终均被冠以“豆包”之名对外发布。


从内部结构来看,模型和算法归属于模型算法团队Seed,由朱文佳(曾任TikTok产品技术负责人)负责;2023年11月成立的Flow团队主要负责打造C端产品,在最新的人事调动中显示,朱文佳为整体业务负责人、朱骏(原Music.ly创始人、原TikTok负责人)为产品负责人、洪定坤为技术负责人,向下包括豆包、AI教育、社区、国际化四个部门,同时PC端和移动端也分为两条业务线;而豆包大模型to B的商业化业务主要由火山引擎对外提供,并通过API的方式接入飞书。


Seed团队由原来的搜索团队、AILab团队、AML团队联合而成,但实际上,这几个团队都在暗自较劲。


“现在的豆包更像是一个统一的出口,连接用户。豆包产品后端连接了多个模型测试,是一个训练场,通过API的结果反馈来评测模型效果,但一时间很难有取舍。”上述内部人士讲道。


在GitHub和HuggingFace上面,字节的各类视频和图像模型,都分属于各个小团队,包含有4款不同功能的视频模型。



根据公开资料和介绍,我们整理了各个模型的功能,发现目前主流视频模型的能力散落在了各个模型里,比如视频编辑、运动笔刷、端到端视频生成等等,也有在Github上评分较高的开源模型,显示测试效果比已在国内发布的PixelsDance要更好。



比如MagicVideo的V2版本是目前开发者评价字节旗下最可用的一款文生视频模型,V2版本采用了模块化式生产流程,第一模块从文本到图像、第二模块从图像到视频生产关键帧、第三模块从视频到视频扩展、第四模块视频帧插值,平滑过渡。目前整体的生成效果、色彩和审美高于Pika1.0和Gen2.0。



有算法工程师就分析道:“如果几个模型的能力加起来,其实会比现在公开发布的版本更好,至少能达到可灵的效果,但是现在发布版本比较一般,可能也是内部赛马资源没有谈妥的结果。”


字节AI产品今天的突飞猛进,是其赛马机制下,一套屡试不爽的产品开发方法论加持的结果。但与移动互联网时代字节的“生产体系”很不同的是,今天在底层的模型侧,字节也在进行着赛马。


字节可能寄希望于它也像应用一样,百花齐放后筛选出最强的那一个,但同时它也客观上带来着资源无法集中的问题。尤其是在一个最需要大力出奇迹的时刻,这可能也会带来新的挑战。


文章来自于微信公众号 “硅星人Pro”,作者“Yoky”


关键词: AI , 字节AI , AI APP , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md