现如今在字节跳动,已近乎隐退的张一鸣,只重点关注两件事:其一,是风暴中的TikTok;其二,就是字节跳动正在全力追赶的AI战略业务。
提及字节的AI战略远望,多个接近字节的人士均认为,以Flow部门出品最为“正统”,“虽然很多子业务都在做相关的事情,比如飞书,但管理层层面还是认为AGI之战还是以Flow为主”。
一位来自豆包的产品人士对凤凰网科技表示,2024年Q1,字节的AI业务(主要指Flow部门)一直保持着高强度作业,“基本上都是单休,但有几个产品的数据表现还不错,特别是豆包,内部士气正旺”。
据凤凰网科技了解,目前字节Flow部门旗下核心产品主要有AI对话助手豆包(海外版为Cici)、对标GPTs的AI bot开发平台扣子(海外版为Coze),以及面向二次元群体的话炉。其中,2024年2-3月份,豆包的DAU一度超过百度文心一言成为市场第一,此后月之暗面对Kimi采用投流策略后,与其不相上下。目前豆包/Cici的全球总DAU在300万左右,已经是当前字节跳动旗下AI相关产品Top1的存在。
字节AI战略核心业务概览图(凤凰网科技制作)
而排在其后的Coze,现阶段DAU已达百万级别,还没有进行商业化,未来不排除通过API调用的方式收费。
对于字节来说,无论软硬件产品,在众多的垂直产业中,都有此前的赛道头部在与其进行竞争,而字节积累最深就是有全球最大量的短视频内容数据、以及行业理解。在业内人士看来,字节跳动在AI方面,最有可能成功的机会仍旧在短视频方向上。
在2024年1月召开的字节跳动年度全员会上,字节跳动 CEO梁汝波曾经提到,公司直到 2023年才开始讨论 GPT,而业内做得比较好的大模型创业公司都是在 2018年至 2021年创立。
字节跳动 CEO梁汝波(来源于网络)
2023年2月,字节在大模型上部署了代号为“seed”的团队,专注于模型层,由朱文佳带队,其此前历任今日头条CEO以及TikTok产品技术负责人,在来字节之前,朱文佳在百度任职。
2023年底,字节正式组建Flow部门,专注于AI大模型的应用研发。字节产品与战略副总裁朱骏和字节技术副总裁洪定坤,分别担任部门的产品负责人和技术负责人。2024年3月,飞书产品副总裁齐俊元也调至Flow部门,主要负责豆包的PC端业务。
另有消息称,2024年4月,字节提拔了AI部门的负责人,现由朱文佳整体负责字节AI业务,向字节跳动CEO梁汝波汇报。
虽然在外界看来,字节以产品能力见长,但这一轮AGI竞赛,字节对基建层同样势在必得。
英伟达作为AI芯片厂商提供硬件基础设施,市值从2022年的3000亿美元上下突破到2024年的2万亿美元,凭借高性能打造的近乎垄断壁垒,一度让“所有AI企业都在为英伟达打工”。
来源于网络
而通用大模型作为软基础设施,同样意味着高集中度,“可能会像操作系统一样未来只跑出来1-2家”,是行业相对一致的“共识”。
海外OpenAI一路领跑的现象也提供了充分论据,大模型自然沦为国内大厂的必争之地,还有融资实力强的创业公司参与其中,代表有智谱AI、Minimax、百川智能、零一万物,以及最近推出Kimi的月之暗面,已被业内称为“大模型五虎”,而目前几家大厂中,阿里、腾讯、美团均有出手,只有字节,未对上述任何一家大模型创业公司进行投资。
字节自研发的“云雀大模型”,其内部曾预期在2024年达到GPT4.0水平。而据业内人士向凤凰网科技透露,“当前至少已经在3.6-3.7的程度”。
而在连接层,字节的战略思路已基本清晰。
所谓连接层,其主要任务是向下串联算力、大模型,向上串联应用,在之间做性能优化匹配,例如向量数据库、面向开发者的工具等都在这一中间层内。
一位业内人士认为,“站在大厂的战略角度,为了巩固底层的大模型和云业务基座,连接层的产品要么自研、要么并购。”
面向开发者,字节已于今年2月上线了全球化产品Coze,国内版本名为“扣子”。对于普通用户来说,无论是否有编程基础,都可以在扣子平台上快速搭建基于 AI模型的各类问答 Bot。值得强调的是,扣子属于中间层的开放平台,底层不局限于字节的云雀大模型,目前已接入的还有阿里的通义千问和月之暗面等。
Coze(来源于网络)
该产品思路对标创业公司Dify.AI,Dify兼容 Langchain,集成了多样化底层模型供应商,包括OpenAI、Azure OpenAI Service、Llama2、MiniMax、讯飞星火大模型、百度文心大模型等,目标是让开发者(甚至非开发者)快速基于大模型创建应用,分为开源免费和商业化付费版本。
Dify(来源于网络)
据凤凰网科技了解,Dify背后除了财务投资方华创资本,最近一轮还有阿里参与,对大厂来说,开发者生态就是“蓄水池”,想要让底层稳固则生态必要繁荣。
而Coze现阶段DAU已达百万级别,还没有进行商业化,未来不排除通过API调用的方式收费。此外,有业内专家还向凤凰网科技表示,两者相较,“Coze的产品化能力更强”,并且有向硬件端延伸的趋势,正在积极对接手机厂商合作希望可以OEM其中。
另据前述业内专家表示,“但手机厂商的态度更多是自研平台,有点类似当年豌豆荚和手机厂商的关系,最终豌豆荚也因为没有归属方而陨落”。
虽然前两层仍有争议,但基本明牌,而应用层是现阶段表现最为迷雾的一层。第一,AI的提效是否可以创造新应用?诞生新的百度或者字节?第二,机会在新玩家还是老玩家+AI?
根据相关投资人士总结,在To B领域,当下仍以“SaaS+AI”为主,AI作为各个单点提效的工具,企业间最终比拼的是对业务流的熟悉程度,也就是“行业knowhow(技术诀窍)”。
图|来源于网络
金沙江合伙人朱啸虎此前在公开场合表示:“短期内肯定做to B,起来快。iPhone、大哥大、电脑出来的时候,都是to B先用。马上能提高生产力、见到效果,企业愿意花钱。”企服就是剩者为王,依靠AIGC迅速达到不烧钱的爆发增长是唯一出路。“至于大模型到底在什么点让to C应用爆发,不知道”。
在不少投资行业人士看来,当前在To C领域,不管是财投还是战投都处于盲注阶段。
字节一向是创新激进选手,2023年6月初,字节就在内测代号为 Grace的 AI对话项目,8月17日,Grace更名为豆包。而海外版Cici也在同年8月份上线 36个国家和地区,并在11月拿下 GooglePlay阿根廷和秘鲁的总榜第一。
据凤凰网科技了解,2024年2-3月份,豆包的DAU一度超过百度文心一言成为市场第一,后期月之暗面采用投流策略后不相上下。目前豆包/Cici的全球总DAU在300万左右。
此外,字节Flow部门还在二次元方向推出AI角色交流工具“话炉”,对标的是MiniMax的“星野”产品——用户可以在星野根据自定义的外表、性格、语音,创立独特AI形象并收集卡牌。据悉,星野全球数据表现亮眼,尤其是海外长期霸榜,月活已突破千万级别。
在教育方向上,字节推出了Gauthmath,定位AI解题方向,最初对标猿辅导的数学学科产品,后延伸AP课程 (AdvancedPlacement,美国大学先修课程)。据凤凰网科技了解,该产品商业化进程较好,目前DAU近600万。
据悉,Gauthmath由大力教育团队打造,最初是用教育小模型在测试,现已经接入大模型扩展。
据不完全统计,字节还在代码生成方向推出CodeGen,对标Replite做AI代码生成。而短视频的赋能体现在剪映的“图片生成”功能。与此同时,字节还在发力搜索引擎赛道,据凤凰网科技了解,目前字节已解决了牌照资质问题,从过往的“域内搜索”正在延展到“全域搜索”。
前述来自豆包的人士称,目前上述多个产品均处于高速迭代阶段,“我个人认为,尤其是Flow,可以说是整个字节内部强度最大的部门”,其也表示,由于Flow部门十分缺人,字节已多次开放活水机会,为该部门向集团招纳精兵强将。
“倒金字塔”是行业常用的格局划分,当前,在AI行业,业内将AI2.0的生态格局自下而上分为模型层、链接层、应用层的“倒金字塔”形。正如前述逻辑所言,字节在这一倒金字塔形中已经全面布局。
但也有一派彻底颠覆的观点,认为“互联网本质解决的是连接问题,而AI2.0提升的是交互体验,所以会诞生下一代计算机”——在大模型侧,会出现一个物种类似于windows95操作系统,尤其是在逻辑推理和任务执行上发生关键突破;在硬件侧,模型训练和推理算力要求能下放到消费级显卡上。
在这个逻辑下,AI必须要依托底层硬件来进行革命,也就是说,最终被颠覆的可能会是微软。
但即便是在这一方向上,字节也已经悄悄放出子弹。
在36氪媒体业务于2019年上市后,创始人刘成城秘密二次创业,押注于To B企业级赛道,定位国产操作系统,该赛道内有竞争对手技德(Jide)科技。但之后刘成城就将该企业出售给了字节,并有部分创始团队进入字节内部进行秘密项目研发,而字节目前在探索的“AI+硬件”方向就是由该团队进行操盘。
36氪创始人(来源于网络)
同时,字节还投资了骨传导耳机oladance,也成为“AI+硬件”战略的入口硬件之一。据悉,oladance于2023年获黑蚁资本、蓝驰创投领投,蜂巧资本跟投的千万级美元天使轮融资。在字节投资后,蓝驰等部分老股东做了减持退出。
本文来自微信公众号“凤凰网科技”(ID:ifeng_tech),作者:凤凰网科技
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/