ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
字节跳动发起AI战争,寻找下一个TikTok
8546点击    2024-04-30 17:27

现如今在字节跳动,已近乎隐退的张一鸣,只重点关注两件事:其一,是风暴中的TikTok;其二,就是字节跳动正在全力追赶的AI战略业务。


提及字节的AI战略远望,多个接近字节的人士均认为,以Flow部门出品最为“正统”,“虽然很多子业务都在做相关的事情,比如飞书,但管理层层面还是认为AGI之战还是以Flow为主”。


一位来自豆包的产品人士对凤凰网科技表示,2024年Q1,字节的AI业务(主要指Flow部门)一直保持着高强度作业,“基本上都是单休,但有几个产品的数据表现还不错,特别是豆包,内部士气正旺”。


据凤凰网科技了解,目前字节Flow部门旗下核心产品主要有AI对话助手豆包(海外版为Cici)、对标GPTs的AI bot开发平台扣子(海外版为Coze),以及面向二次元群体的话炉。其中,2024年2-3月份,豆包的DAU一度超过百度文心一言成为市场第一,此后月之暗面对Kimi采用投流策略后,与其不相上下。目前豆包/Cici的全球总DAU在300万左右,已经是当前字节跳动旗下AI相关产品Top1的存在。



字节AI战略核心业务概览图(凤凰网科技制作)



而排在其后的Coze,现阶段DAU已达百万级别,还没有进行商业化,未来不排除通过API调用的方式收费。


对于字节来说,无论软硬件产品,在众多的垂直产业中,都有此前的赛道头部在与其进行竞争,而字节积累最深就是有全球最大量的短视频内容数据、以及行业理解。在业内人士看来,字节跳动在AI方面,最有可能成功的机会仍旧在短视频方向上。


底层基建、连接层与应用层,字节全都要


在2024年1月召开的字节跳动年度全员会上,字节跳动 CEO梁汝波曾经提到,公司直到 2023年才开始讨论 GPT,而业内做得比较好的大模型创业公司都是在 2018年至 2021年创立。



字节跳动 CEO梁汝波(来源于网络)


2023年2月,字节在大模型上部署了代号为“seed”的团队,专注于模型层,由朱文佳带队,其此前历任今日头条CEO以及TikTok产品技术负责人,在来字节之前,朱文佳在百度任职。


2023年底,字节正式组建Flow部门,专注于AI大模型的应用研发。字节产品与战略副总裁朱骏和字节技术副总裁洪定坤,分别担任部门的产品负责人和技术负责人。2024年3月,飞书产品副总裁齐俊元也调至Flow部门,主要负责豆包的PC端业务。


另有消息称,2024年4月,字节提拔了AI部门的负责人,现由朱文佳整体负责字节AI业务,向字节跳动CEO梁汝波汇报。


虽然在外界看来,字节以产品能力见长,但这一轮AGI竞赛,字节对基建层同样势在必得。


英伟达作为AI芯片厂商提供硬件基础设施,市值从2022年的3000亿美元上下突破到2024年的2万亿美元,凭借高性能打造的近乎垄断壁垒,一度让“所有AI企业都在为英伟达打工”。



来源于网络


而通用大模型作为软基础设施,同样意味着高集中度,“可能会像操作系统一样未来只跑出来1-2家”,是行业相对一致的“共识”。


海外OpenAI一路领跑的现象也提供了充分论据,大模型自然沦为国内大厂的必争之地,还有融资实力强的创业公司参与其中,代表有智谱AI、Minimax、百川智能、零一万物,以及最近推出Kimi的月之暗面,已被业内称为“大模型五虎”,而目前几家大厂中,阿里、腾讯、美团均有出手,只有字节,未对上述任何一家大模型创业公司进行投资。

字节自研发的“云雀大模型”,其内部曾预期在2024年达到GPT4.0水平。而据业内人士向凤凰网科技透露,“当前至少已经在3.6-3.7的程度”。


而在连接层,字节的战略思路已基本清晰。


所谓连接层,其主要任务是向下串联算力、大模型,向上串联应用,在之间做性能优化匹配,例如向量数据库、面向开发者的工具等都在这一中间层内。


一位业内人士认为,“站在大厂的战略角度,为了巩固底层的大模型和云业务基座,连接层的产品要么自研、要么并购。”


面向开发者,字节已于今年2月上线了全球化产品Coze,国内版本名为“扣子”。对于普通用户来说,无论是否有编程基础,都可以在扣子平台上快速搭建基于 AI模型的各类问答 Bot。值得强调的是,扣子属于中间层的开放平台,底层不局限于字节的云雀大模型,目前已接入的还有阿里的通义千问和月之暗面等。



Coze(来源于网络)


该产品思路对标创业公司Dify.AI,Dify兼容 Langchain,集成了多样化底层模型供应商,包括OpenAI、Azure OpenAI Service、Llama2、MiniMax、讯飞星火大模型、百度文心大模型等,目标是让开发者(甚至非开发者)快速基于大模型创建应用,分为开源免费和商业化付费版本。



Dify(来源于网络)


据凤凰网科技了解,Dify背后除了财务投资方华创资本,最近一轮还有阿里参与,对大厂来说,开发者生态就是“蓄水池”,想要让底层稳固则生态必要繁荣。


而Coze现阶段DAU已达百万级别,还没有进行商业化,未来不排除通过API调用的方式收费。此外,有业内专家还向凤凰网科技表示,两者相较,“Coze的产品化能力更强”,并且有向硬件端延伸的趋势,正在积极对接手机厂商合作希望可以OEM其中。


另据前述业内专家表示,“但手机厂商的态度更多是自研平台,有点类似当年豌豆荚和手机厂商的关系,最终豌豆荚也因为没有归属方而陨落”。


不设边界,字节想造AI应用工厂


虽然前两层仍有争议,但基本明牌,而应用层是现阶段表现最为迷雾的一层。第一,AI的提效是否可以创造新应用?诞生新的百度或者字节?第二,机会在新玩家还是老玩家+AI?


根据相关投资人士总结,在To B领域,当下仍以“SaaS+AI”为主,AI作为各个单点提效的工具,企业间最终比拼的是对业务流的熟悉程度,也就是“行业knowhow(技术诀窍)”。



图|来源于网络


金沙江合伙人朱啸虎此前在公开场合表示:“短期内肯定做to B,起来快。iPhone、大哥大、电脑出来的时候,都是to B先用。马上能提高生产力、见到效果,企业愿意花钱。”企服就是剩者为王,依靠AIGC迅速达到不烧钱的爆发增长是唯一出路。“至于大模型到底在什么点让to C应用爆发,不知道”。


在不少投资行业人士看来,当前在To C领域,不管是财投还是战投都处于盲注阶段。


字节一向是创新激进选手,2023年6月初,字节就在内测代号为 Grace的 AI对话项目,8月17日,Grace更名为豆包。而海外版Cici也在同年8月份上线 36个国家和地区,并在11月拿下 GooglePlay阿根廷和秘鲁的总榜第一。


据凤凰网科技了解,2024年2-3月份,豆包的DAU一度超过百度文心一言成为市场第一,后期月之暗面采用投流策略后不相上下。目前豆包/Cici的全球总DAU在300万左右。


此外,字节Flow部门还在二次元方向推出AI角色交流工具“话炉”,对标的是MiniMax的“星野”产品——用户可以在星野根据自定义的外表、性格、语音,创立独特AI形象并收集卡牌。据悉,星野全球数据表现亮眼,尤其是海外长期霸榜,月活已突破千万级别。


在教育方向上,字节推出了Gauthmath,定位AI解题方向,最初对标猿辅导的数学学科产品,后延伸AP课程 (AdvancedPlacement,美国大学先修课程)。据凤凰网科技了解,该产品商业化进程较好,目前DAU近600万。


据悉,Gauthmath由大力教育团队打造,最初是用教育小模型在测试,现已经接入大模型扩展。


据不完全统计,字节还在代码生成方向推出CodeGen,对标Replite做AI代码生成。而短视频的赋能体现在剪映的“图片生成”功能。与此同时,字节还在发力搜索引擎赛道,据凤凰网科技了解,目前字节已解决了牌照资质问题,从过往的“域内搜索”正在延展到“全域搜索”。


前述来自豆包的人士称,目前上述多个产品均处于高速迭代阶段,“我个人认为,尤其是Flow,可以说是整个字节内部强度最大的部门”,其也表示,由于Flow部门十分缺人,字节已多次开放活水机会,为该部门向集团招纳精兵强将。


或许AI2.0颠覆的不是互联网,而是下一代计算机


“倒金字塔”是行业常用的格局划分,当前,在AI行业,业内将AI2.0的生态格局自下而上分为模型层、链接层、应用层的“倒金字塔”形。正如前述逻辑所言,字节在这一倒金字塔形中已经全面布局。


但也有一派彻底颠覆的观点,认为“互联网本质解决的是连接问题,而AI2.0提升的是交互体验,所以会诞生下一代计算机”——在大模型侧,会出现一个物种类似于windows95操作系统,尤其是在逻辑推理和任务执行上发生关键突破;在硬件侧,模型训练和推理算力要求能下放到消费级显卡上。


在这个逻辑下,AI必须要依托底层硬件来进行革命,也就是说,最终被颠覆的可能会是微软。


但即便是在这一方向上,字节也已经悄悄放出子弹。


在36氪媒体业务于2019年上市后,创始人刘成城秘密二次创业,押注于To B企业级赛道,定位国产操作系统,该赛道内有竞争对手技德(Jide)科技。但之后刘成城就将该企业出售给了字节,并有部分创始团队进入字节内部进行秘密项目研发,而字节目前在探索的“AI+硬件”方向就是由该团队进行操盘。



36氪创始人(来源于网络)


同时,字节还投资了骨传导耳机oladance,也成为“AI+硬件”战略的入口硬件之一。据悉,oladance于2023年获黑蚁资本、蓝驰创投领投,蜂巧资本跟投的千万级美元天使轮融资。在字节投资后,蓝驰等部分老股东做了减持退出。


本文来自微信公众号“凤凰网科技”(ID:ifeng_tech),作者:凤凰网科技



关键词: AI , 字节AI , AI bot , Coze , 豆包 , GPT
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

3
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/