# 热门搜索 #
搜索
字节AI,“软硬”兼施
7822点击    2024-09-19 09:42

是通道,更是采集器


属于AI的投资热潮仍在继续,只不过资本的注意力开始由“软”变“硬”。


无数海外初创公司前仆后继下,今年8月中旬,国内掀起了一阵围绕AI智能眼镜的投资热潮 。大模型为可穿戴硬件“注入灵魂”的想象力,快速在全球范围内形成共识。


直至9月,AI眼镜概念股退潮回落,国内一位重量级选手这才堪堪入场。据《晚点LatePost》报道,字节正在探索将大模型与硬件结合,既自己开发 AI 硬件,也会与外部硬件公司合作。



一言以蔽之,软硬件融合。


不过就目前看来,字节切入AI硬件的路径与大量创业公司并无二致,均是将硬件作为用户获取AI能力与服务的“通道”,即通过API的方式接入Chat bot产品,让用户无需掏出手机即可与AI助手对话。


都说2024是AI应用之年,但我们迟迟见不到产品层面的差异化。Super App遥不可及,投流卷成麻花,于国内尚属方兴未艾的可穿戴硬件或将是字节突出重围的关键。


光子星球获悉,字节AI硬件兼Bot Platform(智能体平台)团队负责人Kayden,曾有过以移动操作系统为代表的基础软硬件创业经历。例如,其创业履历中较为亮眼的一笔,便是通过重写Linux系统驱动层来兼容Android硬件生态并率先产品化。


这不仅代表着Kayden在软硬协同方面拥有从0到1的经验,其还在当时成功踏上了软硬件“国产替代”的浪潮。作为一位连续创业者,Kayden在信创领域有一定资源积累。


这表明,字节对于AI硬件或许有更大的雄心与抱负。


软件与硬件的轮回


泰戈尔说,仅仅站着凝视水面是无法跨越大海的。但横渡大海的人太多,海水也会变红。


在通往AGI的航道上,应用做舟,其中偏重通识的Chat bot是船头,负责具体执行的Agent则是桅杆。各家产品层面差异化不大的情况下,应用的具体落地还分为两种范式:较为主流的是AI原生的独立App,后起之秀则是内置于平台级应用中的插件。


字节豆包所属的前者,于年中时候打响了激烈的用户争夺战。


据AppGrowing统计数据,6月第一周豆包、Kimi、智谱清言和文心一言等大模型的投放素材量大幅上升。其中豆包素材量为26521个,环比增长38.61%;Kimi为14451个,环比增长160.71%;智谱清言为1866个,环比增长2456.16%。


三组数据的数量与增长各异,投流分发的阵地也不相同,但我们不难看出一个明显的走向:原先豆包、Kimi捉对厮杀的战场中,开始涌进新玩家。


如此一来,就算豆包能把持流量的“铁王座”,其背后也付出了不小的代价——多方信源称抖音已扫净家门,仅留豆包一款大模型应用仍在推广。换个角度看,这也是原属于抖音的广告收入,变成了豆包的大模型成本。


投流抢用户仅是应用层竞争的表面,与过去千团大战烧钱补贴的逻辑类似,在用户侧跑马圈地的根本目的在于转化。


遗憾的是,无论AI应用多大手笔的营销,在现阶段看来都像是个无底洞。以百度文心一言为例,其早在去年11月便开启了订阅付收费,直至日前百度2024第二季度财报发布,对于这部分收入的实际规模,仍没有一个定准。


究其原因在于,以Chat Bot为基础的AI应用缺乏粘性,用户用得少,可供转化的用户池也小。拿当下独立大模型应用中堪称“寡头”的豆包来说,Questmobile数据显示,截至2024年3月底,其日活跃用户数达370万,于移动互联网时期的平台级应用而言不过是零头。


须知道,AI应用爆发于我国网民规模触顶的阶段,公开数据显示,2024年6月我国网民规模为10.9967亿人,过去半年时间的增长仅742万人。反观移动互联网方兴未艾之时,2012年底的网民规模为5.64亿人。



自场景角度来看,即使是以agent为抓手,AI应用的转化路径也远远没有团购顺畅。娱乐方向,去年爆火的Character.ai卖身打碎了数字人的付费梦,工具方向,高德手握7亿月活都还在探索商业化落地。


不可忽视的还有一度被独立应用的营销抢夺声量的AI插件。


QuestMobile8月相关研报数据显示,今年6月,支小宝、豆包、文心一言三款App的的用户流量分别为5908万、2752万、1134万。依托支付宝这个Super App的支小宝插件以极低成本触达用户,并快速融入现有业务场景的打法也颇具威胁。


一度更关注C端落地的创业独角兽,开始将更多目光转向to B便是一个明显信号,这意味着应用层上雕花在短期内看不到变现的希望。而素有App工厂之称的字节跳动,目前也填不完AI应用的格子。


而今,AI to C应用陷入商业化困境,硬件与软硬协同的可能重回行业视野。去年下半年的AI硬件潮亦发端于大模型落地遭遇瓶颈的时期,一切仿佛一个轮回。


是通道,更是采集器


随着资本市场的成熟,股权收购成为互联网企业巩固主业话语权或快速切入新兴赛道的不二法门。前者有腾讯遍布全球的游戏投资,而字节跳动布局硬件则相对更倾向于后者。


9月初,字节跳动完成对开放式耳机品牌Oladance(主体公司:深圳大十未来科技有限公司)的收购。据《晚点LatePost》报道,字节的 AI 硬件团队便是以该公司人员为基础,隶属于字节 AI 产品团队 Flow。


互联网巨头收购硬件厂商的路径简单粗暴:寻找相关赛道的优质标的,接手供应链上下游基建与硬件专利。下一步是将此打造成某种意义上的入口,尝试“硬件补贴,软件变现”。端侧AI的付费空间与时下陷入商业化难题的C端助手类AI应用形成了鲜明对照。


AI是个筐,啥都往里装。今年以来,我们已经经历了自应用到智能体的AI落地范式迭代,渴望落地的AI像是一颗三维弹球,这端撞到付费墙后即弹向另一端。


问题是,海外初创公司对可穿戴设备的“迷恋”或更多出自西方人本主义思想,尤其是对“减少屏幕使用时间”的病态式的追求。目前的设计语言中,用户唤醒助手的方式跳不出语音、点触与眼球捕捉,缺少意图识别与情绪理解能力的语音交互在精度上甚至不如文字对话。



因此,我们才能在过去一年内见证了AI Pin、Rabbit 1等昙花一现的产品,都在今年偃旗息鼓。当初高喊“杀死智能手机”的AI Pin母公司Humane,更是成了笑话。有数据显示,从今年5月到8月,AI Pin的退货量比购买量还多。


而今,以GPT-4o为代表的大模型多模态能力突飞猛进,让AI对用户日常生活信息采集的维度与精度有所提升,这为可穿戴设备成为AIGC服务平台提供了根本性前提。


本质上说,AI为人机交互与软硬协同带来的最大变量在于“输入”而非“输出”。硬件作为入口,不仅仅是用户获取服务的通道,更多想象空间在于对用户日常生活中不同角度的信息采集。


字节的老本行,专做人性生意的短视频刚刚走过“七年之痒”,手机对用户信息的采集读取也到了一个瓶颈。正如近期爆火的《黑神话:悟空》中天命人需要找回的大圣六根:眼耳鼻舌身意,其中有五项均来自于我们的大脑,字节的AI硬件版图亦是向“首”展开。


围绕我们信息接收与交互频率最高的眼见、耳听、口说、意图,字节排开了诸如头显、耳机以及眼镜的产品矩阵。在产品语言上,其也避开了过去近10年堪称谁碰谁死的“取代智能手机”的叙事。


字节跳动产品和战略副总裁朱骏亦强调过,拟人化、离用户近与个性化是字节AI Agent的设计原则。耳机、眼镜等智能硬件同为AI落地的载体形式,其发展路径不过是软件侧的平移。


需要指出的是,据谷歌方面测试,其端侧7B规格模型需要至少需要4GB内存才能跑起来。而这些信息的采集、存储、复用亦需要相较Oladance更广的技术栈与供应链深度。


如何避免重蹈此前AI硬件画饼与套壳安卓的覆辙,字节这个体量的选手将迎来整个业界的观望。


审慎,后福


所谓历史总是惊人的相似,指的是历史不会重复,却会押韵。字节战投的过往可以帮助我们了解其AI硬件业务的具体方向。


众所周知,字节曾于2022年初裁撤投资部。在一位投资人看来,除了对外部宏观环境的反应,不可忽视的因素还有其急于流量变现,广撒网而导致的战略失焦与举棋不定。


“找一群IBD出来的,没有产业背景的人来做战投,大概率只是挥霍公司的钱而已。”


Pico的前车之鉴下,我们无法断言AI这轮风口会否重蹈元宇宙的覆辙。不过,假若将本次围绕硬件战略的投资动作与此前字节的数起称不上成功的战略投资对照,我们还是无法忽略一些一脉相承的共性。



入局时机方面,字节初次对Oladance的股权投资发生在AI硬件爆火半年之后,而完成100%收购的时间节点亦在业内快速就智能眼镜这个落地载体达成共识之后。最近的案例是在教培行业已呈内卷态势、宏观环境开始转向时喊出“All in教育”的大力教育,以及国内游戏用户池增长放缓时收购的沐瞳科技。


而今教培K12已是昨日黄花,字节的游戏业务也才度过裁撤、重组与低调重启的波折历程,似乎字节在不少重资产投入的战投赛道上存在一定滞后的问题。


前述投资人提到:“这非常‘互联网’,善于断舍离却钝于下重注。”


如赖以起家的算法一般,找不到确定的PMF,字节通常不会出手。但反过来,经验证的市场中我们能看到字节多次“虽迟但到”,互联网医疗、教育、游戏、问答社区甚至手机硬件,我们都能看到字节在其中填下的格子。


幸运的是,今时不同往日,与AI相关的一切似乎还没有走出方兴未艾的阶段。反而是相对审慎,让字节避开了上一轮AI硬件的泡沫,等来了多模态的东风。


此外,国内某智能硬件生产商也告诉光子星球,相比于其他互联网巨头,字节体系可以为硬件本身提供销售网络、软件生态两个“老大难”。


“总不会像早先一度成为风口的电纸书、录音笔一般,需要折价并通过微商一类末端渠道清理库存”,他说,“豆包本身是移动应用生态内的头部AI产品,转化上相比同质化的初创企业更有量化空间。”


面对AI这个当下最大的共识,字节在to C应用、to B中包括面向中小开发者的扣子、企业开发者的HiAgent以及底层的Marscode均有落子,硬件无疑将成为其全产品布局中,缺失的最后一块拼图。


文章来自于“光子星球”,作者“吴坤谚”。


关键词: AI , 字节AI , 人工智能 , AI应用
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/