最近大家都在聊豆包手机助手。
搭载豆包的努比亚手机,3万台现货全部售罄。

这两天,很多朋友的手机也都到货开始体验了。
但是我感觉,没有谁会比我更悲催了。
我用了差不多两周,是两周前第一批拿到的媒体测试工程机,然后,我上周一发了一个豆包手机助手首发评测,所有的东西,我都觉得很惊艳。

我自己因为设计师职业习惯,一直都是双系统配置,主力机是IOS,还有个备用机是安卓,在拿到豆包手机之后,我觉得我真的很喜欢这个Agent的体验,就冲着豆包手机助手的使用体验,我也觉得,更适合用它来当我的备用机。
于是从省钱角度出发,我就把我之前那个安卓机,给爱回收了,准备以后都用豆包手机来当我的备用机。。。
至此,一切本来都挺好的。
结果,就在上周二,开始出事了。
上周二我正常直播了一下,给大家实机演示了一下豆包手机助手的能力,直播过程都非常顺利,所有的任务全部完成,特别是用微信聊天记录直接在飞书上新建日程日历,完全理解了昨天今天明天,也避开了陷阱,屏幕上也都是豆包牛逼。

直播完以后,我晚上10点多,下班回家路上。
豆包的朋友突然给我发了个飞书消息。

当时我还一脸懵逼。
然后,瞬间心中有了不安的感觉,我就回了一下:“我现在还正常,我让它做个任务试试。”。

结果,这一做,一运行。
好家伙,我的微信直接就崩了。

后面的故事,大家就都知道了。
只要豆包做任何微信任务,直接弹出,限制登录。
随后就是阿里系到来的封禁,支付宝限制调用,淘宝、淘宝闪购、闲鱼三剑客直接更狠,连账号都不让我登了。

然后我本来想用盒马买点东西,结果,特么的连盒马都给我ban了。。。

实在有点绷不住了,我用个豆包手机招谁惹谁了,我在家里wifi是我自己的,支付宝是我自己的,我就怎么登录环节异常了。
我想点个水果都点不了,逼着我用美团。
在各家围堵之后,连浓眉大眼的QQ、高德啥的也都全部加入战场,豆包也只能,自我封禁,自己把自己ban了。

绝大多数涉及到主流APP的任务,几乎全都干不了了。
但凡这台手机要不是我的备用机,但凡我要不是还有个iPhone,我就得尬死在这,因为各大厂家的封禁,已经严重影响我日常正常使用了。
至此,因为用豆包手机最大的受害者出现了。。。
我现在有点后悔当时把我那台安卓手机给爱回收了,现在有点想买回来了。。。
说实话,我觉得豆包这一步,已经走得比较谨慎了,一直强调自己是豆包手机助手,是手机助手,不是豆包手机,希望能跟各大厂商合作,但是还是被干,这是真的没有办法。
毕竟,你要是站在那个大厂的视角想一想,也能理解它们为啥这么敏感。
互联网这三十年,本质上就是一场谁控制入口的战争。
一开始,入口在浏览器,然后就发生了微软捆绑销售用IE把网景干碎了的故事。
后来入口在搜索,大家抢的是搜索框,再后来入口在微信,入口在抖音,入口在各家的超级APP里,谁能把用户关在自己花园里多待十分钟,谁就多赚点钱。
你现在突然来一个东西,叫什么AI手机助手,突然跟所有人说:
都特么别吵了,以后用户只跟我说话,你们都给我在我后面排队,提供好你们的服务就行了,甚至你们连API都不需要给,我会自己用。
城门口原来有好几拨人,各自收一茬税,每个用户进城交一次税,过桥交一次税,上街摆摊交一次税,每拨人都有点油水。
结果有一天来个新官,说以后不许这么乱收了,所有税都打包交给我一个口子,我再按规则分给你们。
你觉得那些原来收过路费的人,会不会先联手把他办了?
晚清有个很有意思的历史,就是晚清的漕运。
当年洋务运动刚搞铁路的时候,经历了三次大辩论,浪费了宝贵的20年,阻力最大的不是那帮迷信风水的老百姓,而是以漕运官员为代表的一整套利益集团。
甚至1881年,中国第一条自建标准轨道运货铁路唐胥铁路建成后,被反对,被诋毁,闹出了铁路不得不以骡马牵引货车运行的笑话,得名“马车铁路”。

因为京杭大运河上养着几十万漕工,这是大清朝的物流大动脉,铁路一旦铺开,运量大、速度快、成本低,传统漕运注定要慢慢被挤死。
所以旧有利益集团,封杀铁路,是不讲道理,但符合逻辑。
现在很多超级APP做的事情,其实就有点像这样。
我举一个特别常见的外卖的例子。
比如说,我今天就想吃一碗和府捞面,这事对我们来说,其实只有两件事重要:
多少钱、多久送到。
但对平台来说,它们希望你最好不仅点这一单,还顺手刷一刷别的东西,看一会儿开屏广告,顺道被种草两件零食,再办一张联名信用卡。
这个链路越长,对他们越有利。
但是,在Agent的世界里,这一长串链路,可能只被压缩成了三句话:
“我想吃和府捞面。”,“你想吃啥口味的?想加小吃吗?”,“确认下单。”
这句话一旦成立,谁送的、从哪送的、用哪个平台送的、平台跟骑手怎么分钱、抽成多少,对我来说全部都变成不可见的后端实现。
中间所有你本来可以被顺手薅一把的地方,全都被你自己的Agent帮你挡掉了。
你只和自己的AI助手有关系,跟平台之间的关系变成:
你们都是来给我干活的。
说的稍微难听一点,过去是我们围着平台转,将来是很有可能,是平台围着一个个AI转。
主体从平台,变成了“人+我们的AI”。
你要是城里的小店,当然开心,反正你本来就没有什么议价权,有人帮你引流就谢天谢地。
但你要是城里最大的百货商场,你一定会反手把人轰出去。
这事对普通用户当然是好事,对很多APP来说,就是生死存亡级别的威胁。
说实话,很多人一直在提的隐私问题,我反而觉得这玩意是最简单的。
因为它有解,而且是物理层面的解。
我们现在手机上的芯片算力是还差点意思,所以得联网跑模型。
但你得信AI时代的摩尔定律啊,只要手机里芯片再迭代两代,视觉推理模型智力再提一提,尺寸再压一压,到时候就一个8B或者9B的端侧小模型在手机上本地跑,所有的隐私都不是啥问题。
这个AI哪怕把你的聊天记录、支付密码背得滚瓜烂熟,它也只在你的本地跑,任何数据连哪怕一个比特都不传出你的手机。
这就是端侧推理的终局。
这就像早年大家害怕刷卡会被盗刷,后来有了芯片卡、动态验证码、风控系统,慢慢也都接受了。
技术的优点就在这里,它的边界清晰,问题能被定义,就总有办法一步一步往前抬。
最难的是利益的再分配,谁愿意从一个手握入口的角色,退化成一个默默提供后端服务的配件呢?
有时候我会想到一个特别粗暴的比喻。
现在所有的超级APP,就像一个个诸侯割据。
每个诸侯都在自己地盘上修城墙、挖护城河、收关税。
你要从这家领地走到那家领地,中间要过城门、查行李、贴标签、盖章。
而今天我们说的这些Agent、这些手机助手,其实想干的事情,就是在各家城头上,修跨城高铁。
对用户来说,你当然希望有个高铁,坐上去睡一觉就到,不用在每个小城门前排队查验。
对这些诸侯来说,问题在于,你一旦有了高铁,谁还会在他城门口住店、一杯茶一杯水地慢慢消磨时间?
这仗能不打吗?
沃尔玛刚扩张的时候,很多主街上的小店确实是死掉了一片。
电商起来之后,一批传统零售确实倒在了路上。
移动互联网崛起之后,很多PC时代的大站,连体面谢幕的机会都没有。
天涯社区、西祠胡同、新浪博客、人人网,那都是一个一个消失在风中的名字。

我们现在看到的,只是这一轮入口之争的序章而已。
只不过,它的名字从搜索vs门户,电商vs商场,移动互联网vsPC。
变成了Agent vs 超级APP。
你要说我乐观吗?
说实话,我还挺乐观的。
因为从技术路线来看,这事根本拦不住。
端侧算力一定会继续提升,视觉模型一定会继续压缩,系统级的能力一定会越来越多。
你今天封它一次,它明天就会以另外一种方式回来,可能是另外一个品牌,另外一套交互形态,甚至可能是你最熟悉的那个APP自己做出来的AI助手。
你要说我悲观吗?
我也有点悲观的。
悲观的不是技术会不会来,而是我并不知道,它来的时候,到底会以谁的面目出现。
那对我们普通人来说,到底该怎么选?
短期内,我想说,有一个很现实的原则是:
别把自己所有命脉全押给一个还在幼儿园阶段的Agent。你可以把它当作一个特别聪明的学徒,可以让他去帮你处理一些非敏感的事,在端侧模型真正到来的那一天,不要傻乎乎的把什么敏感信息都交给AI来做。
但从长期来看,我反而会建议大家多去试一试。
正是因为现在生态还很拉扯,我们才更有机会参与塑造这个东西,而不是等到某一天,它以一个已经定型的样子降临到我们头上。
技术史里我一直觉得,有个非常残酷的规律。
就是新的秩序刚诞生时,所有参与者都很狼狈,很痛,很混乱。
但等秩序稳定下来之后,绝大部分人的命运,已经被那一代幸存者写在系统里了。
所以我自己现在的状态就是,一边当小白鼠,一边当旁观者,一边以博主的身份当记录者。
也许两年之后,我们再回头看今天的豆包手机,会觉得它很有意思,那时候的AI,居然是这么个方式玩的,就像现在看十年前的智能机一样。
但那不重要。
我现在手机里的豆包,暂时是个半残废状态。
但我知道,这只是一个时代开始时小小的插曲。
但从另一个角度讲,我也算是提前过了一小把Agent时代的瘾。
用这有趣的经历,亲眼看到了我希望到来的未来。
剩下的,就看这个时代。
到底会不会。
配得上我们所期待的盛夏。
文章来自于“数字生命卡兹克”,作者 “卡兹克”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales