厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑
6750点击    2025-08-20 17:27

就在刚刚,全球首个手机通用Agent,来了!


现在,假如你正在开会,但只需要给手机打一句话,就能让它“自己动起来”,给你点外卖:


帮我在美团外卖上,找最近的瑞幸咖啡,点一杯大杯的冰美式。


厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑


可以看到,AI在接收到任务的一瞬间,就开始“嗖嗖”地执行起了任务。


它会直接接管你的手机,不需要在各种APP之间跳来跳去,就可以把点外卖的活儿给干完。


嗯,非常直观的感受就是:够方便,够智能。


那么这个Agent到底是什么来头?


它就是智谱刚刚发布的全球第一个手机通用Agent,就好比把Manus的能力搬到了手机一样。


划个重点:免费,人人可用!


厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑


或许这时候有小伙伴要说了,让手机自己动的Agent不是已经有了嘛?


非也非也,这次真的有点不太一样。


因为智谱的这个Agent,所有任务都是在云端执行,也就是相当于给你的设备安了个云手机或云电脑,不仅任务执行得流畅,更不影响你使用其它APP!


更重要的是,这也是全球第一个大众消费级的Agent,不只手机(安卓、iOS均可),甚至可以操控云电脑帮你干活哦~


或许,这是你真正免费接触、感受Agent的最佳时刻。


还能做什么?


我们先简单介绍一下AutoGLM的操作方式。


在进入APP之后,可以看到有两个大类别的任务可选,一个是“生活助手”,另一个是“办公助手”。


厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑


以生活助手为例,点进来后是一个正常跟AI对话的窗口,但我们需要先点击右上角的“手机”


厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑


然后我们再点击底部的“接管手机”,就来到了之前我们提到的“云端智能手机”界面了:


厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑


在这里,我们可以像操作正常手机一样,进入到任务可能需要的APP里,登录并设置咱们自己的账号等。


设置完毕后,我们就让它auto起来了,这一次,我们来个复杂一点的任务:


我要买一个200块钱左右的保温杯,帮我在淘宝、京东和拼多多上比一下货。


厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑


可以看到,对于“货比三家”这样繁琐的任务,AutoGLM都可以“嗖嗖”地自主跨APP且精准地执行。


而我们所要做的,就是“发起任务→静候结果”即可。


除了这些日常生活中能用到的功能之外,AutoGLM还特别擅长把工作、学习场景中的任务给auto起来。


而且不同于现在PC网页端的Agent,AutoGLM是直接在手机里调用一台云电脑给你干活!


我们先切换到“办公助手”这个模式,界面是这样的:


厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑


可以看到,在输入栏的上方,便很方便地展示了“AI视频”、“AI PPT”、“AI 网页”等功能的入口。


这一次,我们先小试牛刀,让AutoGLM生成一份关于Agent的调研报告:


帮我生成一份关于Agent的调研报告。


厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑


同样的,我们无需做任何操作,就能看到AutoGLM自己用“云电脑”搜集、整理资料,在静候几分钟之后,一份基于近100份参考源、数千字的报告就水灵灵地出来了:


厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑


进一步的,我们可以要求AutoGLM把文字的结果做成一份PPT:


把这个报告做成一个精美的PPT。


厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑


不得不说,原先需要我们耗时起码一天的工作,到了AutoGLM这里,真的仅仅需要几分钟的时间。


怎么做到的?


以上种种实测不难看出,相比传统聊天机器人只会“告诉你怎么做”,AutoGLM已经进化到“直接帮你做”


而且最重要的一点是,它几乎不占用本地资源。


厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑


添加图片注释,不超过 140 字(可选)


这也是本次AutoGLM的关键升级之处——为每位用户准备了一台云手机和一台云电脑,类似于云端备用机(里面提前装好了一堆APP)。


厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑


有了这个东西,用户无需安装任何应用、无需额外连接,就能直接调动AutoGLM执行各种任务;而且,AutoGLM干活时不会影响用户正常使用自己的设备,二者互不干扰。


更妙的是,一些不常用但不得不装的应用,也可以直接放到云端备用机中,从而释放更多本地存储,让设备运行更流畅。


总而言之,AutoGLM之所以能在手机、PC等设备上流畅运行,背后实打实离不开云端执行这一底层设计。


从更广的视角来看,“云端执行”不仅精准击中了行业痛点,还顺应了当下正在兴起的一股趋势。


今年以来,Agent的火爆有目共睹,但一到落地环节大家就开始集体头疼:


第一,本地设备算力有限,普通手机电脑根本无法支撑高并发、高算力需求的Agent任务。换句话说,偶尔跑跑简单任务还行,一遇到复杂任务就容易“宕机”。


第二,即便是执行一些简单任务,Agent在运行时也会持续占用本地CPU、内存甚至操作权限,严重影响用户正常使用自己的设备,体验感差。


而“云端执行”恰好对症下药——既不占用本地资源,也不干扰用户对真实设备的操作。


正因如此,目前已经能看到有越来越多的行业玩家开始布局云端Agent。


例如互联网大厂这边,阿里云就在世界人工智能大会论坛上推出了专为智能体打造的“超级大脑”——无影AgentBay,以云端电脑形态执行各项任务。


另外,PPIO等云厂商也推出了“Agent沙箱”等产品,为Agent提供专门的云端运行环境。


这些动作都说明,行业内部已经认识到云端执行对于Agent发展的重要性,并开始积极投入资源进行布局。


而智谱此次推出的AutoGLM,正是依托这一设计,从只能跑跑简单任务的初级Agent中脱颖而出,切实融入了普通人的工作与生活中。


万物皆可AutoGLM


与此同时,AutoGLM并不局限于手机和电脑,还能被集成到更多载体中——


如智能音箱、车载系统甚至毛绒玩具里,主打一个“万物皆可AutoGLM”。


为实现其广泛应用,智谱即日起还上线了移动端API申请通道及「AutoGLM开发者生态共建计划」,通过开放API将AutoGLM的能力赋能给更多开发者的智能产品。


厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑


显而易见,智谱在AutoGLM上的布局,有着自己的节奏和长远考量。


从成立的第一天起,这家公司就将通用人工智能(AGI)作为追求目标,并在后续提出了“让机器像人一样思考”的愿景。


围绕这一目标,智谱规划了L1-L5的AGI路线图:从预训练大模型,到对齐推理、自我学习、自我认知,直至最终的意识智能,一步步循序推进。


而AutoGLM,正是智谱通往L3“自主学习智能体”的关键一步——通过将Agent能力带给更广泛的普通用户,不仅验证了当前技术的可行性,还能在真实应用中不断积累经验与反馈,推动模型自主学习。


这种自我学习能力,使机器能够突破单纯依赖历史数据获取知识的局限,在与用户和环境的持续交互中发现新知识、总结新方法,并反过来提升自身能力,形成技术与应用的正向飞轮。


一旦这个飞轮持续运转,自然也能进一步夯实智谱在Agent领域的领先位置。


而且这一次有个比较新的变化是,和GPT-5类似,AutoGLM也实现了能力“大一统”——


背靠智谱最新开源SOTA语言模型GLM-4.5与视觉推理模型GLM-4.5V(纯国产Agent),首次将推理、非推理、编码、研究、Agentic、GUI Agent等能力整合进一个模型。


这也代表着智谱对AGI的早期理解:


具备通用完整的多模态和思维能力的模型是通向AGI的一个重要里程碑,AutoGLM是其对AGI的又一阶段性探索成果。


另外从行业角度来看,AutoGLM更重要的意义或许在于,它用真实产品验证了“云端执行”这一路线的可行性与可靠性。


不过有一说一,AutoGLM在给行业提供新解法的同时,也为本就竞争激烈的Agent赛道再添一把火。


因为Agent发展到现在这个阶段,拼的已经不只是能否完成任务,而是能否从简单的执行者,升级为能够处理更复杂场景、更稳妥应对不确定性的“全能型选手”。


当然,抛开厂商们之间的“腥风血雨”,对普通用户而言,AutoGLM这一新工具无疑正在真实改变我们和机器之间进行交互的方式——


手中的大模型不再只是“会聊天”,而是能直接操作系统,真正帮忙完成任务。


更进一步,智谱还提出了从Agent迈向AGI应始终追求的3A原则


  • Around-the-clock(全时):24小时待命与持续执行,在用户睡觉/离开/设备黑屏时仍可运行与产出。


  • Autonomy without interference(自运转、零干扰):Agent在云端设备运行,不占用用户屏幕/算力。


  • Affinity(全域连接):跳出浏览器对话框,连接手机、电脑、手表、眼镜、PIN、家电等多种设备与服务,覆盖数字与物理世界。


可以预见,随着技术的持续迭代与生态的不断丰富,“问一句,剩下全交给Agent”的时代离我们真的不远了。


传送门:


开发者生态共建计划:https://autoglm.zhipuai.cn/misc/developer-apply


文章来自于微信公众号“量子位”,作者是“金磊,一水”。


AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md