就在刚刚,国产手机AI Agent竟抢先苹果落地了!而且,还是行业中首个跨应用开放生态智能体。
LLM的浪潮火热一年,应用落地的锚点究竟在哪里?
在业内不少有识之士看来,AI时代的终局,是得AI Agent者得天下。
当今社会,最可能破局的终端在哪里?毫无疑问,就是在全世界拥有海量用户的手机。
一旦这个路径被打通,AI将不再是个别圈子里的游戏,而是让全人类都能感受到的信息革命大冲击。
而就在刚刚,这条消息一经发布,就震撼了圈里所有玩家——
IFA 2024上,荣耀CEO赵明面向全球,发布了行业首个跨应用开放生态智能体。
同时官宣:荣耀AI Agent将在下一代旗舰荣耀Magic7系列上落地商用。
果然,端侧AI大模型的纷纷落地,终于炸出了行业首款真正意义上的智能体AI手机。
而与此同时,所有人心底共同的感受恐怕是:我们的国产手机,居然跑赢了苹果?
是的,发布首款AI Agent手机的,不是苹果,而是荣耀。
不仅如此,这一次,荣耀要让AI Agent不仅可以调用终端系统的自带服务,还会开放所有与第三方服务的合作。
这个行业首个开放生态下的跨应用智能体,将用开放对抗封闭,打破苹果一家独大!
AI Agent手机,智能到了什么程度
话不多说,让我们身临其境体验一下,AI Agent在智能化、自动化上,给我们的一点小小震撼。
仔细看Demo,已经超越了我们最大胆的想象。
比如,让很多人深恶痛绝的自动续费,要关闭起来往往是相当困难。
但有了荣耀AI智能体,这个用户痛点就可以一键击破了!最重要的是,人类全程几乎解放了双手。
话不多说,下面就来看看荣耀的AI Agent是如何帮我们一键关闭自动续费的。
首先第一关,就是那个老大难问题:究竟是哪个「倒霉」的应用在扣我的钱?
只要通过「Magic Actions魔法指令」激活智能体,我们就可以直接让它帮我们检查了。
收到用户需求后,它会自动跳转到微信和支付宝,帮我们检查所有应用的自动续费。
AI Agent行云流水般在微信和支付宝中来回穿梭,成功找出了「罪魁祸首」。
查询完毕后,AI Agent会将查询结果自动呈上。
注意,当涉及到取消自动续费这类重要决策时,AI Agent会把决定权归还用户,此时我们必须手动进行确认,才能最终取消。
当你选择了要取消的「音乐会员包月」服务后,主动权再次交由Agent,只需静待它关闭扣费服务,就可以了。
是的,这就是真正的智能化,在手机中现实可感的样子。
这个过程也让我们深刻地感受到:比起仅仅是在网络上的AI应用,当AI从操作系统的底层重构服务逻辑、流程和资源分配,终端的AI落地带来的体验,是多么具有颠覆性。
大模型热持续了一年多,AI Agent加速涌向移动终端,我们终于看到了,AI终端智能体落地最理想的范式。
智能手机行业,正式迈入更波澜壮阔的智能体时代。而荣耀抢先苹果落地AI Agent,也代表着中国AI,正加速走向世界前沿。
苹果虽强,但并没有做出真·AI手机
接下来,到了解答所有人心底疑问的时候了——
为什么做出第一个AI Agent手机的不是苹果?
AI Agent和手机端侧的结合,意味着众多底层逻辑的彻底重构。
如此有技术想象力的事,似乎怎么想都应该是站在浪潮前头的苹果拔得头筹。
的确,在不久前的苹果开发者大会,苹果推出Apple Intelligence,宣布将AI与iOS系统进行深度融合。
英雄所见略同,苹果的战略路径,其实与荣耀四层AI框架的系统层和单机层不谋而合——
荣耀CEO赵明对此曾有过一针见血的评价:生成式AI手机≠AI手机。
仅仅在设备上开放接口运行LLM、在应用中提供AI相关的技术和体验,这属于上面荣耀四层AI架构中所说的应用层AI。
但AI手机远远不止于此。
AI手机,意味着要用AI重构底层的硬件和操作系统,从用户体验到业务逻辑的方方面面都需要有所变革。
「AI是根基,在手机上无处不在,才能叫AI手机。」
到了这里,我们能清楚地看出:无论是荣耀还是苹果,二者都强调了AI之于手机鞭辟入里的重要性。
AI绝不能仅仅停留在单一应用、单一服务的表层,而是要深入系统架构,用AI打通全局。
至此,可以看出,荣耀与苹果对于端侧AI的布局思路,是大致相似、旗鼓相当的。
但如今却把苹果甩到了身后,荣耀靠的是什么?
总结来说,一是速度,二是开放。
仅剩4天时间,苹果秋季新品发布在即,iPhone 16系列被寄予厚望,外界猜测其将以首个集成苹果AI Agent的智能手机问世。
其实,作为这届发布会重头戏的苹果AI,我们早在6月WWDC开发者大会上一领其风采。
苹果AI加持下的Siri,彻底改头换面,几乎自由穿梭在系统应用当中,任凭我们调遣。
它不仅可以跨APP操作,还能借用ChatGPT等AI工具,完成操作。
比如,当你忘记资料是在邮件、信息、还是共享备忘录中,召唤Siri一键解决。又或者命令Siri,从相册中找到想要修图的一张照片,等等。
虽然苹果并未直言,但业界一致认为,Apple Intelligence的推出就是为了打造「手机AI智能体」。
然而,彭博Gurman此前报道称,搭载最新iOS 18系统的iPhone 16,其中大部分AI能力还得等到年底,有的甚至2025年才能用上。
比如,ChatGPT集成、图像/Emoji生成、照片自动清理、具有屏幕感知的超强Siri。
更不用说,苹果AI在全球全面上线,还将需要数年的时间。
也就是说,iPhone 16可能只是一款「准AI手机」。
回看这场「赛跑」的胜利者——荣耀,其结局早在八年前就已经埋下了伏笔。那时,二者的战略执行方式,就已经出现了差异。
是的,当苹果决定面向AI之路做出改变的时候,在这条路上,荣耀已经提前奔跑了八年。
自2016年起,这家头部厂商率先着手发力AI领域,探索端侧AI技术创新的无人区,开启了手机「智慧之门」。
随着Magic一代概念机发布,他们在业内首次提出手机AI概念。
两年后,Magic二代出世,引入了具备自进化、自学习的智慧生命体YOYO,便将CV、NLP、ML、决策和推荐系统等AI能力,集于一身。
2022年,荣耀再次在业界开创性提出,用平台级AI从底层构建OS理念,并不断深耕。
到了年底,AI使能的个人化全场景操作系统MagicOS 7.0诞生,将AI能力深度融入用户日常使用的场景。
去年6月,荣耀再次领衔行业,提出将AI大模型引入端侧的创新理念。
半年后,加载端侧大模型荣耀魔法大模型的自研操作系统MagicOS 8.0发布,行业首发平台级AI使能的意图识别人机交互,定义了智能终端交互新范式。
通过识别人的意图,AI可以精准完成交互,提前预判了你的预判。
时间再拉回到今日,随着大模型的发展,荣耀的MagicOS操作系统也随之进化,平滑过渡到智能体架构。
AI Agent率先在手机上实现全面落地,是荣耀依托战略深耕跑出的加速度,也代表着中国AI创新速度正走向世界前沿。
它再次实现了端侧AI的创新叠加效应,和用户体验增值,继续引领「服务找人」的业态趋势。
另一方面,对于苹果AI Agent「围墙花园」封闭生态的做法,荣耀并不认同。
苹果AI进展缓慢,难以大规模铺开,究其根本在于一直以来商业模式的核心——打造封闭的产品生态。
不论是终端硬件、芯片,还是iOS闭环生态,苹果已经习惯「主导」,不希望授人以渔。
相信苹果用户都有这样的感受——除非入手苹果全家桶,否则就要面对iOS和Windows、安卓和其他IoT设备间的巨大壁垒。
多年来,我们也切切实实看到了,苹果成功打造出一个利润丰厚的商业模式。
这种模式不仅在iPhone、Mac等硬件销售上取得成功,更在软件开发领域创造了持续增长的收入流。
这个让他们引以为傲的生态闭环,苹果显然不会放弃。
然而,在AI大模型时代,这种「封闭」战略面临着极大的挑战。
小扎曾在Llama 3.1-405B发布的公开信中,直接点名苹果的封闭模式。随后的采访中,他表示,「随着时间发展,封闭系统会逐渐被各种力量推向极限,它们并不总是胜利者」。
没错,真正走向开放生态的,才是时代潮流所向。
随着AI应用逐渐落地到各种场景、各类设备,如何进行跨操作系统、跨终端的操作,显得越发重要。
荣耀最先迈出了这一步。
相较于封锁在围墙花园中的苹果AI,荣耀选择用「开放」来对抗「封闭」。
不论是底层、第三方应用,还是在大模型上,他们一直坚持开放、合作、贡献的价值理念。
今年年初,荣耀发布自研70亿参数端侧AI「魔法大模型」,并启动了「百模生态计划」,就是为了要构筑行业首个大模型中控开放架构。
开发者们可以调用模型,携手打造云端协同的服务新生态,凝聚中国力量,实现创新。
不仅如此,针对智慧出行、智慧办公、智能家居、运动健康、影音娱乐多种场景,荣耀正在与各类大模型建立安全高效的连接。
第三方应用,比如高德地图、航旅纵横,能够在手机上与魔法大模型进行联动。
此外,荣耀还与全球AI科技巨头合作,共同推动平台级AI的发展。
荣耀CEO赵明现场表示,「荣耀AI Agent不仅能够调用我们系统自带的服务,还面向所有第三方服务开放合作」。
AI Agent通过精准理解需求,并做出及时响应,执行、调取手机各类资源与三方服务,为每个人提供个性化方案。
不论是系统原生的,还是第三方应用,都可享AI加持的服务。
荣耀AI Agent,为什么代表着未来
荣耀AI Agent能够引领前沿,因为它走向了端侧AI的第三极。
广泛地来说,业界将AI手机的发展,划分为三大阶段——AI APP化、功能化、原生化。
ChatGPT、Claude、Perlexity等独立第三方APP的出现,代表了APP化第一阶段。
这些应用通过集成LLM/调用API,最后搭载到手机上,主要计算处理都在云端,用户通过APP界面实现与LLM交流互动。
随着三星、谷歌等国内外厂商推出AI手机,也就到了第二阶段。
这时,最大的特点便是,大模型逐渐融入OS,将AI能力逐渐赋能日常应用,所谓的手机Agent雏形已然显现。
比如,年初三星Galaxy S24系列手机,画个圈搜索、电话摘要、AI图像消除功能,都具备了典型AI功能化特征。
而现在,在AI手机的整体思路上,各家都趋于一致,不再强调AI应用呈现,而是将深度集成到操作系统当中。
将AI能力,具体落地到手机的应用场景中,让其无处不在。
第三阶段,就完成了AI本地化、原生化实质性的跨越——AI手机不再局限于一个应用,而是上升到「系统级AI」、「平台级AI」。
这一刻,AI完全重构人机交互方式,用户通过自然语言发出指令,智能体便可理解意图。
关键,它还能为你代劳任何事,比如一键点饮品、一键旅行规划、订票等等。
手机端侧成为了真正的智能体,AI深度融合在手机原生生态服务中。
正如OpenAI在发布GPT-4o时宣称的,在AI时代,我们必须要向着更自然的人机交互迈进。
不仅是文本,对于语音、图像、视频等多种模态,我们都需要找到更自然、更符合人类习惯的交互方式。
要实现这个目标,仅靠软件和模型层面的创新显然是不够的,绕不开的一步,就是对操作系统进行重构。
荣耀推出的自研操作系统MagicOS 8.0,就在人机交互方面做出了重大创新。
MagicOS 8.0创造了行业首个基于意图识别的人机交互新范式(Intent-based UI,简称IUI)。
最为根本的改变是,IUI颠覆了原有的「操作-反馈」模式——将「人理解设备」变为「设备理解人」。
用户只需要通过简单的提示词来表达意图,操作系统就能心照不宣地完成任务,无需原来一步接着一步的繁琐操作流程。
有了更自然、更懂用户的交互方式,才能最大限度发挥AI Agent的能力,让它真正协助到我们生活的方方面面。
然而,许多人都有这样的担心:手机中无处不在的AI Agent,会不会造成隐私泄露?我们的个人信息还安全吗?
实际上,用户隐私和产品性能之间如何权衡,对于所有公司来说都是一个两难问题。
收集更多数据、在云端部署模型,意味着更多算力、更强的智能,有知识储备和推理能力方面的优势,但会严重威胁到用户的个人信息安全。
苹果采用的隐私保护策略,是在终端部署模型,但每一次需要接入ChatGPT时,都发送通知让用户进行确认,拉低了沟通效率和使用体验。
相比之下,荣耀团队给出了更加完美的解决方案。
CEO赵明表示,荣耀大模型在云上的初始训练只利用了通用数据;而在训练完成后,将会完全部署在用户终端上。
相比云侧模型,端侧AI可以针对用户个人数据进行训练,实时感知、随时计算,能带来更加个性化的智能服务。
此外,部署在端侧的平台级AI还发挥着中控的作用。
如果需要调用云侧模型来处理任务,则会通过端侧防护网滤掉用户隐私,确保信息不上云,让个人数据库真正属于用户。
这种「数据不出端」的做法,既守护了隐私安全,又同时利用了云侧和端侧大模型的优势,而且保证用户与AI之间便捷高效的交互。
除了数据方面,荣耀的AI Agent在执行过程中也十分注重安全机制,通过可视化、随时中断、接管机制等方法打造安全可靠的交互体验。
比如在「一键关闭自动续费」的功能中,界面上会出现视觉动效来提示用户AI Agent已启动;确认用户需求后,全程每一步骤的操作都会提示用户并告知状态。
在整个工作流中,用户可以随时打断Agent,或直接由自己接管下一步操作。
如果涉及取消自动续费等重要操作,Agent也不会「自作主张」,而是交由用户手动确认、全权决定。
无论是出于技术和行业生态的原因,还是出于安全伦理和隐私合规方面的思考,我们都可以感受到,荣耀在人机交互的设计上,充分考虑了信任感、掌控感,让用户安全感爆棚。
如今,手机智能体代表着全新的超级入口。
智能体能够敏锐感知世界,了解用户与环境复杂信息,还具备了强大的自学习、自进化能力。
未来,这样的智能体无处不在,随时召之即来。
它可以是你的办公助手、生活助理、娱乐达人,出行专家.....,只要是你所想,即可拥有专属定制的AI角色。
当工作忙得不可开交时,收发邮件、整理文件、安排日程这类事务,AI Agent完全可以代劳。
它还可以是你的生活助理,推荐美食、娱乐活动,给出旅行规划建议。
而且它还可以查询资料、制定学习计划、答疑解问,成为学生们的帮手。
试问,这样的AI Agent,谁不想要呢?
文章来源“新智元”,作者“新智元”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0