ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
八年磨一剑,国产首款AI Agent手机跑赢苹果!手机学会「自动驾驶」秀翻全场
3659点击    2024-09-07 11:36

就在刚刚,国产手机AI Agent竟抢先苹果落地了!而且,还是行业中首个跨应用开放生态智能体。


LLM的浪潮火热一年,应用落地的锚点究竟在哪里?


在业内不少有识之士看来,AI时代的终局,是得AI Agent者得天下。


当今社会,最可能破局的终端在哪里?毫无疑问,就是在全世界拥有海量用户的手机。


一旦这个路径被打通,AI将不再是个别圈子里的游戏,而是让全人类都能感受到的信息革命大冲击。


而就在刚刚,这条消息一经发布,就震撼了圈里所有玩家——


IFA 2024上,荣耀CEO赵明面向全球,发布了行业首个跨应用开放生态智能体。


同时官宣:荣耀AI Agent将在下一代旗舰荣耀Magic7系列上落地商用。



果然,端侧AI大模型的纷纷落地,终于炸出了行业首款真正意义上的智能体AI手机。


而与此同时,所有人心底共同的感受恐怕是:我们的国产手机,居然跑赢了苹果?


是的,发布首款AI Agent手机的,不是苹果,而是荣耀。


不仅如此,这一次,荣耀要让AI Agent不仅可以调用终端系统的自带服务,还会开放所有与第三方服务的合作。


这个行业首个开放生态下的跨应用智能体,将用开放对抗封闭,打破苹果一家独大!


AI Agent手机,智能到了什么程度


话不多说,让我们身临其境体验一下,AI Agent在智能化、自动化上,给我们的一点小小震撼。


仔细看Demo,已经超越了我们最大胆的想象。


比如,让很多人深恶痛绝的自动续费,要关闭起来往往是相当困难。


但有了荣耀AI智能体,这个用户痛点就可以一键击破了!最重要的是,人类全程几乎解放了双手。


话不多说,下面就来看看荣耀的AI Agent是如何帮我们一键关闭自动续费的。


首先第一关,就是那个老大难问题:究竟是哪个「倒霉」的应用在扣我的钱?


只要通过「Magic Actions魔法指令」激活智能体,我们就可以直接让它帮我们检查了。


收到用户需求后,它会自动跳转到微信和支付宝,帮我们检查所有应用的自动续费。



AI Agent行云流水般在微信和支付宝中来回穿梭,成功找出了「罪魁祸首」。



查询完毕后,AI Agent会将查询结果自动呈上。



注意,当涉及到取消自动续费这类重要决策时,AI Agent会把决定权归还用户,此时我们必须手动进行确认,才能最终取消。


当你选择了要取消的「音乐会员包月」服务后,主动权再次交由Agent,只需静待它关闭扣费服务,就可以了。



是的,这就是真正的智能化,在手机中现实可感的样子。


这个过程也让我们深刻地感受到:比起仅仅是在网络上的AI应用,当AI从操作系统的底层重构服务逻辑、流程和资源分配,终端的AI落地带来的体验,是多么具有颠覆性。


大模型热持续了一年多,AI Agent加速涌向移动终端,我们终于看到了,AI终端智能体落地最理想的范式。


智能手机行业,正式迈入更波澜壮阔的智能体时代。而荣耀抢先苹果落地AI Agent,也代表着中国AI,正加速走向世界前沿。



苹果虽强,但并没有做出真·AI手机


接下来,到了解答所有人心底疑问的时候了——


为什么做出第一个AI Agent手机的不是苹果?


AI Agent和手机端侧的结合,意味着众多底层逻辑的彻底重构。


如此有技术想象力的事,似乎怎么想都应该是站在浪潮前头的苹果拔得头筹。


的确,在不久前的苹果开发者大会,苹果推出Apple Intelligence,宣布将AI与iOS系统进行深度融合。


英雄所见略同,苹果的战略路径,其实与荣耀四层AI框架的系统层和单机层不谋而合——


  • 系统层,使AI能够跨操作系统、跨终端设备,实现无缝连接和数据共享


  • 单机层:重构操作系统,打造平台级AI,提供真正理解用户需求的终端


  • 应用层:关注AI在端侧的应用,将大模型的能力拆解到各类具体的应用场景中


  • 网络层:借助云端模型的力量,在端侧AI的基础上实现端云协同



荣耀CEO赵明对此曾有过一针见血的评价:生成式AI手机≠AI手机。


仅仅在设备上开放接口运行LLM、在应用中提供AI相关的技术和体验,这属于上面荣耀四层AI架构中所说的应用层AI。


但AI手机远远不止于此。


AI手机,意味着要用AI重构底层的硬件和操作系统,从用户体验到业务逻辑的方方面面都需要有所变革。


「AI是根基,在手机上无处不在,才能叫AI手机。」



到了这里,我们能清楚地看出:无论是荣耀还是苹果,二者都强调了AI之于手机鞭辟入里的重要性。


AI绝不能仅仅停留在单一应用、单一服务的表层,而是要深入系统架构,用AI打通全局。


至此,可以看出,荣耀与苹果对于端侧AI的布局思路,是大致相似、旗鼓相当的。


但如今却把苹果甩到了身后,荣耀靠的是什么?


总结来说,一是速度,二是开放。


8年蛰伏,终成端侧AI领头羊


仅剩4天时间,苹果秋季新品发布在即,iPhone 16系列被寄予厚望,外界猜测其将以首个集成苹果AI Agent的智能手机问世。


其实,作为这届发布会重头戏的苹果AI,我们早在6月WWDC开发者大会上一领其风采。


苹果AI加持下的Siri,彻底改头换面,几乎自由穿梭在系统应用当中,任凭我们调遣。



它不仅可以跨APP操作,还能借用ChatGPT等AI工具,完成操作。


比如,当你忘记资料是在邮件、信息、还是共享备忘录中,召唤Siri一键解决。又或者命令Siri,从相册中找到想要修图的一张照片,等等。


虽然苹果并未直言,但业界一致认为,Apple Intelligence的推出就是为了打造「手机AI智能体」。


然而,彭博Gurman此前报道称,搭载最新iOS 18系统的iPhone 16,其中大部分AI能力还得等到年底,有的甚至2025年才能用上。


比如,ChatGPT集成、图像/Emoji生成、照片自动清理、具有屏幕感知的超强Siri。


更不用说,苹果AI在全球全面上线,还将需要数年的时间。


也就是说,iPhone 16可能只是一款「准AI手机」。



回看这场「赛跑」的胜利者——荣耀,其结局早在八年前就已经埋下了伏笔。那时,二者的战略执行方式,就已经出现了差异。


是的,当苹果决定面向AI之路做出改变的时候,在这条路上,荣耀已经提前奔跑了八年。


自2016年起,这家头部厂商率先着手发力AI领域,探索端侧AI技术创新的无人区,开启了手机「智慧之门」。


随着Magic一代概念机发布,他们在业内首次提出手机AI概念。


两年后,Magic二代出世,引入了具备自进化、自学习的智慧生命体YOYO,便将CV、NLP、ML、决策和推荐系统等AI能力,集于一身。


2022年,荣耀再次在业界开创性提出,用平台级AI从底层构建OS理念,并不断深耕。


到了年底,AI使能的个人化全场景操作系统MagicOS 7.0诞生,将AI能力深度融入用户日常使用的场景。


去年6月,荣耀再次领衔行业,提出将AI大模型引入端侧的创新理念。


半年后,加载端侧大模型荣耀魔法大模型的自研操作系统MagicOS 8.0发布,行业首发平台级AI使能的意图识别人机交互,定义了智能终端交互新范式。


通过识别人的意图,AI可以精准完成交互,提前预判了你的预判。



时间再拉回到今日,随着大模型的发展,荣耀的MagicOS操作系统也随之进化,平滑过渡到智能体架构。


AI Agent率先在手机上实现全面落地,是荣耀依托战略深耕跑出的加速度,也代表着中国AI创新速度正走向世界前沿。


它再次实现了端侧AI的创新叠加效应,和用户体验增值,继续引领「服务找人」的业态趋势。


用「开放」对抗「封闭」


另一方面,对于苹果AI Agent「围墙花园」封闭生态的做法,荣耀并不认同。


苹果AI进展缓慢,难以大规模铺开,究其根本在于一直以来商业模式的核心——打造封闭的产品生态。


不论是终端硬件、芯片,还是iOS闭环生态,苹果已经习惯「主导」,不希望授人以渔。


相信苹果用户都有这样的感受——除非入手苹果全家桶,否则就要面对iOS和Windows、安卓和其他IoT设备间的巨大壁垒。


多年来,我们也切切实实看到了,苹果成功打造出一个利润丰厚的商业模式。


这种模式不仅在iPhone、Mac等硬件销售上取得成功,更在软件开发领域创造了持续增长的收入流。


这个让他们引以为傲的生态闭环,苹果显然不会放弃。


然而,在AI大模型时代,这种「封闭」战略面临着极大的挑战。


小扎曾在Llama 3.1-405B发布的公开信中,直接点名苹果的封闭模式。随后的采访中,他表示,「随着时间发展,封闭系统会逐渐被各种力量推向极限,它们并不总是胜利者」。



没错,真正走向开放生态的,才是时代潮流所向。


随着AI应用逐渐落地到各种场景、各类设备,如何进行跨操作系统、跨终端的操作,显得越发重要。


荣耀最先迈出了这一步。


相较于封锁在围墙花园中的苹果AI,荣耀选择用「开放」来对抗「封闭」。


不论是底层、第三方应用,还是在大模型上,他们一直坚持开放、合作、贡献的价值理念。


今年年初,荣耀发布自研70亿参数端侧AI「魔法大模型」,并启动了「百模生态计划」,就是为了要构筑行业首个大模型中控开放架构。


开发者们可以调用模型,携手打造云端协同的服务新生态,凝聚中国力量,实现创新。


不仅如此,针对智慧出行、智慧办公、智能家居、运动健康、影音娱乐多种场景,荣耀正在与各类大模型建立安全高效的连接。



第三方应用,比如高德地图、航旅纵横,能够在手机上与魔法大模型进行联动。


此外,荣耀还与全球AI科技巨头合作,共同推动平台级AI的发展。



荣耀CEO赵明现场表示,「荣耀AI Agent不仅能够调用我们系统自带的服务,还面向所有第三方服务开放合作」。


AI Agent通过精准理解需求,并做出及时响应,执行、调取手机各类资源与三方服务,为每个人提供个性化方案。


不论是系统原生的,还是第三方应用,都可享AI加持的服务。


荣耀AI Agent,为什么代表着未来


荣耀AI Agent能够引领前沿,因为它走向了端侧AI的第三极。


广泛地来说,业界将AI手机的发展,划分为三大阶段——AI APP化、功能化、原生化。


ChatGPT、Claude、Perlexity等独立第三方APP的出现,代表了APP化第一阶段。


这些应用通过集成LLM/调用API,最后搭载到手机上,主要计算处理都在云端,用户通过APP界面实现与LLM交流互动。


随着三星、谷歌等国内外厂商推出AI手机,也就到了第二阶段。


这时,最大的特点便是,大模型逐渐融入OS,将AI能力逐渐赋能日常应用,所谓的手机Agent雏形已然显现。


比如,年初三星Galaxy S24系列手机,画个圈搜索、电话摘要、AI图像消除功能,都具备了典型AI功能化特征。



而现在,在AI手机的整体思路上,各家都趋于一致,不再强调AI应用呈现,而是将深度集成到操作系统当中。


将AI能力,具体落地到手机的应用场景中,让其无处不在。


第三阶段,就完成了AI本地化、原生化实质性的跨越——AI手机不再局限于一个应用,而是上升到「系统级AI」、「平台级AI」。


这一刻,AI完全重构人机交互方式,用户通过自然语言发出指令,智能体便可理解意图。


关键,它还能为你代劳任何事,比如一键点饮品、一键旅行规划、订票等等。


手机端侧成为了真正的智能体,AI深度融合在手机原生生态服务中。


全栈技术变革用户体验


正如OpenAI在发布GPT-4o时宣称的,在AI时代,我们必须要向着更自然的人机交互迈进。



不仅是文本,对于语音、图像、视频等多种模态,我们都需要找到更自然、更符合人类习惯的交互方式。


要实现这个目标,仅靠软件和模型层面的创新显然是不够的,绕不开的一步,就是对操作系统进行重构。


荣耀推出的自研操作系统MagicOS 8.0,就在人机交互方面做出了重大创新。


MagicOS 8.0创造了行业首个基于意图识别的人机交互新范式(Intent-based UI,简称IUI)。



最为根本的改变是,IUI颠覆了原有的「操作-反馈」模式——将「人理解设备」变为「设备理解人」。


用户只需要通过简单的提示词来表达意图,操作系统就能心照不宣地完成任务,无需原来一步接着一步的繁琐操作流程。


有了更自然、更懂用户的交互方式,才能最大限度发挥AI Agent的能力,让它真正协助到我们生活的方方面面。


然而,许多人都有这样的担心:手机中无处不在的AI Agent,会不会造成隐私泄露?我们的个人信息还安全吗?


实际上,用户隐私和产品性能之间如何权衡,对于所有公司来说都是一个两难问题。


收集更多数据、在云端部署模型,意味着更多算力、更强的智能,有知识储备和推理能力方面的优势,但会严重威胁到用户的个人信息安全。


苹果采用的隐私保护策略,是在终端部署模型,但每一次需要接入ChatGPT时,都发送通知让用户进行确认,拉低了沟通效率和使用体验。


相比之下,荣耀团队给出了更加完美的解决方案。



CEO赵明表示,荣耀大模型在云上的初始训练只利用了通用数据;而在训练完成后,将会完全部署在用户终端上。


相比云侧模型,端侧AI可以针对用户个人数据进行训练,实时感知、随时计算,能带来更加个性化的智能服务。


此外,部署在端侧的平台级AI还发挥着中控的作用。


如果需要调用云侧模型来处理任务,则会通过端侧防护网滤掉用户隐私,确保信息不上云,让个人数据库真正属于用户。


这种「数据不出端」的做法,既守护了隐私安全,又同时利用了云侧和端侧大模型的优势,而且保证用户与AI之间便捷高效的交互。


除了数据方面,荣耀的AI Agent在执行过程中也十分注重安全机制,通过可视化、随时中断、接管机制等方法打造安全可靠的交互体验。


比如在「一键关闭自动续费」的功能中,界面上会出现视觉动效来提示用户AI Agent已启动;确认用户需求后,全程每一步骤的操作都会提示用户并告知状态。


在整个工作流中,用户可以随时打断Agent,或直接由自己接管下一步操作。


如果涉及取消自动续费等重要操作,Agent也不会「自作主张」,而是交由用户手动确认、全权决定。


无论是出于技术和行业生态的原因,还是出于安全伦理和隐私合规方面的思考,我们都可以感受到,荣耀在人机交互的设计上,充分考虑了信任感、掌控感,让用户安全感爆棚。



未来无限想象


如今,手机智能体代表着全新的超级入口。


智能体能够敏锐感知世界,了解用户与环境复杂信息,还具备了强大的自学习、自进化能力。


未来,这样的智能体无处不在,随时召之即来。


它可以是你的办公助手、生活助理、娱乐达人,出行专家.....,只要是你所想,即可拥有专属定制的AI角色。


当工作忙得不可开交时,收发邮件、整理文件、安排日程这类事务,AI Agent完全可以代劳。


它还可以是你的生活助理,推荐美食、娱乐活动,给出旅行规划建议。


而且它还可以查询资料、制定学习计划、答疑解问,成为学生们的帮手。


试问,这样的AI Agent,谁不想要呢?


文章来源“新智元”,作者“新智元”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0