理想的AI OS和AI手机形态,到底应该是什么样子?
在我们还在放飞想象之际,业界已经有厂商提前交卷,给我们打了一个样!
北京时间10月22日高通骁龙峰会2024上,荣耀全球CMO郭锐以荣耀AI智能体等多项技术创新为例,向业界分享了荣耀携手高通联合研发、携手释放端侧AI最大潜能的前沿案例。
荣耀CEO赵明也以远程视频致辞的形式宣布,荣耀即将发布的旗舰新品荣耀Magic7系列的影像和游戏,将首次搭载生成式AI能力,高通骁龙移动平台提供支持。
背后植入的新一代MagicOS 9.0操作系统,也将在23日正式亮相。
走在端侧AI开发前沿的荣耀,正在携手包括高通在内的全球顶级AI合作伙伴,共同定义AI时代关键的AI原生应用场景,在连接、交互和性能方面为用户带来革命性的体验。
AI无所不在,才叫AI手机
过去30年来,手机行业经历了两次重大革命。第一次革命始于手机的出现,将移动通信引入普罗大众的生活。第二次革命出现在这三十年的后半段,智能手机颠覆了人们生活的方方面面。如今,全球有31亿部智能手机在使用。
而随着AI大模型爆火的热潮,如今,智能手机的全领域正在被AI革命席卷。
IDC最新预测估计,2024年生成式AI手机的出货量将同比增长364%,达到2.342亿部。到2028年,全球生成式AI智能手机的出货量将达到9.12亿部。
报告地址:https://blogs.idc.com/2024/07/05/the-rise-of-gen-ai-smartphones/
前景如此广阔的市场,自然也成为「兵家必争之地」。
从2022年ChatGPT引发的生成式AI大爆发以来,谷歌、三星等各大厂商,都在尝试将AI大模型内置于手机,完成AI在手机终端的部署。
但仔细观察之后我们会发现,这一阶段,大多数手机厂商发布的「AI手机」,更多是通过打开接口,把大模型技术集成到手机的具体应用里,提供嫁接式的生成式AI服务。
比如三星Galaxy S24的Galaxy AI,虽然涵盖了照片编辑、语言翻译、记笔记、发短信、搜索等操作,但基本也就到此为止了。
而真正的AI手机,不应该仅限于这种「应用层AI」,而是用AI从操作系统的底层来重构服务逻辑、业务流程和资源分配,超越如今我们熟知的应用程序为基础的操作系统。
此前,荣耀CEO赵明曾抛出过一个看似「反常识」的观点——生成式AI手机≠AI手机。
「AI是根基,在手机上无处不在,才能叫AI手机。」
是的,AI手机意味着要用AI重构底层的硬件和操作系统,从用户体验到业务逻辑的方方面面都需要有所变革。而这,便是平台级的AI能力。
在6月的WWDC上,苹果推出Apple Intelligence,宣布将AI与iOS系统进行深度融合。
英雄所见略同,苹果的战略路径,与荣耀具备行业唯一性的四层AI架构的系统层和单机层不谋而合——
总结来说,为AI时代打造的AI OS,需要以AI为核心驱动,深度整合AI技术,对于用户的需求也会更加智能地理解。
而作为新物种的AI手机中,则需要用AI打通手机的全部软件和硬件,每一台手机在用户拿到手里之后,都能变成专为每个用户「独家定制」的超级智能设备。
17年前,乔布斯曾留下这样两个坐标,来界定真正智能手机的理想形态,横轴是易用性,纵轴是智能化程度。
17年后的今天,当我们重新思考「人与手机的关系」,竟再次回到了最简单的那个答案。
就如同赵明的解释,从第一性原理来看,手机应该是什么样子?
答案就是:最懂我,了解我,知道我的需求,从而服务我。
现在,智能手机虽然种类繁多,但完成大多数任务的过程通常是相同的:解锁手机并打开一个应用。稍微复杂一点的,还需要在多个应用之间来回切换。
而AI手机应该具备的,则是一种自我发展进化的能力,消解工具性的特征。
今年9月亮相的荣耀AI智能体,就展现了这一雏形。
随着这款全球首个跨应用开放生态智能体在IFA 2024大会上亮相,并持续展现前所未有的创新体验,让大众对智能手机正式进入了「自动驾驶」时代也终于有了实感!
而在最近一个月,关于「AI OS和AI手机」的答案,也愈发清晰。
10月14日、15日、16日三天,荣耀在微博上每天放出一个MagicOS 9.0魔法。
比如一句话取消自动续费。
日常生活中,很多用户在手机上开通付费订阅后,需要多步复杂操作,才能找到关闭自动续费选项。
而MagicOS 9.0上只需通过一句语音指令(如「取消视频APP自动续费」)激活荣耀AI智能体,它就会自动跳转到微信和支付宝,帮我们检查所有应用的自动续费。
查询完毕后,AI智能体会将查询结果自动呈现出来。注意,当涉及到取消自动续费这类重要决策时,AI智能体会把决定权归还用户,此时我们必须手动进行确认,才能最终取消。
取消续费服务后,主动权再次交给Agent,由它完成关闭扣费服务的操作。
总的来看,用户不用再翻阅设置、一层层查找选项,无须多余步骤,极大简化了操作流程。
整个过程深深体现出未来手机与用户的全新关系:无需用户手动寻找功能,只要一句话,手机便会主动理解并调起服务,完成执行。
就像汽车的自动驾驶技术可以减轻驾驶者的负担,在荣耀AI智能体的赋能下,MagicOS 9.0也开启了手机「自动驾驶」的新时代。
同样体现出此精髓的,还有一句话点外卖。
如果用智能手机点外卖,我们需要执行点开APP、选择菜品、付款这一系列操作。
而在智能体手机上,只需说一句「帮我点一杯拿铁」,AI智能体就能自动完成需要手动的这些操作了。
同样,一句话也能实现跨APP发送文件。
智能体手机发文件,从接收指令、查询文件、选中文件,到最后发送,均是一步完成。
原本需要用户手动执行的七步操作,现在简化为一句轻松的语音指令即可完成。
整个操作看似简单,只是一句话的事儿,但背后绝对不是一句话的事儿这么简单,需要AI智能体基于多模态大模型能⼒,对UI界面的操作语义进行深度理解,就像⼈开车判断路口⼀样,去判断完成任务需要点击哪个UI控件,这背后需要强大的推理和规划能力。
以上,荣耀AI智能体一句话操作,均是在保护用户隐私的前提下进行的。
在人机交互上,他们充分考虑可视化、信任感、掌控感等多种因素,打造出安全可靠的体验。
在荣耀AI智能体工作时,操作界面会呈现「跑马灯」的视觉动效,提示用户AI智能体已启动;确认用户需求后,全程每一步骤的操作,都会向用户提示并告知当前状态;用户能够随时打断操作,或直接接管下一步操作。
就比如取消自动续费的最后一步确认时,系统会将主动权交由用户。这样的「自动驾驶」,是能让用户放心使用的。
更值得一提的,是荣耀Magic7在AI反诈领域实现行业首发的「AI换脸检测」。
前段时间,韩国国内掀起「N号房2.0」事件,Deepfake被用到了未成年人身上,引发人们巨大的恐慌。
甚至,全网一度开启了「Deepfake到底有多可怕」的热议话题。
最为致命的是,这些AI生成的图像、视频几乎以假乱真,仅靠我们的肉眼根本无法分辨。
即将在Magic7落地的荣耀AI换脸检测技术,成为其在AI反诈领域取得的重要成果之一。
演示视频中,两个赵明同框着实让人一眼难辨真伪。
通过端侧AI能力,荣耀AI反诈神器能够识别出人眼看不到的瑕疵,而且整个过程仅需2-3秒。
它会先对视频中画面人物眼神、光线、清晰度等,进行逐帧提取,再与大数据收集的数据样本进行识别和筛选对比。
如果检测到视频内容为AI合成换脸,用户手机就会收到概率提醒。
这个能力不仅仅局限于视频通话,对于平时经常刷的直播或者短视频也可以实现检测。
变革智能手机交互范式、迈向「自动驾驶」时代背后,离不开荣耀多年来在端侧AI领域的深耕。
作为端侧AI领域先行者,荣耀自2016年起便开始这场技术变革探索之旅。
从战略布局来看,荣耀端侧AI发展经历了三个关键阶段。
第一,开创性推出首款AI手机荣耀Magic一代,将AI引入移动终端,开启手机智慧之门。
第二,通过MagicOS构建平台级AI能力,创新性提出四层AI架构。
第三,把AI大模型引入端侧,发布荣耀AI智能体,继续引领意图直达服务的「服务找人」业态趋势。
这些年来,荣耀始终站在端侧AI创新前沿,不断突破技术边界,重新定义智能时代手机发展方向。
再度升维的MagicOS 9.O,无疑让业界充满期待。
在人机交互的变革的同时,也将驱动产业生态的变革。
AI未来,从不是某个人,某家公司定义的。
外媒最新爆料称,苹果AI已经落后于产业2年以上。这主要归咎于,苹果一直以来引以为傲的「封闭生态」。
在这个开源AI迎来曙光的时代,封闭并不会成为最终胜利者。
面对苹果的「围墙花园」,荣耀选择了与全世界众多的AI顶尖伙伴合作,用「开放」对抗「封闭」。
如今,荣耀再次与高通携手并进,共同开发和定义「AI优先」的生态系统。
在智慧互联、人机交互、硬件性能三大层面上,一场全新技术革命正在来袭。
针对智慧互联,通过MagicOS信任环(MagicRing)将荣耀多个终端设备串联,打造出「超级终端」,利用双方促成的Snapdragon Seamless跨平台技术,促进行业多终端互联互通技术革新进化。
在交互创新上,荣耀AI智能体带来了颠覆性端侧AI体验,并得到了高通异源计算架构的支持,让更低功耗AI计算赋能个人化AI助理。
在性能提升方面,双方致力于端侧AI赋能硬件,全面释放SoC性能。比如,荣耀带来了业界首创NPU驱动AI实时渲染技术,系统性解决了手机游戏「三难困境」。
这一切变革体验,都在荣耀与高通联手打造的「AI优先」生态中,逐一呈现。
即将亮相的MagicOS 9.0,搭载的荣耀AI智能体同样强调「跨应用开放生态」。
它不仅能够调用系统自带服务,还与第三方开放合作。
10月初,荣耀联合中国移动行业首发AI智能体互联互通,用户一句话就能实现手机余额查询、话费续费。
不仅如此,荣耀在全世界与众多的AI顶尖伙伴合作,共同推动AI未来的发展。
在AI引领创新的时代,荣耀正以开放的姿态拥抱变革,用创新重新定义可能。
这不仅是一场技术的进化,更是人机交互方式的革新。
强强联合之下,荣耀正在描绘一幅AI赋能的智慧未来:
在这里,科技与用户需求完美融合,创新与价值相互成就,每个人都将感受到AI带来的无限可能。
而这,正是我们心目中未来的AI OS和AI手机的样子。
文章来自于微信公众号 “ 新智元 ”
【开源免费】Deep-Live-Cam是一个只需一张图片即可实现实时换脸和一键视频深度伪造的AI项目。
项目地址:https://github.com/hacksider/Deep-Live-Cam
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales