ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
一句话的事儿,手机自动驾驶来了!首款国产AI智能体手机引爆端侧革命
8986点击    2024-10-22 20:14

理想的AI OS和AI手机形态,到底应该是什么样子?


在我们还在放飞想象之际,业界已经有厂商提前交卷,给我们打了一个样!


北京时间10月22日高通骁龙峰会2024上,荣耀全球CMO郭锐以荣耀AI智能体等多项技术创新为例,向业界分享了荣耀携手高通联合研发、携手释放端侧AI最大潜能的前沿案例。


荣耀CEO赵明也以远程视频致辞的形式宣布,荣耀即将发布的旗舰新品荣耀Magic7系列的影像和游戏,将首次搭载生成式AI能力,高通骁龙移动平台提供支持。



背后植入的新一代MagicOS 9.0操作系统,也将在23日正式亮相。


走在端侧AI开发前沿的荣耀,正在携手包括高通在内的全球顶级AI合作伙伴,共同定义AI时代关键的AI原生应用场景,在连接、交互和性能方面为用户带来革命性的体验。


AI无所不在,才叫AI手机


过去30年来,手机行业经历了两次重大革命。第一次革命始于手机的出现,将移动通信引入普罗大众的生活。第二次革命出现在这三十年的后半段,智能手机颠覆了人们生活的方方面面。如今,全球有31亿部智能手机在使用。


而随着AI大模型爆火的热潮,如今,智能手机的全领域正在被AI革命席卷。


IDC最新预测估计,2024年生成式AI手机的出货量将同比增长364%,达到2.342亿部。到2028年,全球生成式AI智能手机的出货量将达到9.12亿部。


报告地址:https://blogs.idc.com/2024/07/05/the-rise-of-gen-ai-smartphones/


前景如此广阔的市场,自然也成为「兵家必争之地」。


从2022年ChatGPT引发的生成式AI大爆发以来,谷歌、三星等各大厂商,都在尝试将AI大模型内置于手机,完成AI在手机终端的部署。


但仔细观察之后我们会发现,这一阶段,大多数手机厂商发布的「AI手机」,更多是通过打开接口,把大模型技术集成到手机的具体应用里,提供嫁接式的生成式AI服务。


比如三星Galaxy S24的Galaxy AI,虽然涵盖了照片编辑、语言翻译、记笔记、发短信、搜索等操作,但基本也就到此为止了。



而真正的AI手机,不应该仅限于这种「应用层AI」,而是用AI从操作系统的底层来重构服务逻辑、业务流程和资源分配,超越如今我们熟知的应用程序为基础的操作系统。


此前,荣耀CEO赵明曾抛出过一个看似「反常识」的观点——生成式AI手机≠AI手机。


「AI是根基,在手机上无处不在,才能叫AI手机。」


是的,AI手机意味着要用AI重构底层的硬件和操作系统,从用户体验到业务逻辑的方方面面都需要有所变革。而这,便是平台级的AI能力。


在6月的WWDC上,苹果推出Apple Intelligence,宣布将AI与iOS系统进行深度融合。


英雄所见略同,苹果的战略路径,与荣耀具备行业唯一性的四层AI架构的系统层和单机层不谋而合——


  • 系统层:使AI能够跨操作系统、跨终端设备,实现无缝连接和数据共享
  • 单机层:重构操作系统,打造平台级AI,提供真正理解用户需求的终端
  • 应用层:关注AI在端侧的应用,将大模型的能力拆解到各类具体的应用场景中
  • 网络层:借助云端模型的力量,在端侧AI的基础上实现端云协同


总结来说,为AI时代打造的AI OS,需要以AI为核心驱动,深度整合AI技术,对于用户的需求也会更加智能地理解。


而作为新物种的AI手机中,则需要用AI打通手机的全部软件和硬件,每一台手机在用户拿到手里之后,都能变成专为每个用户「独家定制」的超级智能设备。


17年前,乔布斯曾留下这样两个坐标,来界定真正智能手机的理想形态,横轴是易用性,纵轴是智能化程度。


17年后的今天,当我们重新思考「人与手机的关系」,竟再次回到了最简单的那个答案。




就如同赵明的解释,从第一性原理来看,手机应该是什么样子?


答案就是:最懂我,了解我,知道我的需求,从而服务我。


AI智能体,开启手机「自动驾驶」时代


现在,智能手机虽然种类繁多,但完成大多数任务的过程通常是相同的:解锁手机并打开一个应用。稍微复杂一点的,还需要在多个应用之间来回切换。


而AI手机应该具备的,则是一种自我发展进化的能力,消解工具性的特征。


今年9月亮相的荣耀AI智能体,就展现了这一雏形。


随着这款全球首个跨应用开放生态智能体在IFA 2024大会上亮相,并持续展现前所未有的创新体验,让大众对智能手机正式进入了「自动驾驶」时代也终于有了实感!




而在最近一个月,关于「AI OS和AI手机」的答案,也愈发清晰。


10月14日、15日、16日三天,荣耀在微博上每天放出一个MagicOS 9.0魔法。


比如一句话取消自动续费。


日常生活中,很多用户在手机上开通付费订阅后,需要多步复杂操作,才能找到关闭自动续费选项。


而MagicOS 9.0上只需通过一句语音指令(如「取消视频APP自动续费」)激活荣耀AI智能体,它就会自动跳转到微信和支付宝,帮我们检查所有应用的自动续费。


查询完毕后,AI智能体会将查询结果自动呈现出来。注意,当涉及到取消自动续费这类重要决策时,AI智能体会把决定权归还用户,此时我们必须手动进行确认,才能最终取消。


取消续费服务后,主动权再次交给Agent,由它完成关闭扣费服务的操作。


总的来看,用户不用再翻阅设置、一层层查找选项,无须多余步骤,极大简化了操作流程。


整个过程深深体现出未来手机与用户的全新关系:无需用户手动寻找功能,只要一句话,手机便会主动理解并调起服务,完成执行。


就像汽车的自动驾驶技术可以减轻驾驶者的负担,在荣耀AI智能体的赋能下,MagicOS 9.0也开启了手机「自动驾驶」的新时代。



同样体现出此精髓的,还有一句话点外卖。


如果用智能手机点外卖,我们需要执行点开APP、选择菜品、付款这一系列操作。


而在智能体手机上,只需说一句「帮我点一杯拿铁」,AI智能体就能自动完成需要手动的这些操作了。



同样,一句话也能实现跨APP发送文件。


智能体手机发文件,从接收指令、查询文件、选中文件,到最后发送,均是一步完成。


原本需要用户手动执行的七步操作,现在简化为一句轻松的语音指令即可完成。


整个操作看似简单,只是一句话的事儿,但背后绝对不是一句话的事儿这么简单,需要AI智能体基于多模态大模型能⼒,对UI界面的操作语义进行深度理解,就像⼈开车判断路口⼀样,去判断完成任务需要点击哪个UI控件,这背后需要强大的推理和规划能力。




以上,荣耀AI智能体一句话操作,均是在保护用户隐私的前提下进行的。


在人机交互上,他们充分考虑可视化、信任感、掌控感等多种因素,打造出安全可靠的体验。


在荣耀AI智能体工作时,操作界面会呈现「跑马灯」的视觉动效,提示用户AI智能体已启动;确认用户需求后,全程每一步骤的操作,都会向用户提示并告知当前状态;用户能够随时打断操作,或直接接管下一步操作。


就比如取消自动续费的最后一步确认时,系统会将主动权交由用户。这样的「自动驾驶」,是能让用户放心使用的。


更值得一提的,是荣耀Magic7在AI反诈领域实现行业首发的「AI换脸检测」。


前段时间,韩国国内掀起「N号房2.0」事件,Deepfake被用到了未成年人身上,引发人们巨大的恐慌。


甚至,全网一度开启了「Deepfake到底有多可怕」的热议话题。


最为致命的是,这些AI生成的图像、视频几乎以假乱真,仅靠我们的肉眼根本无法分辨。



即将在Magic7落地的荣耀AI换脸检测技术,成为其在AI反诈领域取得的重要成果之一。


演示视频中,两个赵明同框着实让人一眼难辨真伪。



通过端侧AI能力,荣耀AI反诈神器能够识别出人眼看不到的瑕疵,而且整个过程仅需2-3秒。


它会先对视频中画面人物眼神、光线、清晰度等,进行逐帧提取,再与大数据收集的数据样本进行识别和筛选对比。


如果检测到视频内容为AI合成换脸,用户手机就会收到概率提醒。


这个能力不仅仅局限于视频通话,对于平时经常刷的直播或者短视频也可以实现检测。


变革智能手机交互范式、迈向「自动驾驶」时代背后,离不开荣耀多年来在端侧AI领域的深耕。


作为端侧AI领域先行者,荣耀自2016年起便开始这场技术变革探索之旅。


从战略布局来看,荣耀端侧AI发展经历了三个关键阶段。


第一,开创性推出首款AI手机荣耀Magic一代,将AI引入移动终端,开启手机智慧之门。


第二,通过MagicOS构建平台级AI能力,创新性提出四层AI架构。


第三,把AI大模型引入端侧,发布荣耀AI智能体,继续引领意图直达服务的「服务找人」业态趋势。


这些年来,荣耀始终站在端侧AI创新前沿,不断突破技术边界,重新定义智能时代手机发展方向。


再度升维的MagicOS 9.O,无疑让业界充满期待。


在人机交互的变革的同时,也将驱动产业生态的变革。


联合全球AI顶尖力量,定义终端智能新时代


AI未来,从不是某个人,某家公司定义的。


外媒最新爆料称,苹果AI已经落后于产业2年以上。这主要归咎于,苹果一直以来引以为傲的「封闭生态」。



在这个开源AI迎来曙光的时代,封闭并不会成为最终胜利者。


面对苹果的「围墙花园」,荣耀选择了与全世界众多的AI顶尖伙伴合作,用「开放」对抗「封闭」。


如今,荣耀再次与高通携手并进,共同开发和定义「AI优先」的生态系统。



在智慧互联、人机交互、硬件性能三大层面上,一场全新技术革命正在来袭。


针对智慧互联,通过MagicOS信任环(MagicRing)将荣耀多个终端设备串联,打造出「超级终端」,利用双方促成的Snapdragon Seamless跨平台技术,促进行业多终端互联互通技术革新进化。


在交互创新上,荣耀AI智能体带来了颠覆性端侧AI体验,并得到了高通异源计算架构的支持,让更低功耗AI计算赋能个人化AI助理。


在性能提升方面,双方致力于端侧AI赋能硬件,全面释放SoC性能。比如,荣耀带来了业界首创NPU驱动AI实时渲染技术,系统性解决了手机游戏「三难困境」。



这一切变革体验,都在荣耀与高通联手打造的「AI优先」生态中,逐一呈现。


即将亮相的MagicOS 9.0,搭载的荣耀AI智能体同样强调「跨应用开放生态」。


它不仅能够调用系统自带服务,还与第三方开放合作。


10月初,荣耀联合中国移动行业首发AI智能体互联互通,用户一句话就能实现手机余额查询、话费续费。



不仅如此,荣耀在全世界与众多的AI顶尖伙伴合作,共同推动AI未来的发展。


在AI引领创新的时代,荣耀正以开放的姿态拥抱变革,用创新重新定义可能。


这不仅是一场技术的进化,更是人机交互方式的革新。


强强联合之下,荣耀正在描绘一幅AI赋能的智慧未来:


在这里,科技与用户需求完美融合,创新与价值相互成就,每个人都将感受到AI带来的无限可能。


而这,正是我们心目中未来的AI OS和AI手机的样子。


文章来自于微信公众号 “ 新智元 ”



关键词: AI , AI手机 , 智能体 , AI硬件
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI换脸

【开源免费】Deep-Live-Cam是一个只需一张图片即可实现实时换脸和一键视频深度伪造的AI项目。

项目地址:https://github.com/hacksider/Deep-Live-Cam

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales