ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
首个AI「意图识别」操作系统!真·端侧大模型掀起第四次革命,自研魔法OS来了
8059点击    2024-01-10 17:09


人机交互变革前夜,谁拿下了主动权?就在刚刚,首个基于AI意图识别的人机交互(IUI)操作系统正式发布!


创世纪人机交互的变革前夜,谁也不曾想到,最懂自己意图的AI竟是这样的!


一早醒来,拿起手机便可以看到所有的待办事项,全都放在了「我的一天」。


10点小组内部会议、信用卡还款最后一天、妈妈生日12点记得送祝福、腾讯视频《繁花》7点开播等等,一目了然。



当你偶然在小红书上刷到了很感兴趣的内容,直接拖住图片放到「任意门」中,淘宝京东不同平台同款一目了然。



而且很快,你只需要说一句「下周一去北京出差,帮我订一张机票」,AI就会根据个人习惯和当天日程,迅速给出12:30前到达北京首都的航班。



甚至「先接老婆下班,再接孩子去老地方和朋友聚会」这种只有熟人才能知道的「暗号」,AI不仅能理解,还能一口气把路径全给规划出来!



AI能够预判你的预判,难道是科幻中的科幻?


其实不然,它只是一个「越用越好用,越用越懂你」的魔法OS。



1月10日,荣耀在2023开发者大会上带来了行业首个基于AI意图识别的人机交互(IUI)操作系统——MagicOS 8.0(魔法OS 8.0)。


与此同时,首个平台级自研7B端侧AI大模型「魔法大模型」也正式亮相,不仅强化了全新内核,还为IUI提供全AI能力的加持。


正如《2001太空漫游》作者Arthur C. Clarke曾说过的一句话,「任何足够先进的科技,都与魔法无异」。



而现在,荣耀正拿着那把AI「魔法钥匙」,带我们进入人机交互的新纪元。


60年变革,人机交互走到了哪?


那么,历次的人机交互革命,究竟是由谁定义的?


去年6月,苹果Vision Pro横空出世,开启了全新的「空间计算」时代,再次革新人机交互的方式。


戴上Vision Pro,只需眨眨眼,轻轻捏合手指,甚至动动嘴,头号玩家中科幻的一幕立即上演。



说来,这已经是苹果第四次发起改变人机交互方式的挑战。


2007年的发布会上,乔布斯曾展示了苹果革命性的用户界面历史,从电脑鼠标,到iPod点击轮,再到初代iPhone多点触摸屏。



显然,苹果登顶世界的背后,离不开以往历史性的革新定义了人机交互。


也就是说,谁能定义交互,谁就是王者。


过去60年的技术迭代,曾多次刷新了人们的交互方式。时隔近一个世纪,人机交互范式将迎来第四次革新。



上个世纪60年代中期,以DOS/Unix为代表的命令行界面(CLI),人机交互的方式是问答式。



然而,这种命令行系统的可用性很差,于是,一种全新的图形用户界面(GUI)就此诞生了。


其标志是,施乐在1973年发布了世界上首个第一台运用图形化用户操作系统界面的微型电脑。


从80年代开始,苹果Macintosh,到微软Windows,图形用户界面一直在UX世界占据了40年的霸主地位。



直到2007年,乔布斯发布了世界第一台iPhone,开启全新的自然用户界面(NUI)新时代。


这种交互方式带来的惊喜,我们所有人再熟悉不过。



乔布斯台上边演示边说,你只需要将手指轻轻从屏幕划过就能解锁iPhone


而现在,能够开启下一代UI范式的技术降临了。


ChatGPT的横空出世引爆全球AI热潮,大模型再次让AI人机交互更迭的齿轮转动起来。


借助大模型之力,智能设备全新的交互方式,必定是更加懂你的AI。


那么,智能设备操作系统的范式应该是怎样的?未来OS发力的正确方向有三点:新交互、新内核、新生态。


2023开发者大会上,荣耀一系列的发布,就是朝着这一方向前进。



面向未来AI和多系统并存时代,以人为中心、AI使能的个人化全场景操作系统「魔法OS 8.0」,就是荣耀带来的思考结果和解决方案:


以平台级AI为内核,以端侧大模型为加持,驱动基础体验的进化,带来多模态全新的交互范式,将传统基于需求查找的方式,进化为基于AI理解消费者意图的人机交互。


同时,以人为中心的智慧互联和服务生态也迎来突破,带来基于大模型的生态和新一代的互联体验。


荣耀的平台级AI能力,正在给操作系统插上想象的翅膀。


AI正在成为操作系统的「魔法棒」,让我们可以跨设备、跨系统、跨生态的去寻找未来智慧新世界的答案。让任何足够先进的科技都与魔法无异。


新交互:魔法OS 8.0,更懂你的AI


我们见证了,从传统命令到图形的交互,给人们的交互方式带来了深刻的影响。


到了AI大模型爆发时代,人工智能用户界面代表了一种不同的人与计算机交互范式。



我们不再需要告诉智能设备具体要做什么,相反,只需要告诉它想要的结果,便可实现。


而荣耀全新发布的「魔法OS 8.0」便是那根魔法棒,可以「任意门」,不用跨应用寻找,你想做的都可以一步直达。


打开哆啦A梦百宝袋——任意门


和小伙伴约饭时,直接把信息拖拽到旁边的滴滴,立即就帮你呼叫司机了。



你喜欢的专辑图片、做饭菜谱等等,一拖一拽就能直接收藏。



可以说,「任意门」简直就是手癌者的福音。


而且,除了刚刚发布的Magic6系列外,包括Magic3和荣耀50在内的旧机型,也可以在升级之后体验全新的「任意门」功能!


AI贴心管家,承包了「我的一天」


你的私人助理,何必是个真人?在MagicOS中,每个人皆可拥有一个AI助理,掌管你的日常生活,并送去贴心提醒。


举个栗子,当你预定了出差的酒店并收到预定信息后,个人助理会读取,并将其列为你的日程。



当老板在微信工作群要求大家参加一个活动时,直接用手把这句话一圈,然后选择「创建日程」。


具体参加时间就录入自己的日程表了。



去医院挂号,收到的挂号信息,直接拖拽到「任意门」中的创建日程,即可一步完成。



对话成片,朋友圈动态全靠它


以后创作视频,就直接动动嘴告诉YOYO「生成美食的视频」。


AI便迅根据「提示」从个人图库中选择特定的素材,炸鸡块、菠菜饺子、花式馒头各种与美食相关的图片。



然后,再配上AI生成的文案,一个有生活烟火气的视频就做好了。



另外,当你想在相册中搜索有关荷花的照片时,只需把「小荷才露尖尖角」这句抽象的描述或者模糊的诗句告诉语音助手,MagicOS会自动选取出相关的素材。



相比之下,iOS却给不出任何结果。



灵动胶囊,一瞥即开


灵动胶囊是每个人再熟悉不过的应用,在MagicOS中,你会再次感受到它的魔力。


比如打车时,灵动胶囊会给出车牌,预计到达时间等具体信息。当你想要获取实时状态,只需要盯着几秒,便可自动打开应用。眼神的魅力,就在此呈现。


不仅如此,订外卖、打王者闪回、音乐播放等各种场景,想要了解更多动态,盯着灵动胶囊就可以了。



新内核:模型装进口袋,7B端侧大模型赋能平台级AI


在魔法OS 8.0这个全新的IUI新范式背后,其实是平台级AI——Magic Live智慧引擎,在全面使能操作系统。


那么,究竟什么是平台级AI?


与应用级AI不同,平台级AI可以作为技术底座,全面使能操作系统,即它是下一代操作系统的「新内核」。


以往,传统的OS内核主要负责管理和调度系统诸如GPU、内存等硬件资源,以确保系统正常运行和高效利用。


但是,随着用户需求的增加,AI系统需要解析许多与人相关的因子,进而带来真正以人为中心的体验。



对于个人知识库、人的位置和状态感知、人的习惯和画像学习这三类相关因子,传统OS无法计算,由此我们需要一个全新的内核。


平台级AI强大之处就在于,能够对多种个人因子进行「管理」,以帮助操作系统精准识别用户意图。


这样一来,全新的操作系统便可以为所有人带来「猜你所想,懂你所需」的智慧体验。



这次,荣耀发布了首个自研端侧7B大模型「魔法大模型」,正是为全面加持平台级AI的能力而打造。


为此,荣耀联合高通攻克了性能和功耗平衡的难题,让自研的70亿参数大模型在经过量化压缩后,可以在骁龙8 Gen3设备上流畅运行。



另外,端侧大模型还有一个优势——能为用户带来更加个人化、人性化,以及更具隐私保护的全新体验。


就比如,谷歌在去年12月祭出Gemini一系列多模态大模型中,端侧Gemini Nano小模型的参数分别为18亿(Nano-1)和32.5亿(Nano-2)。


而且,Gemini Nano已经在Pixel 8 Pro上运行,能够为录音做总结,支持Gboard中的智能回复,通过对话感知能力提出高质量的回复,节省人们大量时间。



MagicOS在数据存储方面,采用了荣耀「两锁一芯」的架构,保证模型在端侧安全运行并存储,和端外完全隔离。


与此同时,用户更换手机数据出端的情况下,也会采用PQC加密算法护航数据传输,来保证「魔法大模」型对个人数据的安全继承。



值得一提的是,「魔法大模型」还融合了大语言模型、CV模型、跨模态理解模型,具备强大的自然语言理解、文案生成和高效的多模态信息解析能力。


有了「魔法大模型」的加持,便可让平台级AI实现从「感知」到「认知」的跨越;用户理解进化到内容和推理学习;意图决策进化到复杂任务分解,带来了强大的「以人为中心」的场景理解能力。


新生态:「百模生态计划」,凝聚中国AI力量


以「交互变革」为起点,智能设备的架构升级也在不断进化,在这两者双重驱动下,生态边界也在拓展。


每一次都人机交互的发展,都将带来生态的发展。


千万不要小瞧了双击、触摸这些简单的交互方式,交互的本质就是「人与服务的链接」,而它决定了生态的范式。


就拿Vision Pro来说,其创新的交互形式不仅让苹果开启了元宇宙的入口,还有可能对元宇宙生态产生深刻影响。


而意图识别人机交互背后,应用服务与系统的关系已经发生了变化,应用形态也可能发生变化,这背后可能酝酿移动互联网生态大变局。


端云协同新生态范式:充分协同端云大模型能力


「魔法OS 8.0」创新地推出端云协同的新生态范式,以YOYO智能助理为载体,可以充分协同端云大模型的能力。



具体来说,端侧大模型作为中控,可理解用户意图,拆解编排任务,高效安全地连接云侧大模型,融合、调度原子化服务,完成跨应用的复杂任务闭环。


基于这种端云协同新范式,用户通过YOYO与大模型进行默契对话。而且,还能够确保个人信息不上云,能够保护隐私安全。


手机成为人的思想和思维能力的延伸,端云高效沟通,无需反复确认,给用户带来更便捷安全的服务体验。


「百模生态计划」:魔法OS为中国大模型提供入口


另外,开发者大会上,「百模生态计划」正式开启,荣耀构筑了行业首个大模型中控开放架构。


云侧通用大模型和各种行业垂域大模型,可以通过货架化方式融入到魔法OS中,为每个用户提供更好的服务分发和任务闭环体验。


就在这次的发布会上,百度智能云千帆大模型平台正式以战略合作伙伴的身份,加入荣耀大模型生态。



针对智慧出行、智慧办公、智能家居、运动健康、影音娱乐多种场景,荣耀正在与各类大模型建立安全高效的连接。


比如,荣耀与航旅纵横正在联合打开通的智慧出行服务:当你需要订票时,端侧大模型根据个人日程安排、到达目的地距离,以及乘机习惯,将个人信息隐藏后,再把需求分解到具体航班时间和航司要求。


接下来,分解出任务后,端侧大模型脱敏后接入航旅纵横千穰大模型,由此便可以获得相应的订票信息。


此外,正如开篇提到的,荣耀与高德也在联合打造的智慧打车功能:一句话即可规划专属于你的最优路线,并自动拉起高德地图一语生成多段行程导航。


综上可见,荣耀正在以开放创新汇聚中国AI力量,去构建基于意图识别交互的智慧服务全新AI生态。


相信不久的未来,我们将看到中国力量也将成为世界荣耀。


走进AI时代3.0


「魔法OS 8.0」平台级AI使能的个人化操作系统,以新交互——意图识别人机交互,新内核——端侧平台级AI内核,新生态——大模型服务生态,正探索未来操作系统新范式。


要知道,魔法OS 8.0和端侧70亿参数魔法大模型的诞生并非一蹴而就,而是荣耀一直以来在技术储备上的积累,并将AI布局分为三个阶段。


第一阶段是,2016年初代Magic手机发布,荣耀首次把AI概念引入到手机中,打开手机智慧之门。那时,AI只是原有应用的辅助。


2021年之后,荣耀AI进入2.0时代。「魔法OS 7.0」操作系统推出,从应用级AI升级到平台级AI。


AI使能的个人化全场景操作系统,能够越来越懂你。


到了2024年,把70亿参数的AI端侧大模型,应用到平台级AI上,是荣耀要发展的AI 3.0。


云侧大模型学习整个人类的知识库后,有着强大的泛化能力,却存在个人隐私的局限性。


由此,荣耀率先提出端侧AI大模型的概念。MagicOS的价值主张是AI使能的个人化全场景操作系统,端侧AI大模型是平台级AI的进一步传承和发展。


大模型加持下的平台级AI,能够打造出专属于每个人的系统,可以进行各种多模态分析,基于更多的因素进行决策分析。


在荣耀看来,端侧大模型会让我们拥有更加智能的终端设备。手机能够真正成为用户个人的、智能的助手,处理各种应用的复杂任务。


从「魔法OS 7.0」到「8.0」的迭代升级,已经突显出荣耀端侧大模型的强大魔力。


除此之外,端侧大模型与魔法OS深度融合,革新交互的同时,创造了全新的生态。


我们所看到的任意门,以及端云协同大模型体验,只是意图UI开创的新生态的开端。


未来可期,在操作系统和应用服务的共同努力下,一定还会有许多酷炫得像魔法的场景成为现实。


这一次,荣耀用AI大模型重做操作系统,走出了一条不一样的路径,有望成为iOS、鸿蒙OS之外的操作系统第三极!


文章来自于微信公众号 “新智元”,作者 “桃子 、好困


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT