ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
把大模型装进手机,AI帮我打工更容易了
3566点击    2023-11-21 22:39

如今大模型进手机是真的火啊。


各大手机厂商发布会都标配大模型,而且直接真刀真枪来现场演示。


喏,在ODC 2023大会上现场演示可以看到,ColorOS的一键识别屏幕文本,再进行智能摘要。



这谁看了不激动啊喂。


于是我们也来赶紧实测体验了一把~


它不仅提供各种AI生成能力,比如写大众点评:



还能长按图像闪速抠图



而且整个系统都变得“更懂事儿”了。复制地址直接弹出导航窗口、复制英文就弹出翻译窗口。能它做的事尽量不麻烦你。



这么看,装入大模型的ColorOS 14真有点个人助理那味儿了。而且其中很多新技能点,都点在了生产力方向。


难道说,让AI在手机上帮我打工都要成为现实了?


我们用ColorOS 14试了试。


还能这样手机办公?


以我们日常写短讯为例,一般需要明确提纲、查找资料、理解内容,然后进行图文创作,而且速度要快。


用ColorOS 14辅助的话,画风是酱婶儿的:


首先可以让小布助手帮忙头脑风暴这篇稿件该如何写?



感觉提纲有点冗长,能进一步提出要求“写短一点”。



在有了主体框架后,需要补充细节。这方面,可以把已有资料喂给小布,让它找到重点,直接生成可以用的文字。


如果遇到没有操作权限的文档,还能使用小布识屏提取内容,复制到中转站暂存



然后打开小布助手,让它对刚刚的内容总结摘要。可以提出进一步要求,比如语句简洁、用三句话表达等。



哪怕是资料是英文都没关系,只要复制内容,就会弹出翻译窗口,能直接查看中文意思。



一般我们还会准备一些图片素材丰富文章,有时还要使用ps二次处理图片,最常用的就是抠图功能了。


这方面ColorOS 14也能实现。


打开相册,找到对应图片,长按想要抠出的部分即可。图像素材同样能保存到中转站中备用。



这样一来,在手机上即可搞定一篇图文并茂的快讯。


再加上ColorOS 14的文件随心开支持许多以往在安卓机上无法打开的文件格式,比如psd、iOS生态的Pages/Numbers等。



中转站功能在同账号下,能跨设备流转,手机上保存的素材平板上直接用,无需再手动传输。


通过PhoneLink,无需下载任何APP,即可在Windows电脑上打开手机应用、接打电话、收发短信、传输文件。



这真的是要把手机生产力拉满啊。


但还没完,我们发现ColorOS 14新增的泛在服务在流体云交互下的全新体验,还是个出差利器。


外出办公、赶飞机两不误


一般出差途中都需要查看航班/车票具体信息,包括出发到达时间、座位、航班状态等。


但问题是在途中,很可能还要同步办公(别问我怎么知道)。



这就导致很容易忽略重要的行程信息,或者要手忙脚乱反复确认航班/车次状态。


ColorOS 14的流体云,一方面提供了实时提醒的功能,能将航班/车次/网约车/导航状态信息“钉”在屏幕上,方便查看;另一方面,它还支持复制车次/航班号快速查看行程,或者是将导航地址直接同步到车端



同时这些提醒能以不同优先级呈现,最重要的信息最明显,提醒也有强弱之分,更符合大家使用手机的直觉逻辑。



另外还支持多模态提醒,重要行程信息能在耳机内播报。


在未来,当你询问过小布“可以购买几点去北京的高铁票”后,它就能准确捕捉到你的需求,然后推荐适合你的车次、当地天气、住宿信息等。


这背后不仅考验大模型能力,同时也给系统任务编排、复杂意图理解等能力提出要求。


从最新升级的ColorOS 14来看,OPPO已经构建出了实现如上效果的基本底座能力。它们也是这一次ColorOS 14大幅提升手机体验的关键。


具体带来哪些新技术?往下看。


用大模型更好理解用户意图


给ColorOS 14带来新体验的核心技术为两方面:


AndesGPT大模型


潘塔纳尔系统


其中,AndesGPT大模型主要提供AIGC能力,如上小布助手中种种智能化体验,都得益于它。



不仅能基于知识库、知识图谱和通用搜索提升回答准确性,70亿大模型就支持最高2k tokens的输入长度


未来还将支持文生图、图生图,甚至当场来一首歌,从主题风格到元素都能定制。



然而,要想在手机上实现这些能力并不那么容易,光靠手机算力无法运行较大的模型,联网运行又无法处理个人隐私信息。


为此,OPPO自主训练的AndesGPT大模型采用了端云协同的部署方式,从十亿到千亿大模型不等,端侧小模型处理个人数据,云端大模型负责完成复杂任务指令,如知识查询等。


为了让端侧小模型塞进手机的同时保持性能,AndesGPT还采用了4位量化技术,在缩短生成时间的同时确保模型输出性能。


总结来看,AndesGPT的所有能力,都是为了将手机打造成你的“第二大脑”。



潘塔纳尔系统,是OPPO的自研智慧跨端系统。


流体云中的实时提醒、消息按照主次显示,以及中转站文件跨端流转、文件随心开、随身工作台等功能,都得益于潘塔纳尔系统。


两部分功能对应它的两大能力:泛在服务和跨端互联。


泛在服务,简单来说就是让服务无处不在,从人找服务变成服务找人。


例如出门游玩,基于泛在服务可以根据榜单帮忙规划游玩路线、推荐门票购买、预定机票酒店等;机票订购,会结合天气和日历等APP安排时间和出行方式……



跨端互联,用ColorOS打通了手机、耳机、TV、PC、甚至Osmo云台、车机等设备的连接,进一步打破端与端的边界,给用户带去更无缝的跨端体验。



而且在ColorOS 14上,AndesGPT和潘塔纳尔系统首次融合、“无缝协同”,来解决手机功能繁杂、操作门槛高的问题。



如果原本手机只是一个菜篮子,AndesGPT和潘塔纳尔系统就是厨师,用户提出菜名,它们就能完成准备材料、炒菜和上菜一系列操作,最大程度上降低操作门槛。


不仅如此,潘塔纳尔系统升级的情境感知能力,也能进一步帮助AndesGPT做出决策,更好理解用户意图。


如今AIGC时代来临,各行各业出现新的变革契机。对于终端行业而言,是否也能基于新发布的ColorOS 14,归纳出一系列新的标准,来衡量性能和实力?


换言之,AIGC时代下,怎样的终端设备才能给用户带来更好的体验?


AIGC时代造就怎样的新终端?


当下,AIGC趋势和终端市场正在相互成就。


对于终端而言,AIGC是必须要把握的趋势。它不仅给发展成熟的手机终端带来新气息,更是明确了手机等终端下一步的发展方向:更智能。



但是在智能手机基本交互逻辑已经确定的当下,这种“更智能”并非易事。


因为它根本上是对细节的考验。


透过ColorOS 14的发布可以看到,系统做了600+细节升级。从UI设计、泛在服务到小布助手,细节上的改变都是希望更逼近用户最自然的交互习惯,让这种升级更加“润物细无声”。


由此也传递出了一个行业认知:终端系统的大框架已经基本固定,未来操作系统的突破,关键看细节


以ColorOS 14的革新为例,无论是操作系统还是智能助手,结合产学研等多方力量共同实现了诸多突破,而在突破之下,是对细节的把控与考量。


在OPPO长期的产学研投入中,这样的技术细节迭代带来的产品革新无处不在。


这些年来,OPPO已经与国内外90余所高校科研单位、600余名专家学者达成科研合作,在核心技术领域开展了500余项科研课题研究,与国内15个高校共建了软件方面的联合实验室。


例如,在ColorOS 14发布以前,OPPO已经早早和在语音对话系统有着深入研究的清华大学计算机系黄民烈教授团队建立合作,针对AndesGPT大模型在手机上的适配展开研发,将最新学术成果与OPPO的智能对话系统技术结合起来,从而让ColorOS 14中的小布助手学到了更复杂的意图理解能力。


潘塔纳尔系统首席科学家李治军认为操作系统革新最关键的细节之一,正是系统与用户的交互方式。在ChatGPT爆火后,他马上跟进大模型研究,并基于团队已有的成果和大模型技术,将其应用到100多个场景中。


也正是基于这些准备,能让ColorOS 14上车大模型更加丝滑流畅,进一步提升用户在办公、差旅等场景中的体验,把操作手机变成“和手机打交道”等。


当然,无论应用场景如何丰富、技术如何改善,最终的评判标准,还是要由用户来定。



随着ColorOS14 正式推送,OPPO的几款新机型,如OPPO Find X6 Pro、Find X6、Find N2、Find N2 Flip、Reno9 Pro、一加11,已经可以直接玩上了。



文章来自微信公众号 “ 量子位 ”,作者 明敏 萧箫










AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT