vivo周围：大模型技术体验两不误，手机是最好场景

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

5155点击 2023-12-18 14:50

为什么“大模型进手机”趋势，如此爆火？

vivo再次向外界给出解答。

vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围，在MEET智能未来大会上表示：

大模型目前最能完成体验闭环和商业闭环的场景，就是落地在手机上，打造智能体。

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

言下之意，不仅智能手机需要大模型来做智能升级，大模型也需要庞大的手机市场来帮助大模型进行应用落地。

由此也就不难理解，为何从今年下半年开始，全球手机厂商纷纷加速大模型进入手机的步伐，快速而坚定。

以vivo为例，今年vivo正式发布自研AI大模型矩阵蓝心大模型，以及全新手机操作系统OriginOS 4。

其中蓝心大模型包含十亿/百亿/千亿三个参数量级，共5款大模型，其中70亿参数版本对外开源。同时还宣布在端侧跑通130亿参数大模型。

而在带来这些实际进展背后，身处激烈竞争中的厂商们，如何理解技术本身？如何看待趋势发展？

vivo周围的最新分享，可作为一份业内参考。

大模型就像能随身携带的字典

为什么大模型能如此神奇，给生产效率带来极大提升？

周围认为，核心原因在于大模型将人类数千年的文明知识进行了高纬度的抽象，并压缩成每个人都可以获取的知识和信息，再应用这些知识和信息去解决问题。

这让大模型变成了可以人手一本的“全新字典”。它载入了人类历史、文化、文明等知识，可以随身携带，我们问什么、它就专业回答什么。

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

但不止于此。

周围认为，大模型还要有像人类一样的逻辑思维、情感和价值观。

以今年热议的大模型高级应用形式智能体为例。

关于其能力的讨论，“情商”部分占比很高。比如对于手机智能体而言，周围认为它应该具备以下几方面能力：

主动感知环境和行为
主动理解用户意图给出判断和决策
主动调用系统能力、满足用户需求
记住用户习惯、提供更有个性化的服务
具备记忆力、给用户带来温暖陪伴

对应到实际场景，手机智能体可以在用户的充分授权下，完整模拟用户对OS系统、应用的操控，“就像手机里的一个虚拟管家，帮你完成各种事情。”

比如制订旅行攻略、预订更合适的机票酒店；在购物时刻全程双向沟通，辅助用户挑选到心仪商品。

在这一基础上，周围强调说，手机智能体应该具备人格和记忆，理解人类的喜怒哀乐，也拥有自己的情感。

它会像朋友一样与我们聊天，给予我们专业的服务和贴心的陪伴。

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

一言以蔽之，在期待中智能体应该是温暖的，而不是冰冷的。

并且在可预见的未来中，智能体将出现在各种终端载体上，拥有各种各样的形象，可能是机器人、宠物狗，也可能是智能汽车。

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

透过周围的一系列分享，可以明显感受到，手机厂商更加关注大模型应用给人带来的实际体验如何。

比如将大模型比作是人手一本的“新字典”，是对便携性的关注；强调智能体的意图理解、情感陪伴能力，是对用户友好的关注。

这其实都是人机交互发展遵循的底层逻辑。

纵观人机交互发展史，从命令行界面到触摸界面，从多媒体交互到AR/VR，始终都在遵循着更丰富体验、更个性化、更用户友好的方向发展。

大模型应用落地，正是人机交互发展的最新阶段。

而为什么vivo、周围能对这一底层逻辑把握如此精准？

从周围在vivo的履历即可找到答案。

周围自2005年加入vivo，从事智能机软件开发，熟悉各类Linux智能机开源项目，曾担任vivo软件研发总经理。

2018年，vivo AI全球研究院正式成立，周围担任首任院长。成立之初，研究院设有12个研究方向，包含语言识别、NLP、机器视觉等。

当时周围对外表示，vivo AI全球研究院的理念为基于AI技术构建一个平台，为消费者服务。

2020年，vivo系统OriginOS发布，周围担任负责人。

OriginOS目前已迭代至第四代，在最新版本中已整合大模型能力，上线蓝心小V私人助理。

一边投身AI基础技术探索，一边领衔手机系统研发，同时还是手机行业近20年老兵。

所以，周围能精准参透趋势，也就不足为奇。

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

而结合他的个人履历，还能发现一层事实，vivo在AI和操作系统方面的布局，已经双线并行多年。

vivo AI全球研究院从成立以来，始终保持千人规模AI专家团队。另外还成立了人工智能图谱研究院，目前已积累13000TB数据。

二者都是以用户体验为起点，开始进行技术探索和落地实践。此前OriginOS中已有不少功能，正是二者碰撞出的火花。

如今随着大模型趋势爆发，这两条线正式发生大交汇，直接能看到的成果，就是vivo今年一口气发布5个大模型，并直接带来落地应用，普通消费者已能实际体验。

这一系列动作，也给手机行业如何落地大模型、大模型如何走进更多场景，提供了有价值参考。

已给出行业参考路线

周围表示，vivo的大模型战略可总结为5点：

大而全、算法强、真安全、自进化、广开源。

实际动作方面，一个月前，vivo在短短15内官宣了一系列大模型动作。

自研大模型矩阵“蓝心大模型”发布
大模型加持的操作系统OriginOS 4发布
深度参与生成式AI芯片天玑9300研发落地
大模型手机vivo X100发布

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

这一套紧锣密鼓的动作背后，围绕着两个核心：

大模型开发
大模型落地

先看大模型开放方面，这是底层基础能力的构建。

vivo的路线是自研+开源。

自研AI大模型矩阵“蓝心大模型”，一共五款，兼顾端云：

1B端侧大模型
7B端云两用模型
70B云端主力模型
130B云端大模型
175B云端大模型

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

其中70亿版本对外开源，由此vivo成为首家开源大模型的手机厂商。同时实现130亿版本在端侧跑通，同样是业内首家。

具体能力方面，5个版本模型各有专长。

规模最小的10亿参数大模型，完全跑在端侧，内存占用仅为1GB，出词速度达到64字/秒。

70亿参数版本端云两用，首词响应仅需1秒，中文语境能力全球领先。

如上端侧模型支持联发科和高通旗舰级平台本地处理。

百亿级别大模型能提供更加丰富的能力。700亿参数版本是端云主力模型，支持角色扮演、知识问答、自然对话等能力，在多个评测榜单中位列第一（数据截止11月中）。

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

千亿级别包括1300亿和1750亿版本，它们可以进行更加复杂的逻辑推理和任务编排。

再来看大模型落地应用方面。

vivo走了软硬一体路线。硬件方面，和芯片厂商深度合作，加速大模型上手机；软件方面，推出多种应用形式、并和底层系统深度融合，让消费者能更快上手体验。

今年vivo和联发科在大模型方面展开密切合作。

前脚二者官宣合作实现70亿参数大模型、10亿参数视觉大模型在端侧落地。

紧接着，采用全大核架构的天玑9300发布，这块芯片由vivo和联发科共同定义、联合研发、联合调教。

架构的革新使其可快速完成任务、快速休眠，大幅降低功耗，天生更适合生成式AI场景。

今年vivo X100系列拿下天玑9300首发，成为名副其实的“大模型手机”。

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

软件方面，vivo发布了系统级AI助手蓝心小V和AI应用蓝心千询。

蓝心小V和系统深度融合，内嵌于OriginOS 4中，实现了全局智能辅助，具备自然对话、意图理解、智慧搜索、图像智慧处理、图文生成等能力。

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

在vivo X100上已经可以实际体验，蓝心小V不仅可以和用户自然对话、弄清楚复杂脑筋急转弯，还能把照片中的路人一键消除，AI魔法叠满。

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

基于端侧大模型能力，它还可以不联网使用（下载模型），离线总结文档、图生图。

蓝心千询则是以单独APP形式推出，这意味着即便是非vivo手机也能通过应用商店下载使用。

它额外增加了代码能力，能够编写量化框架、Python语言界面，30秒响应。

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

如上就是vivo在大模型方面的一系列布局。

其中，端侧、开发者友好、软硬结合等关键字，在最近的趋势中也得到了验证。

比如最近刚刚发布超强大模型Gemini的谷歌。

消息显示，Gemini的小版本Gemini Nano将搭载于Pixel 8 Pro上。

它将率先带来两个本地化功能，智能总结录音以及输入法智能回复。这些都能离线运行，因此速度和原生感应该都不错。

同时谷歌还推出了AI Core系统服务，支持开发者将Gemini驱动的功能加入到他们开发的应用中。

据了解谷歌还在计划将Gemini Nano纳入整个安卓体系中，高通、三星、联发科的芯片将都能兼容。

大模型撬动手机行业

在大模型爆发元年，如果说有什么行业已经因此发生变革，手机终端必定是其中之一。

这背后是大模型行业和手机行业的双向奔赴。

一方面，手机是众多科技大厂最先想到的落地场景之一。

如谷歌微软这样的科技巨头，都抢先布局端侧小模型。而手机场景之所以受到关注，原因也很明了：

市场方面，在人手一部智能机的时代，大模型成功撬动智能手机行业，则意味着撬动了千亿美元市场。

用户接受方面，以Siri为代表的第一代智能语音助手提前完成了用户教育，大模型无需寻找新的应用形式，可以在此基础直接进行升级革新，提高用户体验同时又能高效落地。

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

另一方面，手机行业在过去半年内也快速行动、积极拥抱大模型，甚至还带动了大模型上终端的新趋势。

最明显代表当属国产厂商了。

下半年开始，几乎每个月都有国产手机厂商官宣大模型相关进展。这种竞争追逐加速行业创新，几个月时间内，端侧可跑通的大模型规模就从几十亿参数飙升至几百亿参数。

不仅是手机厂商发力，高通、联发科也相继推出面向生成式AI时代的旗舰芯片，且性能功效全面大幅提升，给大模型上层应用开发创新创造更多空间。

这种上下游通力合作，也让大模型在手机终端应用落地步伐迈得格外快。

最近有行业观点提出，大模型的真正价值如何，取决于它所撬动的行业价值如何。

结合现状来看，手机行业正在让大模型的价值进一步凸显外化，加速大模型浪潮演进。

正如周围所说：

未来，我们希望利用AI的能力，进一步重构系统，并通过智能手机的普及，携手迈向智能体时代。

vivo周围：大模型技术体验两不误，手机是最好场景 | MEET 2024

AI走进千家万户，重塑手机只是第一步？

你觉得呢？

文章来自于微信公众号“量子位”（ID: QbitAI)，作者 “明敏”

关键词: 手机AI , vivo AI , 手机大模型 , 蓝心大模型

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md