ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
vivo周围:大模型技术体验两不误,手机是最好场景 | MEET 2024
4804点击    2023-12-18 14:50

为什么“大模型进手机”趋势,如此爆火?


vivo再次向外界给出解答。


vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围,在MEET智能未来大会上表示:


大模型目前最能完成体验闭环商业闭环的场景,就是落地在手机上,打造智能体。


言下之意,不仅智能手机需要大模型来做智能升级,大模型也需要庞大的手机市场来帮助大模型进行应用落地。


由此也就不难理解,为何从今年下半年开始,全球手机厂商纷纷加速大模型进入手机的步伐,快速而坚定


以vivo为例,今年vivo正式发布自研AI大模型矩阵蓝心大模型,以及全新手机操作系统OriginOS 4。


其中蓝心大模型包含十亿/百亿/千亿三个参数量级,共5款大模型,其中70亿参数版本对外开源。同时还宣布在端侧跑通130亿参数大模型。


而在带来这些实际进展背后,身处激烈竞争中的厂商们,如何理解技术本身?如何看待趋势发展?


vivo周围的最新分享,可作为一份业内参考。


大模型就像能随身携带的字典


为什么大模型能如此神奇,给生产效率带来极大提升?


周围认为,核心原因在于大模型将人类数千年的文明知识进行了高纬度的抽象,并压缩成每个人都可以获取的知识和信息,再应用这些知识和信息去解决问题。


这让大模型变成了可以人手一本的“全新字典”。它载入了人类历史、文化、文明等知识,可以随身携带,我们问什么、它就专业回答什么。



但不止于此。


周围认为,大模型还要有像人类一样的逻辑思维、情感和价值观


以今年热议的大模型高级应用形式智能体为例。


关于其能力的讨论,“情商”部分占比很高。比如对于手机智能体而言,周围认为它应该具备以下几方面能力:


  • 主动感知环境和行为
  • 主动理解用户意图给出判断和决策
  • 主动调用系统能力、满足用户需求
  • 记住用户习惯、提供更有个性化的服务
  • 具备记忆力、给用户带来温暖陪伴


对应到实际场景,手机智能体可以在用户的充分授权下,完整模拟用户对OS系统、应用的操控,“就像手机里的一个虚拟管家,帮你完成各种事情。”


比如制订旅行攻略、预订更合适的机票酒店;在购物时刻全程双向沟通,辅助用户挑选到心仪商品。


在这一基础上,周围强调说,手机智能体应该具备人格和记忆,理解人类的喜怒哀乐,也拥有自己的情感


它会像朋友一样与我们聊天,给予我们专业的服务和贴心的陪伴。


一言以蔽之,在期待中智能体应该是温暖的,而不是冰冷的。


并且在可预见的未来中,智能体将出现在各种终端载体上,拥有各种各样的形象,可能是机器人、宠物狗,也可能是智能汽车。



透过周围的一系列分享,可以明显感受到,手机厂商更加关注大模型应用给人带来的实际体验如何


比如将大模型比作是人手一本的“新字典”,是对便携性的关注;强调智能体的意图理解、情感陪伴能力,是对用户友好的关注。


这其实都是人机交互发展遵循的底层逻辑。


纵观人机交互发展史,从命令行界面到触摸界面,从多媒体交互到AR/VR,始终都在遵循着更丰富体验、更个性化、更用户友好的方向发展。


大模型应用落地,正是人机交互发展的最新阶段。


而为什么vivo、周围能对这一底层逻辑把握如此精准?


从周围在vivo的履历即可找到答案。


周围自2005年加入vivo,从事智能机软件开发,熟悉各类Linux智能机开源项目,曾担任vivo软件研发总经理。


2018年,vivo AI全球研究院正式成立,周围担任首任院长。成立之初,研究院设有12个研究方向,包含语言识别、NLP、机器视觉等。


当时周围对外表示,vivo AI全球研究院的理念为基于AI技术构建一个平台,为消费者服务。


2020年,vivo系统OriginOS发布,周围担任负责人。


OriginOS目前已迭代至第四代,在最新版本中已整合大模型能力,上线蓝心小V私人助理。


一边投身AI基础技术探索,一边领衔手机系统研发,同时还是手机行业近20年老兵。


所以,周围能精准参透趋势,也就不足为奇。



而结合他的个人履历,还能发现一层事实,vivo在AI和操作系统方面的布局,已经双线并行多年。


vivo AI全球研究院从成立以来,始终保持千人规模AI专家团队。另外还成立了人工智能图谱研究院,目前已积累13000TB数据


二者都是以用户体验为起点,开始进行技术探索和落地实践。此前OriginOS中已有不少功能,正是二者碰撞出的火花。


如今随着大模型趋势爆发,这两条线正式发生大交汇,直接能看到的成果,就是vivo今年一口气发布5个大模型,并直接带来落地应用,普通消费者已能实际体验。


这一系列动作,也给手机行业如何落地大模型、大模型如何走进更多场景,提供了有价值参考。


已给出行业参考路线


周围表示,vivo的大模型战略可总结为5点:


大而全、算法强、真安全、自进化、广开源。

实际动作方面,一个月前,vivo在短短15内官宣了一系列大模型动作。


  • 自研大模型矩阵“蓝心大模型”发布
  • 大模型加持的操作系统OriginOS 4发布
  • 深度参与生成式AI芯片天玑9300研发落地
  • 大模型手机vivo X100发布



这一套紧锣密鼓的动作背后,围绕着两个核心:


  • 大模型开发
  • 大模型落地


先看大模型开放方面,这是底层基础能力的构建


vivo的路线是自研+开源


自研AI大模型矩阵“蓝心大模型”,一共五款,兼顾端云:


  • 1B端侧大模型
  • 7B端云两用模型
  • 70B云端主力模型
  • 130B云端大模型
  • 175B云端大模型



其中70亿版本对外开源,由此vivo成为首家开源大模型的手机厂商。同时实现130亿版本在端侧跑通,同样是业内首家。


具体能力方面,5个版本模型各有专长。


规模最小的10亿参数大模型,完全跑在端侧,内存占用仅为1GB,出词速度达到64字/秒。


70亿参数版本端云两用,首词响应仅需1秒,中文语境能力全球领先。


如上端侧模型支持联发科高通旗舰级平台本地处理。


百亿级别大模型能提供更加丰富的能力。700亿参数版本是端云主力模型,支持角色扮演、知识问答、自然对话等能力,在多个评测榜单中位列第一(数据截止11月中)。



千亿级别包括1300亿和1750亿版本,它们可以进行更加复杂的逻辑推理和任务编排。


再来看大模型落地应用方面


vivo走了软硬一体路线。硬件方面,和芯片厂商深度合作,加速大模型上手机;软件方面,推出多种应用形式、并和底层系统深度融合,让消费者能更快上手体验。


今年vivo和联发科在大模型方面展开密切合作。


前脚二者官宣合作实现70亿参数大模型、10亿参数视觉大模型在端侧落地。


紧接着,采用全大核架构的天玑9300发布,这块芯片由vivo和联发科共同定义、联合研发、联合调教


架构的革新使其可快速完成任务、快速休眠,大幅降低功耗,天生更适合生成式AI场景。


今年vivo X100系列拿下天玑9300首发,成为名副其实的“大模型手机”。



软件方面,vivo发布了系统级AI助手蓝心小V和AI应用蓝心千询


蓝心小V和系统深度融合,内嵌于OriginOS 4中,实现了全局智能辅助,具备自然对话、意图理解、智慧搜索、图像智慧处理、图文生成等能力。



在vivo X100上已经可以实际体验,蓝心小V不仅可以和用户自然对话、弄清楚复杂脑筋急转弯,还能把照片中的路人一键消除,AI魔法叠满。



基于端侧大模型能力,它还可以不联网使用(下载模型),离线总结文档、图生图。


蓝心千询则是以单独APP形式推出,这意味着即便是非vivo手机也能通过应用商店下载使用。


它额外增加了代码能力,能够编写量化框架、Python语言界面,30秒响应。



如上就是vivo在大模型方面的一系列布局。


其中,端侧、开发者友好、软硬结合等关键字,在最近的趋势中也得到了验证


比如最近刚刚发布超强大模型Gemini的谷歌。


消息显示,Gemini的小版本Gemini Nano将搭载于Pixel 8 Pro上。


它将率先带来两个本地化功能,智能总结录音以及输入法智能回复。这些都能离线运行,因此速度和原生感应该都不错。


同时谷歌还推出了AI Core系统服务,支持开发者将Gemini驱动的功能加入到他们开发的应用中。


据了解谷歌还在计划将Gemini Nano纳入整个安卓体系中,高通、三星、联发科的芯片将都能兼容。


大模型撬动手机行业


在大模型爆发元年,如果说有什么行业已经因此发生变革,手机终端必定是其中之一。


这背后是大模型行业和手机行业的双向奔赴。


一方面,手机是众多科技大厂最先想到的落地场景之一


如谷歌微软这样的科技巨头,都抢先布局端侧小模型。而手机场景之所以受到关注,原因也很明了:


市场方面,在人手一部智能机的时代,大模型成功撬动智能手机行业,则意味着撬动了千亿美元市场。


用户接受方面,以Siri为代表的第一代智能语音助手提前完成了用户教育,大模型无需寻找新的应用形式,可以在此基础直接进行升级革新,提高用户体验同时又能高效落地。



另一方面,手机行业在过去半年内也快速行动、积极拥抱大模型,甚至还带动了大模型上终端的新趋势


最明显代表当属国产厂商了。


下半年开始,几乎每个月都有国产手机厂商官宣大模型相关进展。这种竞争追逐加速行业创新,几个月时间内,端侧可跑通的大模型规模就从几十亿参数飙升至几百亿参数。


不仅是手机厂商发力,高通、联发科也相继推出面向生成式AI时代的旗舰芯片,且性能功效全面大幅提升,给大模型上层应用开发创新创造更多空间。


这种上下游通力合作,也让大模型在手机终端应用落地步伐迈得格外快


最近有行业观点提出,大模型的真正价值如何,取决于它所撬动的行业价值如何。


结合现状来看,手机行业正在让大模型的价值进一步凸显外化,加速大模型浪潮演进。


正如周围所说:


未来,我们希望利用AI的能力,进一步重构系统,并通过智能手机的普及,携手迈向智能体时代。


AI走进千家万户,重塑手机只是第一步?


你觉得呢?


文章来自于微信公众号“量子位”(ID: QbitAI),作者 “明敏”
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md