ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
为了在AI时代做好“AI助手”,vivo做了哪些努力?
4633点击    2024-11-05 15:17


在当今科技飞速发展的时代,人工智能(AI)无疑是最具变革性的力量之一。从智能语音助手到图像识别技术,AI 已经渗透到我们生活的方方面面。


在智能手机领域,AI 的应用更是成为了各大厂商竞争的焦点。


布局


vivo 作为一家在智能手机领域具有重要影响力的厂商,早在2017年6月就已经成立了 AI 研发中心,启动了人工智能相关研究。


在2018年3月,vivo 发布了首款搭载人工智能语音助手 Jovi 的 vivo X21,并正式成立了 vivo AI 全球研究院,副总裁周围出任研究院院长,开始了在 AI 领域的探索之旅。


vivo X21 图源:vivo


当时 vivo 判断,人工智能、芯片和 5G 通讯,是未来几十年科技创新的底层技术,vivo 想要在未来继续保持行业第一梯队的位置,就一定要在这些技术上面成为深度参与者。


vivo 迅速确立了一份3到5年的中长期发展战略规划,并将在全球范围聘请 AI 专家。研究院的成立为 vivo 汇聚了大量的 AI 人才,到2019年时,vivo 已经拥有超过1000名 AI 工程师,为后续的技术研发奠定了坚实的基础。


积累


在组建队伍后,vivo 开始在 AI 技术研发上加大投入。


2019年,vivo 推出了自己的“智慧”手机,周围也总结出了“三自三全” 的理念,即自学习、自建议、自索引,全交互、全场景和全连接,展示了 vivo 对 AI 在手机应用上的初步探索。


随着技术的不断发展,大模型的出现成为了 AI 领域的“奇点”。


在2023年,vivo 对外公布了自研通用大模型矩阵“蓝心大模型”,该矩阵涵盖了10亿、70亿、700亿、1300亿、1750亿等不同参数量级的模型,分别在不同场景下用于处理不同的任务,如自然语意理解、文本摘要扩写、多维度内容生成以及复杂逻辑推理等。


蓝心大模型矩阵 图源:vivo


这些模型不仅在各大专业机构的综合评分中名列前茅,更标志着 vivo 在 AI 底层技术上取得了重大突破,为其在 AI 应用层面的创新提供了强大的支撑。


重构


手机作为连接数字世界的桥梁,完全有机会打造成为用户的个人专属智能管家。基于这个认知,vivo 开展了一系列工作。


vivo 副总裁、OS 产品副总裁、AI 全球研究院院长周围认为,手机智能管家应具备五个特点:首先,要能感知识别用户意图;其次,要能形成共同记忆;第三,是具备部分场景下替代用户的决策能力;第四,要能像人一样懂得如何操作手机里的众多应用;第五,要能像助理一样管理日常事务。vivo 正是基于这些特点在推进手机端 AI 研发的相关工作。


2023年11月初,在 ChatGPT 3.5 正式发布的前夕,深度融合蓝心大模型的 OriginOS 4 预览版与用户见面,通过“蓝心小V”应用展示了 vivo 在 AI 大模型上的应用成果。


而前段时间刚刚发布的 OriginOS 5 则更进一步,不仅局限于在系统中增加 AI 功能点,而是将整套系统基于蓝心大模型进行重构,让 AI 在这套操作系统中变得无处不在,更好地服务用户,让手机在现实生活中发挥更高效、简单、主动、智能的作用。


图源:硅星人


这一转变体现了 vivo 从单纯的功能添加到系统级重构的进化,标志着 vivo 在 AI 应用上进入了一个新的阶段。


在未来一到三年内,vivo 将基于用户需求和应用场景,提供更多实际价值。


创新


从80年代到现在,每一代伟大的产品在交互上都形成了巨大的变革。


iPhone 的电容屏,让用户从用指甲盖变成用指尖去操作,多点触控也让用户在放大、缩小图片时不需要点按相应的按钮,而是使用双指张开或并拢。这些看起来微乎其微的差距,带来的其实是巨大的交互转变,后来的语音助手 Siri 亦是如此。


在 AI 技术的应用中,vivo 也十分注重构符合用户直觉的交互方式。在 OriginOS 5 中,vivo 采用大量长按、圈选、拖放的交互逻辑,构建了一种新的交互规则。


在10月30日举办的硅星人 2024 AI 创造者大会上,vivo 副总裁、OS 产品副总裁、AI 全球研究院院长周围表示:“vivo 的人工智能团队有千人左右模型,手机的软件团队也大概是1000多人在做应用和创意。2000人的团队对于我们接下来要做得这么大的工作来说还是太渺小了,所以我们肯定要和行业先进的合作伙伴共创共建。”


图源:硅星人


周围深刻的认识到,对于“让手机成为专属私人助理”这一理念来说,vivo 只靠自己是远远不够的。为了实现更好的垂类模型体验,vivo 的目标是创建一个大模型“广场”,与行业中在各自领域内的专业团队展开深度合作,目前百度、阿里、字节、智谱都是 vivo 的深度合作伙伴。


探索


在2024年的开发者大会上,vivo 对未来 AI Phone 应该长什么样子,做出了自己的解读,却很少对外公布大模型迭代的进度。


一年的时间里,vivo 技术团队的工作重点主要扑在搭框架、做基建,做好意图、智能体平台、感知与决策、记忆和自动执行。其实这里每一个关键词都代表着一个大团队至少做了一年的努力,但是因为目前对用户没有实际的意义和帮助,所以 vivo 对外说得比较少。


但 vivo 也对外展示了一些“小成品”。


比如为了解决传统大模型无法做到像人一样的操作手机,在2024年开发者大会上,vivo 对外展示了名为「Phone GPT」的一款全新的智能体,它可以在接到指令后像人一样的操作 App,搜索对应的商家,自动拨打客服电话,用 AI 拟人语音的形式完成订座指令,整个过程全部在前台完成,无需调用任何三方应用的接口即可实现。


PhoneGPT 图源:不客观实验室


在未来,vivo 将会围绕框架和基建持续深耕,在研发的过程中会涌现出一批类似「PhoneGPT」一样的明星级产品,为用户带来了更加便捷的体验。


挑战


尽管 vivo 在 AI 技术研发上取得了不少成果,但在用户需求的把握上仍然面临挑战。


AI 技术的发展带来最大的“挑战”,就是一系列伦理和隐私问题。而在探讨伦理问题时,价值观是首要考量因素。


vivo 研发蓝心大模型的愿景,就在于打造一个最能理解中国人的大模型,这就要求知识供给必须契合中国文化,并且价值观要与中国文化完全相符。基于此愿景,vivo 开展了一系列工作,包括完整的训练数据建设、数据清洗以及审核流程。


值得一提的是,vivo 在审核方面所具备的能力在行业内具有独特性。vivo 不仅自行建立了审核能力,所采用的审核模型更是达到了百亿级别,更为关键的是,vivo 将审核模型实现了端侧化。


周围表示,在全球范围内尚无其他公司能够做到这一点。“如果审核未能实现端侧化,那么所谓的端侧化就是不完整的。”


vivo 很早便察觉到这一问题的重要性,并对其怀有敬畏之心,进而开展了一系列与之相关的能力建设工作。


总结


从早期的战略布局伊始,历经技术沉淀积累以及模型研发探索,进而迈向系统重构与应用创新的新阶段,vivo 在 AI 领域已然斩获诸多成果。


在此过程中,vivo 并非一帆风顺,同样面临着诸如用户需求难以精准把握、技术竞争压力与日俱增、伦理和隐私问题错综复杂等一系列挑战。


尽管如此,vivo 凭借持续创新的精神、不断深化的合作伙伴关系、积极拓展的应用场景以及对行业标准制定的推动,仍然有望在AI领域维持领先优势。


这不仅将为用户呈上更为智能、便捷的手机使用体验,还会为整个手机行业的AI应用发展贡献自身的力量,开启智能手机与AI融合的新篇章,最终实现 AI Phone 成为“个人专属智能管家”并惠及所有用户的美好愿景。


文章来自于“硅星人Pro”,作者“陆”。


关键词: AI , AI手机 , AI助手 , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md