在当今科技飞速发展的时代,人工智能(AI)无疑是最具变革性的力量之一。从智能语音助手到图像识别技术,AI 已经渗透到我们生活的方方面面。
在智能手机领域,AI 的应用更是成为了各大厂商竞争的焦点。
vivo 作为一家在智能手机领域具有重要影响力的厂商,早在2017年6月就已经成立了 AI 研发中心,启动了人工智能相关研究。
在2018年3月,vivo 发布了首款搭载人工智能语音助手 Jovi 的 vivo X21,并正式成立了 vivo AI 全球研究院,副总裁周围出任研究院院长,开始了在 AI 领域的探索之旅。
vivo X21 图源:vivo
当时 vivo 判断,人工智能、芯片和 5G 通讯,是未来几十年科技创新的底层技术,vivo 想要在未来继续保持行业第一梯队的位置,就一定要在这些技术上面成为深度参与者。
vivo 迅速确立了一份3到5年的中长期发展战略规划,并将在全球范围聘请 AI 专家。研究院的成立为 vivo 汇聚了大量的 AI 人才,到2019年时,vivo 已经拥有超过1000名 AI 工程师,为后续的技术研发奠定了坚实的基础。
在组建队伍后,vivo 开始在 AI 技术研发上加大投入。
2019年,vivo 推出了自己的“智慧”手机,周围也总结出了“三自三全” 的理念,即自学习、自建议、自索引,全交互、全场景和全连接,展示了 vivo 对 AI 在手机应用上的初步探索。
随着技术的不断发展,大模型的出现成为了 AI 领域的“奇点”。
在2023年,vivo 对外公布了自研通用大模型矩阵“蓝心大模型”,该矩阵涵盖了10亿、70亿、700亿、1300亿、1750亿等不同参数量级的模型,分别在不同场景下用于处理不同的任务,如自然语意理解、文本摘要扩写、多维度内容生成以及复杂逻辑推理等。
蓝心大模型矩阵 图源:vivo
这些模型不仅在各大专业机构的综合评分中名列前茅,更标志着 vivo 在 AI 底层技术上取得了重大突破,为其在 AI 应用层面的创新提供了强大的支撑。
手机作为连接数字世界的桥梁,完全有机会打造成为用户的个人专属智能管家。基于这个认知,vivo 开展了一系列工作。
vivo 副总裁、OS 产品副总裁、AI 全球研究院院长周围认为,手机智能管家应具备五个特点:首先,要能感知识别用户意图;其次,要能形成共同记忆;第三,是具备部分场景下替代用户的决策能力;第四,要能像人一样懂得如何操作手机里的众多应用;第五,要能像助理一样管理日常事务。vivo 正是基于这些特点在推进手机端 AI 研发的相关工作。
2023年11月初,在 ChatGPT 3.5 正式发布的前夕,深度融合蓝心大模型的 OriginOS 4 预览版与用户见面,通过“蓝心小V”应用展示了 vivo 在 AI 大模型上的应用成果。
而前段时间刚刚发布的 OriginOS 5 则更进一步,不仅局限于在系统中增加 AI 功能点,而是将整套系统基于蓝心大模型进行重构,让 AI 在这套操作系统中变得无处不在,更好地服务用户,让手机在现实生活中发挥更高效、简单、主动、智能的作用。
图源:硅星人
这一转变体现了 vivo 从单纯的功能添加到系统级重构的进化,标志着 vivo 在 AI 应用上进入了一个新的阶段。
在未来一到三年内,vivo 将基于用户需求和应用场景,提供更多实际价值。
从80年代到现在,每一代伟大的产品在交互上都形成了巨大的变革。
iPhone 的电容屏,让用户从用指甲盖变成用指尖去操作,多点触控也让用户在放大、缩小图片时不需要点按相应的按钮,而是使用双指张开或并拢。这些看起来微乎其微的差距,带来的其实是巨大的交互转变,后来的语音助手 Siri 亦是如此。
在 AI 技术的应用中,vivo 也十分注重构符合用户直觉的交互方式。在 OriginOS 5 中,vivo 采用大量长按、圈选、拖放的交互逻辑,构建了一种新的交互规则。
在10月30日举办的硅星人 2024 AI 创造者大会上,vivo 副总裁、OS 产品副总裁、AI 全球研究院院长周围表示:“vivo 的人工智能团队有千人左右模型,手机的软件团队也大概是1000多人在做应用和创意。2000人的团队对于我们接下来要做得这么大的工作来说还是太渺小了,所以我们肯定要和行业先进的合作伙伴共创共建。”
图源:硅星人
周围深刻的认识到,对于“让手机成为专属私人助理”这一理念来说,vivo 只靠自己是远远不够的。为了实现更好的垂类模型体验,vivo 的目标是创建一个大模型“广场”,与行业中在各自领域内的专业团队展开深度合作,目前百度、阿里、字节、智谱都是 vivo 的深度合作伙伴。
在2024年的开发者大会上,vivo 对未来 AI Phone 应该长什么样子,做出了自己的解读,却很少对外公布大模型迭代的进度。
一年的时间里,vivo 技术团队的工作重点主要扑在搭框架、做基建,做好意图、智能体平台、感知与决策、记忆和自动执行。其实这里每一个关键词都代表着一个大团队至少做了一年的努力,但是因为目前对用户没有实际的意义和帮助,所以 vivo 对外说得比较少。
但 vivo 也对外展示了一些“小成品”。
比如为了解决传统大模型无法做到像人一样的操作手机,在2024年开发者大会上,vivo 对外展示了名为「Phone GPT」的一款全新的智能体,它可以在接到指令后像人一样的操作 App,搜索对应的商家,自动拨打客服电话,用 AI 拟人语音的形式完成订座指令,整个过程全部在前台完成,无需调用任何三方应用的接口即可实现。
PhoneGPT 图源:不客观实验室
在未来,vivo 将会围绕框架和基建持续深耕,在研发的过程中会涌现出一批类似「PhoneGPT」一样的明星级产品,为用户带来了更加便捷的体验。
尽管 vivo 在 AI 技术研发上取得了不少成果,但在用户需求的把握上仍然面临挑战。
AI 技术的发展带来最大的“挑战”,就是一系列伦理和隐私问题。而在探讨伦理问题时,价值观是首要考量因素。
vivo 研发蓝心大模型的愿景,就在于打造一个最能理解中国人的大模型,这就要求知识供给必须契合中国文化,并且价值观要与中国文化完全相符。基于此愿景,vivo 开展了一系列工作,包括完整的训练数据建设、数据清洗以及审核流程。
值得一提的是,vivo 在审核方面所具备的能力在行业内具有独特性。vivo 不仅自行建立了审核能力,所采用的审核模型更是达到了百亿级别,更为关键的是,vivo 将审核模型实现了端侧化。
周围表示,在全球范围内尚无其他公司能够做到这一点。“如果审核未能实现端侧化,那么所谓的端侧化就是不完整的。”
vivo 很早便察觉到这一问题的重要性,并对其怀有敬畏之心,进而开展了一系列与之相关的能力建设工作。
从早期的战略布局伊始,历经技术沉淀积累以及模型研发探索,进而迈向系统重构与应用创新的新阶段,vivo 在 AI 领域已然斩获诸多成果。
在此过程中,vivo 并非一帆风顺,同样面临着诸如用户需求难以精准把握、技术竞争压力与日俱增、伦理和隐私问题错综复杂等一系列挑战。
尽管如此,vivo 凭借持续创新的精神、不断深化的合作伙伴关系、积极拓展的应用场景以及对行业标准制定的推动,仍然有望在AI领域维持领先优势。
这不仅将为用户呈上更为智能、便捷的手机使用体验,还会为整个手机行业的AI应用发展贡献自身的力量,开启智能手机与AI融合的新篇章,最终实现 AI Phone 成为“个人专属智能管家”并惠及所有用户的美好愿景。
文章来自于“硅星人Pro”,作者“陆”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md