没那么简单。
虽然在 2023 年,OpenAI 已经在移动端推出了 App 版的 ChatGPT,可以让用户在手机上更方便地使用 ChatGPT 的对话服务,年底的时候还宣布 App 版上的语音功能已经免费开放给所有用户。
但又必须得说,作为一个「AI 助手」,ChatGPT 在手机上还是不够方便,不信你比较下手机自带的语音助手,通常是一键、一划、一呼就能呼出进行对话,肯定要比打开 ChatGPT App、点击语音或者输入框进行输入来得方便。
OpenAI 也看到了这一点。
在上个月,也就是 2023 年 12 月更新的 1.2023.352 版本中,Android 端的 ChatGPT 添加了「com.openai.voice.assistant.AssistantActivity」的新活动,直接指向了 Android 系统的语音助手功能。此外,该版本还加入了一系列的相关代码和信息。
虽然上述的新活动还没有正式启用,就算强行启用,也只会出现尚未完成的动画,然后……就没有然后了。但毫无疑问,OpenAI 不可能无缘无故加入这些代码和信息。
图/ Android Authority
不出意外,我们在不久后就会看到 Android 端的 ChatGPT 将可以设置为「默认助理应用」,用户通过平时呼出系统自带助手的方式,比如长按电源键或是手势操作就能呼出 ChatGPT,并直接进行语音对话。
从这个角度来看,留给谷歌助理、苹果 Siri 以及 OPPO 小布等手机 AI 助手的时间不多了……吗?
OpenAI 最早在 2022 年 11 月底上线了网页端的 ChatGPT,很快就在科技圈掀起了一轮「旋风」,其中最核心的一点在于强大的自然语言理解能力,通俗来讲就是:听得懂人话,说得了人话。
紧接着,ChatGPT 引发的浪潮愈演愈烈,席卷了从各国政府到各个行业,仅两个月后的月活用户就突破了 1 亿大关。与此同时,无数人也看到了 ChatGPT 背后大模型技术的广泛应用前景,大模型层出不穷,应用层也在进行寻找和探索。
手机 AI 助手就是最早被看到的机会之一。
3 月,微软 CEO 萨蒂亚·纳德拉就对英国《金融时报》吐槽,苹果的 Siri、亚马逊的 Alexa,微软自家的 Cortana(中文名:小娜)以及公认拔尖的 Google Assistant,这些语音助手有一个算一个:
都笨得跟石头一样。
纳德拉,图/微软
Siri 的联合创始人 Adam Cheyer 也承认,ChatGPT 理解复杂信息的能力让现有的语音助手看起来很蠢。这是问题,也是机会。
年初我们就在《ChatGPT 能让 Siri 和小爱同学变聪明吗?》一文中介绍了一些个人开发者的尝试——将小爱同学、Siri 等常用手机助手接入 ChatGPT,当时我们也作出了判断:巨头的入场,不远了。
到下半年,手机厂商陆续在大版本系统升级中加入了大模型加持的小艺(华为)、小布(OPPO)、小爱(小米)、小 V(vivo),谷歌正在开发本地接入 Gemini 大模型的谷歌助理。就连「一向不赶时髦」的苹果,也被传出正在将生成式 AI 整合到 Siri 中,预计将在今年 WWDC 上正式亮相。
趋势来了,挡也挡不住,顺势而上才是王道。
图/ OPPO
但另一个问题是,算力更强、更「聪明」的 ChatGPT(OpenAI)、Copilot(微软)、文心一言(百度),还有更多类 ChatGPT 的 AI 对话服务总归也要面对同一波的趋势。
在 Google Play 上,ChatGPT 的下载量早就超过了 1000 万次,评分有 4.7,在 App Store 的评分更是 4.9。高评分的背后,是大部分用户的好评、认可,更是 GPT-3.5/4 在模型输出质量上的水平体现。
图/苹果
相比之下,手机厂商虽然普遍开始在系统自带 AI 助手上接入云端、端侧大模型,但用户评价并不高,在逻辑推理、语言理解等各方面的能力都较弱。
实际上,厂商也不可能去训练和采用太大参数规模的模型,核心是成本太高又很难建立合理的收费模式。试想一下,ChatGPT、文心一言等可以采用订阅收费的方式,但系统自带 AI 助手很难说服用户付费订阅,甚至容易引起声讨。
换言之,手机厂商自己的 AI 助手,很难和 ChatGPT 比「智能」。但手机厂商也有自己很大的优势。
我们之前就多次谈过「端侧大模型上机(手机、PC)」的必然趋势,比如在《重新定义智能手机,大模型会是手机厂商的伪命题吗?》中就指出:
端侧大模型的数据处理都在端侧,用户的个人数据将不会上传至云端服务器,用户才会放心将数据交给 AI 去学习,这才能为手机 AI 助手真正成为个人助理提供了先决条件。
其次,虽然在 Android 上谷歌很早就向第三方开放了语音助手的权限,用户可以将第三方语音助手,如微软小娜、三星 Bixby 等设置为默认语音助手,可以很方便地呼出,但实际上第三方应用获得的权限、接口还是无法与自带的谷歌助理相比。
图/ Gadget Hacks
换言之,ChatGPT 就算后续支持设置为默认语音助手,实际在系统层面的影响力可能还是有限,无法像自带 AI 助手通过指令对系统进行一系列的操作,比如语音跳转导航、提醒事项等。或许,ChatGPT 能够得到最大的好处也就是可以更便捷的呼出了,这当然也很关键,但始终很难借此成为用户真正的「数字助理」。
而这还是「最开放」的谷歌,苹果和 OPPO、华为、小米等国产厂商,更不会在系统层面开放给类似 ChatGPT 等第三方应用。去年 WWDC 上,苹果宣布用户呼出 Siri 不用再「Hey Siri」,只要说「Siri」就行了;国产手机厂商过去几年也在不断降低自带 AI 助手的使用门槛,加入更多的功能。
在手机这片江湖中,过江龙还是很难直面地头蛇。
当然了,科技行业的颠覆往往不是从中心,而是从边缘发起的。
图/ OpenAI
1 月 5 日,The Verge 拿到一份发自 OpenAI 的邮件显示,酝酿已久的 GPT 商店将于下周正式上线,GPTs 的开发者们届时可以上架「售卖」自己的 GPT(基于 GPT-4),从中获利。(关于 GPTs 计划,这里可以参见雷科技文章《ChatGPT 的 2023:开创人工智能的新纪元》,其中就一部分介绍。)
再加上 ChatGPT 已有的插件生态,你很难说这会不会是又一次「App Store 式」的变革,并且颠覆现有的计算系统:
到时候可能就是降维打击了。
CES(美国拉斯维加斯国际消费类电子产品展览会) 2024即将盛大开幕,雷科技将派出“一位天明”领衔的报道团赴美国·内华达州·拉斯维加斯 CES 2024现场全程报道,敬请关注。
文章来自于36氪 “雷科技”
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md