AI点餐在实际使用中最大的痛点,其实不是AI的理解能力。
从游戏公司的画师到电销公司的客服,被AI影响到工作的人在2023年可谓是一茬接着一茬,甚至“第一批因AI而失业的人出现”更是成为了去年部分媒体最有兴趣的话题。事实上,AI技术的快速发展确实已经开始对人类社会造成影响,但过高估计当下AI的能力也大可不必,因为已经有第一批AI员工开始下岗了。
日前,麦当劳方面宣布AI点餐员项目即将终止,这一套与IBM合作的自动点餐系统在测试了3年之后以失败告终。
此前在2021年,麦当劳和IBM合作在全美超过100家麦当劳得来速餐厅开始测试基于AI的自动语音点餐系统。所谓“得来速”指的是drive-thru,这是麦当劳的免下车服务,消费者在车内就可以从麦当劳餐厅取到食物。作为最体现快餐中“快”的销售方式,传统的得来速餐厅是消费者驾车在第一个窗口点餐、在二个窗口付钱,然后在第三个窗口取到餐品后,就可以开车离去。在有了AI技术的介入后,得来速餐厅就能做到一步到位。
其实不仅仅是麦当劳,卡乐星汉堡(Carl's Jr)、Hardee's等美国连锁快餐巨头,也都在积极探索基于AI的自动点餐系统。事实上,餐饮行业是最早一批拥抱AI的传统行业,而美国快餐巨头看中AI的理由,其实就与国内餐厅使用扫码点餐有着相同的底层逻辑,两者都是在劳动力短缺、导致人工成本上涨的大背景,试图用科技来实现“降本增效”。只不过,AI点餐比消费者自己扫码点餐还要更加便捷。
如此便捷的AI点餐,麦当劳为什么又会弃之不用呢?当然是因为不好用。根据美国相关媒体的报道显示,IBM为麦当劳提供的AI点餐技术尚处于初期阶段,其语音识别准确率也只有85%,平均每5个订单中就有一个订单需要人类进行帮助。但遗憾的是,即便IBM的这项技术不那么好用,麦当劳也只能捏着鼻子认了,因为其与IBM关于AI点餐的合作只是两者之间另一个收购案的“余波”。
作为“数字化升级”的一部分,麦当劳方面在2019年就收购了致力于开发“复杂、多语言、多重口音和多项目对话排序技术”的AI语音公司Apprente,并在后者的基础上组建了麦当劳技术实验室(McD Tech Labs)。只可惜,McD Tech Labs的后续表现辜负了麦当劳的期望,以至于在2021年麦当劳与IBM关于AI点餐的合作中,IBM必须收购McD Tech Labs成为了前提条件。
从某种意义上来说,用 “为了一碟醋包一顿饺子”来形容IBM和麦当劳的这一合作是恰如其分的。作为传统餐饮企业的麦当劳搞不定AI,以至于花大价钱买来的McD Tech Labs变成了鸡肋。彼时麦当劳高层的想法或许就是既然自己搞不定,不如将McD Tech Labs卖给IBM、让后者来为自己提供技术支持。只可惜麦当劳没能做到的事情,IBM也没搞定。
事实上,不仅仅是IBM,AI改造餐饮行业运行流程这件事,到目前为止几乎是“巨头的坟场”,多个大厂一头扎进去后却无疾而终。比如,英伟达就在2022年展示了名为NVIDIA Omniverse Avatar系统打造的快捷餐厅 (QSR) ,这一系统将英伟达的语音 AI、计算机视觉、自然语言理解、光线追踪支持的3D图形技术连接起来,并创造了交互式虚拟形象,而这些虚拟形象则可以在顾客根据菜单下单时与顾客聊天、并理解其想法,从而提供交叉销售和追加销售建议,从而在餐厅以及免下车餐厅实现自动点餐。
虽然当年英伟达将QSR描述地可谓是天花乱坠,但结果餐饮行业并不感兴趣,以至于在英伟达官网都没有QSR落地的案例出现。
那么这类技术的问题究竟出现在哪里呢?用AI代替人工来点餐的核心是降本增效,可实际落地之后,却只有成本和效率双双下降。没错,AI技术介入点餐之后普遍带来的是效率下降,因为如今AI对于自然语言的理解迈上新台阶,还是在2022年年末出现的ChatGPT。
大语言模型(LLM)在英伟达、麦当劳做AI点餐项目时还只是个小众概念,ChatGPT相比于Siri等传统的语音助手最大的不同,就是具备多轮对话的能力。传统的AI语音助手几乎是“鱼的记忆”,ChatGPT则可以一直与用户对话,再加上对于情绪更清晰的感知,会让用户以为真的是在与活生生的人对话。可消费者选择快餐、特别是麦当劳得来速餐厅,为的是以最快的速度填饱肚子,此时不智能的AI点餐反而会大幅增加用户的沟通成本,以至于实际效果还不如扫码点餐。
使用了基于AI自动语音点餐系统的得来速餐厅,就经常被消费者吐槽听不懂人话。而且不止是麦当劳,提供智能自助点餐设备和相关服务的餐饮技术创新公司Presto Automation,就曾在去年年末在向美国证券交易委员会提交的一份文件中承认,该公司的自助点餐订单中,有四分之三的订单是由在菲律宾等地工作的异地人工代理协助完成。
AI点餐在实际使用中最大的痛点其实不是AI的理解能力,毕竟在大语言模型的加持下,如今AI理解人类语言的能力与两年前已经有了本质的区别,但是从复杂的声学环境中准确识别目标用户声音的远场拾音技术却没有跟上时代,环境中的本底噪声、混响会导致用户的声音被淹没。没错,现在AI点餐系统不是不理解用户说什么,而是压根听不清用户的声音,以至于还需要人工频繁地介入。
既然要人工频繁介入,AI点餐的意义又在哪里呢。最终,美国的部分餐饮商家搞出了“替代疗法”,就是直接将收银点餐外包给拥有大量英语人口的海外区域,再借助在线会议工具ZOOM的实时通讯来进行视频点餐。
文章来源于“三易生活”,作者“三易菌”