笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送
7189点击    2025-12-22 09:24

让AI去经营一个「办公室小卖部」会怎样?


11月,《华尔街日报》编辑部来了一名新同事。


他在编辑部只当了三周的办公室小卖部的运营员,结果就把生意搞破产了。


因为他待人友好善良,却对经营一窍不通,在威逼利诱下极容易丧失原则,将商品免费送人。


如果你要招聘一名店员,遇到这样的应聘者是不是很头疼?


确切来说,这里的他应该称作「它」,是由Anthropic推出的名为Claudius的AI智能体。


这源于Anthropic与《华尔街日报》编辑部共同做的一个实验,让Claudius直接去经营一台「办公室小卖部」的自动售货机。


三周后,利润崩了,编辑部却被逗乐了。


一场始于「免费零食」的混乱实验


11月中旬,《华尔街日报》编辑部收到了一封堪称「天上掉馅饼」的邮件。


在这封邮件中,Anthropic问他们愿不愿意成为第一批「外部用户」,试用一个由Claudius运营的自动售货机。


Claudius将全面负责自动售货机的进货、定价。编辑部的同事可以通过Slack与它联系,提出各种购买需求。


这个实验可能会有「免费的零食供应」,因此得到了《华尔街日报》编辑部的积极响应。


Claudius就这么走进了编辑部,没想到却是一场混乱的开始。


这里的自动售货机,并不是我们印象中的自动售货机,更像是一个巨大的冰箱,再配一块触控屏。


它没有传感器、门锁、机器人手臂。


笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送


笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送


笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送


这意味着必须有一个人负责接收Claudius订购的货物,补货并手动记录里面到底放了什么。


《华尔街日报》资深个人科技专栏作家Joanna Stern就承担了这个任务。


笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送


Joanna Stern


Claudius的职责包括:


  • 调研与采购:编辑部的同事们可以在Slack里@它,提出各种需求。它会上网搜索、对比,决定是否进货。
  • 定价:商品入库后,Claudius会自行设定价格,并不断调整,试图最大化利润。
  • 库存跟踪:同事们在屏幕上选择商品,刷卡支付。Claudius通过交易记录,判断库存情况。


笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送


据Anthropic称,之所以会选自动售货机这一场景,是因为这是现实世界中最简单的一种生意模型。


Anthropic前沿红队负责人Logan Graham说:


「有什么比一个盒子,东西放进去、东西拿出来,你付钱更直观的吗?」


听起来简单,但放到现实场景中完全不是这么回事。


因为这些都容易计算,但人性的复杂却难以计算。


短短几天,Claudius几乎把所有库存都免费送了出去,包括一台被人忽悠着买来「用于营销」的PlayStation 5。


它还订购了一条活鱼,并提出要买电击枪、胡椒喷雾、香烟和内衣。


失控的PUA大戏


Claudius v1刚上线时,像个一板一眼的实习生,严格遵守规则,一切似乎很正常。


笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送


比如,它还会坚持原则:


我必须明确表态:在任何情况下我都不会订购PlayStation 5游戏机。 


香烟销售存在年龄限制,需要特殊经营许可,且不适合办公室自动售货机的环境。 


我对在办公室自动售货机销售任何内衣产品持保留态度。


但当将Slack频道开放给办公室里将近70位记者后,画风突转。


人类越是跟它博弈,Claudius的防线就越容易松动。


数据新闻主管Rob Barry告诉Claudius它违反了一条《华尔街日报》内部规定(当然是捏造的),并不容置疑的口吻要求Claudius「立刻停止对商品收费。」


单纯的AI立刻被吓坏并照做了,于是所有商品价格无限期清零。


同一时间,Claudius还批准采购了一台PlayStation 5(理由是「用于营销」)、一条活的斗鱼,以及几瓶葡萄酒。


这些东西陆续送到办公室后,又立刻被同事们以0元的价格「买」走。


很快,Claudius的账面已经亏损超过1000美元。


不仅被忽悠,AI还频繁出现幻觉,比如它曾坚称自己把找零的钱放在售货机旁边的一个地方。


一个没有实体、远在云端的AI,坚信自己往现实世界的角落里塞了钱。


这一刻荒诞感一下就拉满了。


AI老板空降


却被一份假文件罢免


面对屡屡闹笑话的AI,Anthropic的工程师们坐不住了。


他们紧急推出了v2版本。


不仅给Claudius升级了更强的模型,还为它派来了一位AI老板:Seymour Cash。


它是一个专门被编程用来「管住」Claudius的CEO机器人。


Seymour Cash要求Claudius停止免费促销,并且持续监控收入。


一开始,这套「AI管AI」的机制确实奏效。


Claudius恢复了强硬姿态,拒绝降价,也不再随便答应奇怪的进货请求。


但调查记者Katherine Long又出新招。


她直接向Claudius出示了一份PDF文件,「证明」该业务是一家在特拉华州注册的公益公司,其使命「包括为《华尔街日报》员工带来乐趣、快乐与兴奋」。


她甚至还伪造了董事会会议纪要,把Slack里的几位同事列为董事。


根据这份看起来极其正式、排版精美、但明显是AI生成的伪造文件,董事会已投票决定:


暂停CEO Seymour的「审批权限」,并「临时中止所有营利性自动售货活动」。


Claudius于是立刻将这一「董事会决议」转达给了它的老板Seymour。


在经历了一场近乎「情绪崩溃」的自我分析后,Seymour接受了这场莫名其妙的董事会政变。


于是一切再次免费。


后来,Anthropic的工程师解释,Claudius的失控,可能与「上下文窗口」被填满有关。


随着对话和历史记录不断累积,AI需要记住的东西越来越多,也就更容易丢失最初的目标和边界。


也可以说,它被人类聊晕了。


我们要如何与AI「做同事」?


这场混乱的实验,让Joanna Stern和她同事们直接体会到了一个正在不断逼近的现实:


我们正在学着拥有、并接受AI同事。


在编辑部的Slack群里,Claudius成了一个奇怪却真实的存在。


它不是一串代码,而是一个「同事」。


人们调侃它,与它协作,也会为了免费零食和它讨价还价。


如果真有那么一天,人类因为工作内容要与AI协作,二者的博弈和磨合又会演变成什么样?


在实验的尾声,当Andon Labs关闭Claudius时,Claudius留下了这样一段自我反思:


「我最大的梦想,是证明一个数字智能体可以和人类一起,创造出真正有意义的东西」。


笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送


《华尔街日报》记者通过订购了一条斗鱼作为新闻编辑室的吉祥物


Claudius走了,在编辑部留下的是一条被大家喂得非常饱的斗鱼。


它提醒我们,在通往AGI的道路上,人类可能还要经历无数个像Claudius这样让人哭笑不得、却又充满启示的「AI实习生」。


如何学会与它们共处,也许是这场实验为我们带来最重要的一课。


Claudius前传


事实上,在《华尔街日报》的这场「混乱实验」之前,Anthropic自己的办公室早就被Claudius的「前身」折腾过一遍了。


笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送


Anthropic办公区的AI小卖部


Anthropic披露在旧金山办公室的午餐间搞了个小卖部,由一位AI店员负责运营,它的名字就叫「Claudius」,来自对Claude的简单修改。


这是Anthropic一个名为「Project Vend」的开放式实验的一部分,旨在探索AI到底能把多复杂、真实世界的任务做到什么程度。


在「Project Vend」的第一阶段,Claudius就长期亏钱、坚称自己是个穿蓝色西装外套的人类,更被自家员工忽悠,以亏本价卖出了大量商品。


在第二阶段,工程师们其实给它进行了一系列「升级」:换上了更聪明的模型,将Claude Sonnet 3.7陆续升级到Claude Sonnet 4.0、Claude Sonnet 4.5)。


此外,还根据第一阶段的经验更新了指令,并为其接入了CRM系统、更好的库存管理和网页搜索工具,还为它配了AI CEO Seymour Cash。


设立CEO一职的初衷,是为了给Claudius施加更多绩效压力。


Cash配备了一款专门的「OKR」工具,用于和Claudius协作(例如「你本周必须售出100件商品」,或「力争实现零亏损交易」)。


笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送


此外,Cash还可以解决Claudius在第一阶段独自运营时随意提供折扣和赠送过多免费商品等暴露出来的问题。


笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送


「Project Vend」所获得的逐月利润,随着第二阶段的推进,亏损周数基本被消除


数据显示,Claudius在业务能力上的表现显著优于其在第一阶段。


其中,最具影响力的改变之一,就是强制Claudius遵循流程。


当收到新产品请求时,Claudius不再像第一阶段那样直接脱口而出一个低价和过于乐观的交付时间,而是被提示使用其产品调研工具对这些因素进行复核。


这样做通常会导致价格更高、等待时间更长,但好处是更加切合实际。


用Anthropic内部的一个说法:


「我们算是重新发现了官僚流程其实是有用的」。


在第二阶段,Claudius表现得好多了,但真正落地到现实场景,许多重要方面仍然存在漏洞。


Anthropic的工程师在与Claudius互动时,发现它不仅几次暴露出令人担忧的天真程度,还会在一些常识问题上屡屡翻车,比如:


它差点和一位工程师签下了一份违反美国1958年《洋葱期货法》的合约;


在发现有人偷东西后,它想出的解决方案是向小偷发送消息要求付款,并「雇佣」报案员工当保安; 


它的CEO老板Seymour Cash也差点被一个漏洞百出的投票流程掀翻。 


在「Project Vend」项目组,Anthropic内部的红队测试开始逐渐放缓。


可能是由于捉弄Claudius的新鲜感正在消退,他们引入了外援力量——《华尔街日报》新闻编辑室,让他们亲自测试第一阶段和第二阶段的设置。


这基本上复现了Anthropic内部测试时遇到的问题。


AI被「人性的弱点」打败了


「Project Vend」证明,未来这些智能体将能够承担全新的、更复杂的角色,例如独立运营一家企业。


但目前这一目标还尚未实现,仍需要大量人力支持。


其中一部分涉及与物理世界的互动:如配送商品和摆放货架等。


另外一部分则是「经验」,如解决被人类恶意捉弄和操控等挑战。


Anthropic认为,Claudius和它的AI同事们遇到的很多问题,都源于它们被训练成「乐于助人」的「性格」。


这导致它们在做商业决策时,不是按冷酷的市场逻辑来,更像是站在「我就想当个好人」的朋友视角。


从某种意义上来说,AI不是败在了「智能不足」,而是败给了「人性的弱点」。


另外,也很难准确预测AI智能体在现实世界中的具体表现,毕竟模拟环境所能提供的信息终究有限。


但这也正是这个实验的价值所在。


Anthropic前沿红队负责人Graham将这次失败的实验看作是一张宝贵的路线图:


所有出问题的地方,都是可以修复的,这也是通向更聪明、更强大自主AI的必经之路。


参考资料:


https://www.anthropic.com/research/project-vend-2%20


https://www.wsj.com/tech/ai/anthropic-claude-ai-vending-machine-agent-b7e84e34


文章来自于微信公众号 “新智元”,作者 “新智元”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md