ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
又翻车了?大热AI硬件rabbit r1没用上AI?
7550点击    2024-04-30 11:00

继AI Pin翻车后,又一款网红AI硬件rabbit r1迎来了用户首批体验。


然而,随着设备到手,动手能力强的网友们翻出了源代码之后发现——


这个AI硬件,可能和AI一点关系都没有。



2024年CES展上什么最火?那一定是前百度高管吕骋做出来的,扬言“干翻所有APP”的兔子,rabbit r1。


距离产品发布不过一周的时间,rabbit r1就预售出40000台。一个巴掌大小,但功能极其强大,最大的卖点就是用户可以通过语音的方式,调用手机上的一切APP。


rabbit r1操控手机app的能力源于其内置的“全新的基于AI的系统”——基于大型动作模型(Large Action Model,LAM)打造的rabbit os。


用人话说,就是理想情况下,咱们对着它说“我想点个兰州拉面外卖送到家”,它就会自己打开手机里的美团外卖支付下单一气呵成。



然而,前几天这款万众瞩目的AI硬件的源代码遭到泄露,有人分析了代码后认为rabbit r1不但和AI没有任何关系,而且很可能存在隐私泄露的风险。


首先,泄露的代码中似乎并不包含任何实际的AI或机器学习组件。


而是依赖于Playwright自动化脚本与有限的应用程序进行交互,这也就意味着产品最大的卖点操控APP并不是用AI来做的。


这两者有什么区别呢,我们以用APP点外卖为例。经过训练的AI可以认识APP中每个按钮的作用,识别文字的意思,可以像人一样点击屏幕。


而Playwright更像是按键精灵,你需要提前设置,先点击屏幕右上角定位xx的位置,再上滑2厘米......最后点击屏幕右下角,带有“付款”文本的按钮。


只要设置的够细致,Playwright也能自动化操作,可是一点APP的页面发生变化,比如支付按钮换到了左边,或者原来是“美食”的页面被美团换成了“百亿补贴”,那么Playwright可能就会失效。


其次,泄露的代码还显示,rabbit R1要求用户通过其Web门户登录,实际上是通过NoVNC连接的虚拟机。


用户被要求在这些虚拟机上输入私人密码,这无疑增加了用户的隐私泄露风险。更令人担忧的是,用户会话也被存储在rabbit的服务器上,且没有任何额外的安全层保护。


这就类似你把你的账号密码和聊天记录手写在一张纸上交给r1,这张纸使用后最终会到谁手里,谁能看见,用户也不得而知。


目前rabbit r1创始人吕骋发帖进行回应,表示这只是谣言,也有人认为泄露的代码不完整,不能说明什么问题。



作为用户,我们更关注rabbit r1的实际体验如何,如果真的可以用自动化脚本把功能做得和AI一样好,那倒也不是不行。


rabbit r1用起来怎么样呢?用一句话形容:功能不完全的手机。



外观上没什么变化,小巧趁手。橙色的外壳包裹着2.88英寸的屏幕和一个可以旋转的摄像头。交互上侧边边有一个灰色按钮以及一个滚轮。设备背面有扬声器开口,底部和侧边还有麦克风、typec充电口和sim卡槽。


rabbit r1包装中还附送了一个兔子徽章、兔子魔术贴以及透明塑料保护壳。


操作起来比较顺滑,尤其是滚轮,受到了评测博主们的一致好评。



此外,r1在UI设计上也挺用心的,比如充电画面是一只兔子在滚轮上奔跑。



在视觉识别和语音问答这两个AI常见功能上,r1做得挺好,可以快速准确的识别出画面中的内容。


静物识别上,r1准确认出了食物、篮球、植物等,并准确的描述了画面的细节。


比如博主@unboxtherapy用r1识别篮球,r1可以回答这个篮球的品牌wilso以及NBA标志,并推理出这是一个NBA官方篮球。



在识别场景时,r1不但可以说出画面中人物的特点,还能推理出二者的关系,比如r1就认出了博主@ijustine和她的女儿。



这与另一个网红AI硬件AI Pin相比,不但速度快,而且更加智能。


在语音问答方面,r1发挥稳定,博主@Unbox Therapy询问“多伦多枫叶队是什么”,r1很轻松的回答了关于这支冰球队的一些信息。在博主进一步询问更详细的问题时,r1还能够联网进行搜索。


硅基君猜测,这个功能应该用到了perplexity.ai,一款类似Kimi的ai应用,可以实时联网搜索。



rabbit r1聚合了许多AI应用,比如perplexity.ai、midjourney,并且表示之后还会有更多的功能加入到rabbit r1中。说到这,不得不再次鞭尸一下AI Pin了,它的应用生态基本没有。


rabbit r1的办公功能也是厂商着重介绍的,简单来说就是用摄像头识别表格,这个表格可以是手绘的。随后r1会将表格整理成电子版发送到你的邮箱。twitter博主@rileybrown_ai测试了一下这个功能,效果又快又好。



这功能是不是老罗十年前就做了?



最后,rabbit r1比较有特色的功能,操控手机APP,用手机打车等。很奇怪,几个测评博主并没有着重测试这方面的功能。@ijustine简单测试了一下用r1放歌以及打车,而@Unbox Therapy什么都没做。


可能是这个功能还不完善,要尝试十几次才能成功一次?有用户在twiiter上表示,Uber在r1上根本无法运行。甚至有用户表示r1连时间都报不准。



再结合rabbit r1源代码泄露事件,很难不让人联想。


rabbit r1的功能大概就这些,其他多玩法要等更多的人上手。人们对于rabbit r1的态度比AI Pin宽容不少,相比于后者r1功能更加简单也就更加完善,在交互和外观上也不像AI Pin那样激进,最重要的是,r1只要199美元,还有只兔子随时随地卖萌。


r1比AI Pin更有用,但在AI硬件的角度,两者都没做到“替代手机”“消灭APP”,更像是一个功能简化的智能手机。


ChatGPT火爆后,谁都想成为下一个乔布斯,定义什么是AI硬件,有把AI功能打包放在一个独立硬件里的;有疯狂堆算力,但没啥功能的;也有给键盘加个AI启动键的。


这时候就要引用一下朱啸虎前段时间在采访里说的话了:


“美国大公司敢砸钱,中国不需要砸钱,咱们跟在后面就行了。我们跟在后面,花的钱少一个数量级,风险小很多,干嘛不跟在后面?”


咱们等华强北就是了。


本文来自微信公众号“新硅NewGeek”(ID:XinguiNewgeek),作者:董道力