我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。
7116点击    2026-03-05 10:43

人在西班牙出差了好几天。


然后,昨天刚回北京,一回公司,就发现了一个很有趣的事。


就是内容创意组那边的小伙伴,在窗边架了一个Pocket 3。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


我最开始以为,他们是在拍vlog记录公司日常。


然后才发现,这玩意,他们居然说,是组里的OpenClaw的,眼睛???


尼玛。


我问了下这玩意是在干啥,他们说,是用Pocket 3当摄像头,架在窗边高处,俯拍整个内容组的工位区。


每隔2~5分钟就截一张图,通过OpenClaw喂给一个多模态模型,让它像写日记一样描述看到了什么。


然后每天记录工位里的每天趣闻和我们平常关注不到的行为细节。


记录的结果是这样的。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


timestamp记录的是截取图片的时间。


photo_path记录的是图片存储的地方。


photo_path记录的是视觉理解模型根据图片输出的内容,大概就是,谁干了什么事。


到了7、8点下班时间,就会把上面那些数据全部喂给OpenClaw。


让小龙虾分析一下,今天大家有趣的状态和事情。


这些观察记录会存一整天,然后呢,他们为了保护自己的一些隐私和安全,毕竟就是整活玩,这些记录到晚上12点,OpenClaw就会自动的全部删除。


没想到出去了几天,他们整起了这种有意思的活。


至于为啥用Pocket 3来当小龙虾的眼睛,是因为这个玩意视角极大,能转动,还高清。


说前两天最开始玩的时候,搞了一个普通的监控摄像头,拍起来是真模糊,视角还不行,还感觉明明没人监视,但是贼牛马的感觉。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


然后就换成了公司的Pocket 3,直接把视频组的那个给薅过来了。


连接方式也非常的简单,就是直接用数据线,把Pocket 3连到Mac mini上,充当USB摄像头。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


所以你的摄像设备,只要能插USB,理论上就能当眼睛。


他们甚至想把视频组里那个我直播用的2w多的佳能,给薅过来给小龙虾当眼睛用,被我义正言辞的拒绝了。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


这大镜头要是干上去,小龙虾的眼睛度数尼玛直接都干到双眼5.2了,这可不止看每天的动作了,这每天看毛孔看是不是卡粉都能看得出来了。。。


他们说,每天小龙虾都会在群里,根据收集的每天数据,进行总结,还可以互动完,我说把我拉到群里我看看怎么玩的,也被他们拒绝了。


他们说我肯定不是想进群看小龙虾,就是单纯的想图谋不轨。。。


没办法,就只能去我们同事的工位上看了。


大概的效果是这样的。


就是每天,都可以生成这么个报告玩意。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


然后会再给这个报告,加上一个生成的梗图。


最后一起,发到飞书群里。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


还真的很有意思。


他们还给这个项目还起了个名字:


OpenClaw人类观察计划。


前有MoltBook人类观测AI,后有OpenClaw 24小时观测人类,属实是闭环了。


他们和我说现在每天下班,最期待的事变成了,今天OpenClaw会挑谁总结。


因为他们给小龙虾定的规矩是:只能夸,不能损。


所以输出的全是彩虹屁。


而且是那种用很正经的学术黑话包装的彩虹屁。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


还有下面这个,我快笑不行了。。。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


你不是秃,你是智慧高地寸草不生。。。


整挺好。。。


群里还有小伙伴问。


为啥只写她一个?


然后让小龙虾明天多写几个人。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


还有更绝的。


到了下班点,你不走?


小龙虾会通过摄像头看谁还在。


然后一直催。


催到你走为止。


这个东西简直就是打击万恶资本家的利器。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


我佛了。


一个小龙虾,真的能被他们玩出花来。


至于实现这个功能也挺简单的,我们的小龙虾被部署在了一个单独的Mac上,保证不涉及到我们员工工作电脑的数据安全,然后这个小龙虾背后接的是公司的Claude Opus 4.6的API Key。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


再放在了飞书里,大家就都可以跟这个飞书上的小龙虾进行互动或者处理一些日常任务。


当然,大活还是会上Claude Code或者Codex的。


做这个观察系统,我看了一下他们的Prompt,也特别简单,就直接吧摄像头用USB接入以后,用人话写了一段话,发给了小龙虾。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


然后它就开始开发并检测了摄像头和拍照功能,测试以后没问题,又看了下这个需求,说,还需要生图模型、飞书群的Chat ID以及生图模型的API Key。


然后就直接把它需要的东西提供给它就行。


这里内容组的小伙伴用的是火山的豆包 Seed 2和Seedream-5.0模型。


因为我们几乎所有服务都在火山和飞书上,所以他们就直接用了。


然后他们就把Key粘贴了过来,直接飞书里发给了小龙虾。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


至于飞书群的Chat ID,直接在群里问它就能拿到。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


东西都给到之后,小龙虾就按照之前描述的开发设想,自己开始干了,大概四五分钟就开发好了。


小龙虾会自己去测试视觉语言模型、生图模型,看看是否能跑通。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


就真的,这种一系列的反馈,情感给的是真的足。


然后它自己还会去群里测试连通性。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


完成之后。


到这里,开发过程就结束了。


对的,你没看错。


这个开发过程就结束了。。。


当然剩下还有一些我们的小伙伴在实际运行中会有一些BUG,也直接对话给小龙虾,直接修就可以了。


比如发送的梗图他们发现没有发图,而是发了一堆链接。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


跟小龙虾描述一下问题是什么,一两分钟它自己就修好了。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


在比如说输出了图鉴,但不知道哪个工位是谁。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


你就可以直接告诉小龙虾,对应的工位关系就可以。


就像这样:左上角的是哪个工位,是哪个人,右下角的是哪个工位,是哪个人。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


然后它就可以正确知道每个区域对应的成员了。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


等等等等,非常简单。


说实话,小龙虾这个产品,确实把整个的Agent体验门槛,给拉的非常低,人人都可以玩一手。


真的,他们现在每天看小龙虾在群里的人类观察反馈,看的还挺开心的。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


我们给OpenClaw加了一双眼睛,来观察我们这平凡的一天。


虽然我看不到,他们拒绝我加入群聊,但是我也还是挺开心的。


真不是因为这个项目展示的技术多牛逼。


说实话,整个东西就是对话式开发,跟小龙虾聊几轮就做出来了。


我开心的其实是,内容组小伙伴们搞这个的动机。


他们说,每天被OpenClaw观察一下,感觉普普通通的一天也变得有点特别了。


他们说,平时大家都低着头忙自己的事,其实很少会注意到旁边的人今天状态怎么样,有没有偷偷打了个哈欠,有没有对着屏幕突然笑了一下。


当我出差了好几天,回来发现,没有人安排他们做这件事。


没有立项,没有排期,没有OKR。


就是几个人觉得好玩,自己鼓捣出来的。


你看,AI最好的应用场景,可能从来就不是什么宏大的叙事。


就是让普通的一天,变得没那么普通。


让一群有趣的人,能开开心心的,在下班前能笑一下。


真的,这就够了。


文章来自于微信公众号 “数字生命卡兹克”,作者 “数字生命卡兹克”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales