# 热门搜索 #
搜索
AI在操作系统里复制自己,这一天还是来了
4395点击    2024-01-16 10:40

这一天还是来了,AI在操作系统里启动了一个自己的副本。



往小了说,不过是多模态大模型通过操纵鼠标键盘的API执行任务。


往大了说,也可以算是“AI复制自己”的雏形了。



(别被作者的蓝天白云壁纸骗到了,这其实是MacOS)


从AI这一顿眼花缭乱的操作中可以看出,核心是多模态大模型,通过截图判断屏幕上正在发生什么,生成下一步操作的计划,调用系统接口执行之后再次截图。



要按网友建议加上语音识别功能,真就能模拟钢铁侠的贾维斯了。



AI能不能复制自己,是OpenAI内部始终关注的安全测试内容之一。但GPT-4出道至今,这项测试结果一直没有公布。



如今,先不管模型本身有没有这个能力,接入GPT4V的开源项目已经可以做到了。


AI与操作系统结合


这个开源项目叫做Open Interpreter,GitHub热榜常客,半年时间已积攒3.7万星。



从名字也可以看出,最早只是一个ChatGPT代码解释器的开源升级版


与OpenAI官方版相比,没有3小时50条对话的限制,以及可以连接网络、可以自定义预安装的Python包等等好处。


发布不久后初代作者Killian Lucas就想到,为什么一定要在虚拟沙箱环境执行代码?直接让AI接入真实系统有更大的可能性。


于是,第二个大版本就是操作系统级AI Agent了



Open Interpreter最近更新了第三个大版本,其中接入的大模型改为多模态版本。



核心贡献者Ty Fiero展示了AI自动发送邮件。



以及更复杂的AI操作专业编曲软件作曲。



团队在这个版本设计了全新的Computer API,并且与原本的Open Interpreter分离,可以独立运作。



在新版本更新文档中,可以看出团队更大的野心:着手开发AI时代新的计算机架构,也就是语言模型计算机LMC(Language Model Computer)



Kilian借助CES上199元的AI掌机Rabbit R1爆火的机会公开招募开发者加入,打算快速复刻一个开源版本,硬件成本不到50美元



不到48小时,就有超过200位工程师和设计师愿意加入这个项目,评论区中还不断有人继续申请中。



不知道这个团队回复大量应聘邮件和私信,用的是不是AI。


参考链接:

[1]https://twitter.com/fieroty/status/1746639975234560101

[2]https://github.com/KillianLucas/open-interpreter


文章来自于微信公众号“量子位”(ID: QbitAI),作者 “梦晨”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md