Claude Mythos其实没那么神?AI发现bug其实早已是寻常
Claude Mythos其实没那么神?AI发现bug其实早已是寻常昨天,VIDOC Security Lab 的一篇博客介绍了他们的发现:Claude Mythos 的实力可能被高估了;或者说,之前已有模型达到了同等的能力。正如研究者 Dawid Moczadło 说的那样:「这并非一种新能力。」
昨天,VIDOC Security Lab 的一篇博客介绍了他们的发现:Claude Mythos 的实力可能被高估了;或者说,之前已有模型达到了同等的能力。正如研究者 Dawid Moczadło 说的那样:「这并非一种新能力。」
4 月 10 日晚,灵初智能发布了大模型、数据集与合作计划:包括策略模型 Psi-R2、世界模型 Psi-W0,以及总规模近 10 万小时的人类操作数据。它想回答的问题也很直接 —— 当真机数据不再是唯一解,机器人还能靠什么继续 scaling?
就在刚刚,奥特曼家被炸了。奥特曼发出家人和孩子的照片,并且发出长文表示,AGI如今已经如同魔戒一般,让人做出疯狂的举动。
Factory 发布桌面端应用,让自治 AI 代理(Droids)直接在你的电脑上操控 VS Code、浏览器、终端和 Excel——官方原话是「像你一样操作你的电脑」。多代理并行、持久化机器、本地模型部署一步到位,官方称企业团队采用速度翻倍、会话量暴涨 4.6 倍。发布推文 21 万人围观,近 900 人点赞。
近日,上海人工智能实验室联合南京大学、香港中文大学及上海交通大学,将OpenClaw的成功应用于多模态生成领域。他们提出GEMS(Agent-Native Multimodal Generation with Memory and Skills),激发小模型潜力,甚至让6B小模型在部分任务超越了Nano Banana 2。
如果你身边声称将为人类未来负责的人,这样和你聊天,你感受如何: “在应对 ASL-3 级别的灾难性风险时,我们通过机制可解释性的神经解剖,在神经网络的暗物质中,发现了潜伏特工(Sleeper Agen
不知道你们有没有发现,Anthropic最近状况频出得有些反常。又是泄露源代码、又是词元计费BUG,又是降智。小毛病不断、画面不断,讨论声也不断。多少掺点,拿bug当热点炒,蹭免费热搜了。这不,刚又给龙虾之父Peter账号封了。
过去一个月,是今年 AI 产品发布最密集的一个阶段。 如果你留意近期 AI 产品的进展,你会发现,出现了一批真正能主动干活的 Agent 产品。不再是聊天框、问答工具,更像是人类的分身:能自己操控电脑
字节Seed最新研究,让大模型能“原地改参数”了。既不用改模型结构,也不用重新训练,还跑得很快。具体是这么个情况。智能体时代嘛,大家都知道模型们面对的任务开始变得越来越复杂、上下文越来越长。
《终结者》导演詹姆斯·卡梅隆过去的一番论断,迎来了热议:AGI不会来自政府项目,而是由科技巨头打造。这比我在40年前《终结者》中描绘的情景更可怕,因为至少现在它已不再是科幻小说了。