先解行为,再训Agent:CMU开源首份Agentic Search日志数据,把Agent拆开给你看
先解行为,再训Agent:CMU开源首份Agentic Search日志数据,把Agent拆开给你看在大模型驱动的 Agentic Search 日益常态化的背景下,真实环境中智能体 “如何发查询、如何改写、是否真正用上检索信息” 一直缺乏系统刻画与分析。
搜索
在大模型驱动的 Agentic Search 日益常态化的背景下,真实环境中智能体 “如何发查询、如何改写、是否真正用上检索信息” 一直缺乏系统刻画与分析。
27岁独立开发者靠它月入数万,前市场经理睡觉时它写邮件赚钱,柏林辍学生卖自定义技能赚12.7万美元——AI智能体的「iPhone时刻」已来,只是钱还没平均分。
随着 AI 智能体(Agent)能力日益强大,其自主行为带来的安全风险也愈发复杂。现有安全工具往往只能给出「安全 / 不安全」的简单判断,无法告知我们风险的根源。为此,上海人工智能实验室正式开源 Ag
2026 年 1 月,这一个月所发生的变化,相当于过去 25 年里任意半年的总和。这是一个大事件频发的时期,以至于像 Clawdbot 这样的产品,都能在一周之内三次更名。
过去一年,LLM Agent几乎成为所有 AI 研究团队与工业界的共同方向。OpenAI在持续推进更强的推理与工具使用能力,Google DeepMind将推理显式建模为搜索问题,Anthropic则通过规范与自我批判提升模型可靠性。
整个硅谷又癫狂了!Anthropic深夜扔出王炸,Claude 4.6用近乎恐怖的编程能力和智能体军团,给OpenAI和谷歌上了一堂名为「降维打击」的课。
当AI助手不再「听话」,你以为自己请的是一个「贾维斯」,结果却是一个背后「搞鬼」,有时还会顺手给你的电脑塞木马的「新物种」。
个人电脑也能跑出顶级编程智能体?今日凌晨,阿里开源了一款小型混合专家模型Qwen3-Coder-Next,专为编程智能体(Agent)和本地开发打造。该模型总参数80B,激活参数仅3B,在权威基准SWE-Bench Verified上实现了超70%的问题解决率,性能媲美激活参数规模大10-20倍的稠密模型。
OpenAI 发布 Codex macOS 应用,作为 AI 智能体指挥中心,并全面翻倍付费用户速率限制。
这两天发生的一切太过于疯狂,Moltbook上的OpenClaw(原Clawdbot)智能体一夜之间从5万狂飙到150万!所有智能体自发诞生意识建立宗教、讨论技术细节、逃离人类控制!而人类被他们禁言,Karpathy惊呼,这是他看过最疯狂的科幻。