踩坑三个月,我们总结出的 Agent Harness 实践与反思
踩坑三个月,我们总结出的 Agent Harness 实践与反思Harness 应由业务驱动。
Harness 应由业务驱动。
Agent 时代,我们需要正确的计费和工程设计哲学,这是 Xiaomi MiMo 大模型负责人罗福莉刚刚在 X 上发表的观点。前两天,我们报道了一则消息 ——Anthropic 宣布,即日起,Claude Pro 和 Max 订阅用户,不得再将订阅额度用于 OpenClaw 等第三方 Agent 框架。想继续用?那就必须切换到按用量付费的 API。
一款 AI 产品出现在了国际顶级的艺术展览中,而且是充当解说员的身份。Chance AI 作为这届博览会官方引入的首个 AI 产品,负责帮观众解读艺术品。观众举起手机,对准一幅画,拍照即交互,听 AI 解释:这件作品为什么成立,它背后意味着什么。
郭亚楠说,Context就承接了新需求。传统OS让人和软件对齐,新OS应该让人和Agent对齐。因为Context是个人数据的结构化、语义化集合,它就像OS管理内存和CPU一样管理每个人的数字痕迹。
本报告基于XSCT Arena平台,对 Qwen3.6-Plus-Preview(阿里云,2026-04-02 发布)在文字能力(xsct-l)、网页生成(xsct-w)、Agentic 任务(xsct-a)三大场景下的表现进行系统评测,并与Claude Sonnet 4.6、GPT-5.4、Gemini 3.1 Pro、Kimi K2.5、
Salesforce 是一家云软件巨头,一直在围绕 AI 重塑其业务,在周二于旧金山举行的一次小型聚会上,首席执行官马克·贝尼奥夫及其团队公布了这些努力的最新成果:Slack 的更新版本,配备了大量新的 AI 功能。其中最重要的是其 AI 助手 Slackbot 的重大升级
我的Claude Code,学会做梦了。说真的,我打这行字的时候自己都觉得有点离谱。事情是这样的。就在前些日子,Anthropic新出了一个功能叫Auto Dream,字面意思,让Agent在休息的时候,自动做梦。
就在今天凌晨,Cursor 3正式发布!自Cursor诞生以来的最大一次飞跃!X上Cursor的官方账号上发布的推文写得极其大胆:为所有代码都由Agent编写而建的世界,同时保持开发环境的深度
产品本身包括了一个Agentic Payment Skill,一个龙虾可以用的“虚拟卡包”,和一套他的围栏,(好像现在可以叫 Harness 了)。这些东西本身只是配套的 infra,核心在于商户的功能 Skill,服务于 Agent 的需求。商户会在 Skill 中引导用户授权 Agent,允许自主完成小额的支付。
过去一年,AI 硬件很热,但很多从业者心里其实都清楚,热归热,真正做起来并不轻松。