一篇综述看懂 agent context compression:怎么压、压什么、谁来压
一篇综述看懂 agent context compression:怎么压、压什么、谁来压LLM Agent 做长任务时,真正让人头疼的往往不是模型不会推理,而是上下文开始失控:前几步还很清楚,后面就忘约束、丢状态、重复试错,最后把任务跑成事故现场。
搜索
LLM Agent 做长任务时,真正让人头疼的往往不是模型不会推理,而是上下文开始失控:前几步还很清楚,后面就忘约束、丢状态、重复试错,最后把任务跑成事故现场。
一年前,行业还在为“从自动补全到 Agent”的进化感到兴奋。然而一年过去,我们不难发现单纯靠“Vibe Coding”和“Prompt 调优”,面对非确定性模型带来的风险和成本问题,显然无法撑起企业级软件开发。
本文将深入探讨 Anthropic、OpenAI、Perplexity 和 LangChain 究竟在开发什么。我们将聊聊编排循环、工具、记忆、上下文管理,以及那些将“无状态”的大语言模型(LLM)转变为全能智能体(Agent)的底层机制。
AI已经是一个彻底围绕Token的生意了, 或者说,Token经济学就是推理经济学, 我认为,今时今日的AI, 连这种基础设施层的东西(比如网络), 都和业务理念融为一体了, 这真是一个大趋势。
在这篇文章里,我想介绍编码智能体(Coding agents)以及 Agent harnesses 的整体设计:它们是什么、怎么运作,以及各个零件在实践中怎么拼到一起。
最近,AI 圈子里又冒出一个新词:Harness Engineering。
这几天我注意到,我的「杉森楠 AI H1|海内外产品交流」群里,大家一直在聊 Claude Code 和 Skills。
2026 年才开始,全球 AI 行业就迎来了第一个开年王炸。不是来自某个更大的模型参数,不是某家实验室刷新了榜单分数,而是一个看似不起眼、却迅速破圈的概念——Agent Skill。
Agent 并不是一次性输出的系统。它们运行在多轮交互之中:调用工具、修改内部状态、根据中间结果不断调整策略。也正是这些让 Agent 变得有用的能力 ——自主性、智能性与灵活性 —— 同时也让它们变得更难以评估。
谭老师我, 每年会找几个看似冷门, 其实值得深挖的选题, 啥意义,没苦硬吃? 这是拉开认知差距的办法。 科技这行,赚小钱靠信息差, 抓大钱靠认知差, 这篇灵感来源于, 有几位搞AI底层技术的朋友常说,