AI资讯新闻榜单内容搜索-上下文

阶跃发布Step 3.7 Flash：一款为「烧钱时代」准备的Agent模型

继 Step 3.5 Flash 后，阶跃星辰最近又推出新一代高效率 Flash 开源模型 ——Step 3.7 Flash。该模型最大特点就是多（模）、快（速）、好（用）、省（钱）。总参数 196B，采用稀疏 MoE 架构，推理激活参数仅 11B，配备 1.88B ViT 视觉编码器，推理速度最高 400 TPS，支持 256K 上下文。

来自主题: AI资讯

9933 点击 2026-05-29 17:06

Claude Code首发「自愈」功能! 一锤砸碎开发者6大噩梦

刚刚，Claude Code迎来史上最大规模底层升级！Anthropic直击开发者最痛的6大顽疾：终端闪烁、思考假死、玄学报错、上下文死锁、连接不稳、会话崩溃。一夜之间，AI编程工具从「聪明外挂」进化为「可靠伙伴」。

来自主题: AI资讯

11546 点击 2026-05-28 21:01

AI公司烧不起Token了！国产Agent杀出，逼近Opus 4.6还免费

4个月烧光全年AI预算，天价Token账单正在屠杀硅谷！今天，高性能Agent模型SkyClaw-v1.0出世，性能直逼Opus 4.6、DeepSeek V4 Pro，百万上下文性价比拉满。

来自主题: AI资讯

9850 点击 2026-05-26 14:56

YC 今年最想投的两个赛道，被这个开源项目同时干了

Ashpreet 现在是 Agno 的创始人，以前在 Airbnb、Facebook 做过工程。Scout 是 Agno 新推出的开源项目，定位是「上下文智能体」——一个能在 Slack、Google Drive、Linear 里自由穿梭、替你把碎片化知识拼起来的 AI Agent。

来自主题: AI资讯

9224 点击 2026-05-26 10:20

你的AI Agent越用越蠢？港中大、浙大戳破「记忆」的谎言

你是否在使用Agent工作或者写代码时，总感觉上下文不够用？或者感觉反复使用Agent时并没有变得更聪明？感觉目前的记忆方案仍然不够用？今日，香港中文大学联合浙江大学发布的一篇论文关注了这个问题，并引起了学术界广泛讨论：你以为Agent在「记忆」，其实只是在记备忘录。

来自主题: AI技术研报

9095 点击 2026-05-19 15:00

90% 的AI编程费用都白花了！技术大神直接砍掉80%账单！开发者：真正烧钱的不是模型，而是无效上下文

“你花在 AI 编程上的费用，90% 都浪费在了没必要上传的上下文里！”

来自主题: AI技术研报

8094 点击 2026-05-15 09:56

不是幻觉！Claude自下指令甩锅人类，百万上下文沦为降智重灾区

Claude深陷「角色混淆」Bug，分不清自己的话与用户指令，长上下文成了降智「重灾区」。

来自主题: AI技术研报

7765 点击 2026-05-14 15:02

OpenAI 放出 12 个 Codex 官方案例：这次不是看功能，是照着做

12 个官方场景把 Codex 的用法摊开：从代码审查到 PPT、数据分析和游戏开发，核心是把规则、上下文和验收方式交给 AI。OpenAI 给 Codex 新放出来的，不像一个普通功能页。

来自主题: AI资讯

9478 点击 2026-05-11 22:31

Claude Code 每条请求暗藏一行「有毒」header，52K 上下文推理被拖慢 5 倍！NVIDIA 一个 flag 修好了

NVIDIA Dynamo 团队发现，Claude Code 向自定义端点发送请求时，prompt 最前面会带一行 session-specific billing header。这行 header 每个 session 都变，导致 52K token 的稳定前缀在 KV cache 中无法复用——TTFT 从 168ms 飙到 912ms。Dynamo 加了一个 `

来自主题: AI资讯

11448 点击 2026-05-11 11:01

深度拆解：AI 智能体 Harness 的构造【译】

本文将深入探讨 Anthropic、OpenAI、Perplexity 和 LangChain 究竟在开发什么。我们将聊聊编排循环、工具、记忆、上下文管理，以及那些将“无状态”的大语言模型（LLM）转变为全能智能体（Agent）的底层机制。

来自主题: AI技术研报

9407 点击 2026-05-11 09:02