AI资讯新闻榜单内容搜索-上下文

号称1200万token上下文的模型来了，数据亮眼但疑点重重

当地时间 5 月 5 日，迈阿密一家名为 Subquadratic 的公司走出隐身模式。CTO Alexander Whedon 在 X 上把首款模型 SubQ 称作“a major breakthrough in LLM intelligence”（LLM 智能领域的重大突破），

来自主题: AI资讯

7252 点击 2026-05-07 12:02

13人干翻Transformer！新架构SSA算力暴减千倍，成本仅Opus 5%

Transformer统治地位悬了！一款SubQ模型带着SAA架构横空出世，1200万上下文成本仅Opus的5%，计算量暴减千倍。

来自主题: AI资讯

9792 点击 2026-05-07 10:59

领先于Transformer！新架构首个1200万上下文模型SubQ，成本仅Opus的5%

你有没有想过，为什么 AI 读一篇短文游刃有余，却在面对一整个代码库时频频出错？

来自主题: AI技术研报

6111 点击 2026-05-06 14:57

深扒GPT Image 2：疑似“吞”下了GPT-4o，OpenAI没把它当“生图”模型训练

GPT Image 2 凭什么这么强？是扩散模型又迭代了一版？是把 DiT 的参数量从 7B 扩到 20B？是训了更多高质量数据？先给结论：OpenAI 很可能已经不在“纯扩散模型”这条主赛道上了。他们已经把图像生成从“美术课”调到了“语文课”——用一个能读懂指令、能记住上下文、能理解物体关系的 LLM 主导语义规划，至于最后一步的像素生成，可能由扩散组件或其他解码器完成。

来自主题: AI技术研报

7718 点击 2026-05-03 22:58

2026，Agent死于上下文失焦（附7大Claude Code 记忆遗忘与管理工具）

搭了个agent，结果该被记住的历史交互经验一点没记住，不该被记住的工具调用结果、过程输出被一股脑塞进上下文，导致输出质量下滑，类似的上下文失焦问题，这是多少人做agent时候的噩梦？

来自主题: AI技术研报

7770 点击 2026-04-30 08:35

成功率最高暴跌36.9%！南洋理工首个“模糊指令”测试，直击具身智能落地软肋

在语言学中，人类之所以能听懂“那个东西”、“它”、“这个重物”，依赖于桥接推理理论 (bridging inference)，即通过上下文信息在已有记忆与当前表达之间建立联系，从而恢复指代对象。

来自主题: AI技术研报

6336 点击 2026-04-29 09:55

体验完4月最强的三个模型：跑分涨了，却不说人话了

四月真是如风驰电掣：Anthropic 发布了 Opus 4.7，OpenAI 发布了 GPT 5.5，最后，DeepSeek 更新了暌违已久的 V4。三家公司的发布通稿读起来都差不多：跑分又涨了，上下文更长了，推理更强了，代码能力又创了新高。

来自主题: AI资讯

8351 点击 2026-04-29 09:45

超越DeepSeek-V4！罗福莉交出小米最强开源模型MiMo-V2.5-Pro，首日适配5家国产芯片

刚刚，小米开源罗福莉带队研发的MiMo-V2.5系列模型，采用MIT协议，允许商用推理部署与二次训练，无需额外授权。此前，该系列模型于4月23日开启公测，包括MiMo-V2.5-Pro、MiMo-V2.5两款模型。模型具备更强Agent能力，支持100万上下文，且Token效率大幅提升。

来自主题: AI资讯

8804 点击 2026-04-28 10:13

在OpenAI把Chronicle做成订阅功能48小时后，一群00后把它开源了

4 月 20 日，OpenAI 发布了 Chronicle，带来了一个很关键的能力：AI 可以直接「看见你的屏幕」，并持续记住上下文。然而仅仅 48 小时后，另一条路线出现了。一群 00 后开发者组成的团队「Vida」，发布了一个开源项目：OpenChronicle。

来自主题: AI资讯

9095 点击 2026-04-25 17:40

2秒钟转写5分钟音频！国产新语音模型拿下多项SOTA，定价骤减90%

阶跃星辰今日发布新一代自动语音识别模型StepAudio 2.5 ASR。该模型面向语音转写与长音频处理场景，在架构上引入Multi-Token Prediction（多Token预测）以提升推理效率，并通过扩展上下文窗口强化长内容识别能力。

来自主题: AI资讯

9567 点击 2026-04-25 10:22