AI资讯新闻榜单内容搜索-token

Attention真的可靠吗？上海大学联合南开大学揭示多模态模型中一个被忽视的重要偏置问题

近年来，Vision-Language Models（视觉 — 语言模型）在多模态理解任务中取得了显著进展，并逐渐成为通用人工智能的重要技术路线。然而，这类模型在实际应用中往往面临推理开销大、效率受限的问题，研究者通常依赖 visual token pruning 等策略降低计算成本，其中 attention 机制被广泛视为衡量视觉信息重要性的关键依据。

来自主题: AI技术研报

10770 点击 2026-02-06 10:39

o1之后下一个范式？隐式CoT大突破，让推理不再「碎碎念」

今天推荐一个 Implicit Chain-of-Thought（隐式推理）的最新进展 —— SIM-CoT（Supervised Implicit Chain-of-Thought）。它直击隐式 CoT 一直「扶不起来」的核心痛点：隐式 token 一旦 scale 上去，训练就容易塌缩到同质化的 latent 状态，推理语义直接丢失。

来自主题: AI技术研报

7564 点击 2026-02-02 09:31

Karpathy盛赞，啥都没有的创业公司刚融了1.8亿美元，Flapping Airplanes要用小数据造强智能

AI 需要整个互联网来学习，而人类只需要一个童年。人类在成年之前，所接触的语言、文本与符号，顶多只有几十亿 token，相差几个数量级。正是从这个问题出发，一家几乎没有产品、没有盈利、也不急于商业化的 AI 创业公司，从 GV、Sequoia 和 Index 拿到了 1.8 亿美元融资，并获得了 Andrej Karpathy 的公开力挺。

来自主题: AI资讯

7452 点击 2026-01-30 10:43

刚刚，微软全新一代自研AI芯片Maia 200问世

一觉醒来，我们看到了微软自研 AI 芯片的最新进展。微软原定于 2025 年发布的下一代 AI 芯片 Maia 200，终于在今天问世！根据微软官方介绍，Maia 200 作为一款强大的 AI 推理加速器，旨在显著改善 AI token 生成的经济性。

来自主题: AI资讯

9784 点击 2026-01-27 13:01

关于多模态大模型Token压缩技术进展，看这一篇就够了

近年来多模态大模型在视觉感知，长视频问答等方面涌现出了强劲的性能，但是这种跨模态融合也带来了巨大的计算成本。高分辨率图像和长视频会产生成千上万个视觉 token ，带来极高的显存占用和延迟，限制了模型的可扩展性和本地部署。

来自主题: AI技术研报

10011 点击 2026-01-26 14:22

对话 Robopoet 孙兆治：全行业销量最高的 AI 陪伴玩具，Fuzozo 是如何「养成」的？

2025 年 6 月发售，累计销量超 12 万台，其中 12 月单月销量超 5 万台。单日 Token 消耗量已超百亿，在火山引擎 AI 硬件榜单中位列第一。在退货率普遍居高不下的硬件领域，净退货率保持在 10% 以下。

来自主题: AI资讯

9918 点击 2026-01-23 11:19

Video版的Deep Research来了？先浏览再定位后精读：精度提升token消耗反降58.3%

在当前的AI Research浪潮中，Autonomous Agents已经改变了我们获取信息的方式——从被动接收到主动检索。

来自主题: AI技术研报

9230 点击 2026-01-22 16:13

GDP增长将取决于Tokens数量？微软CEO纳德拉达沃斯对话信息量太大了……

在2026年的世界经济论坛上，微软 CEO 萨提亚·纳德拉（Satya Nadella）与贝莱德 CEO 拉里·芬克（Larry Fink）进行了一场对话。

来自主题: AI资讯

7473 点击 2026-01-21 10:42

AAAI 2026 Oral | 告别注意力与热传导！北大清华提出WaveFormer，首创波动方程建模视觉

“全局交互” 几乎等同于 self-attention：每个 token 都能和所有 token 对话，效果强，但代价也直观 —— 复杂度随 token 数平方增长，分辨率一高就吃不消。现有方法大多从 “相似度匹配” 出发（attention），或从 “扩散 / 传导” 出发（热方程类方法）。但热方程本质上是一个强低通滤波器：随着传播时间增加，高频细节（边缘、纹理）会迅速消失，导致特征过平滑。

来自主题: AI技术研报

9220 点击 2026-01-21 10:39

官宣，Milvus开源语义高亮模型：告别饱和检索，帮RAG、agent剪枝80%上下文

RAG与agent用到深水区，一定会遇到这个问题：明明架构很完美，私有数据也做了接入，但项目上线三天，不但token账单爆了，模型输出结果也似乎总差点意思。

来自主题: AI技术研报

10407 点击 2026-01-15 09:19