AI资讯新闻榜单内容搜索-tokens

7B扩散语言模型单样例1000+ tokens/s！上交大联合华为推出LoPA

，时长 00:20 视频 1：单样例推理速度对比：SGLang 部署的 Qwen3-8B (NVIDIA) vs. LoPA-Dist 部署 (NVIDIA & Ascend)（注：NVIDIA 平台

来自主题: AI技术研报

8722 点击 2026-01-01 10:09

两大模型发布！豆包大模型日均使用量突破50万亿Tokens

今天，在 FORCE 原动力大会上，火山引擎发布豆包大模型1.8、豆包视频生成模型 Seedance 1.5 pro。经过一年多的持续升级，豆包大模型家族在多模态理解和生成能力、Agent 能力上，已位于全球第一梯队。

来自主题: AI资讯

13083 点击 2025-12-18 13:11

视频大模型新基元：用Object Tokens重塑细节感知与指代理解

被顶会ICCV 2025以554高分接收的视频理解框架来了！

来自主题: AI技术研报

8322 点击 2025-11-28 09:24

Cursor 2.0 发布首个编程大模型Composer！代码生成250tokens/秒，强化学习+MoE架构

最新进展，Cursor 2.0正式发布，并且首次搭载了「内部」大模型。没错，不是GPT、不是Claude，如今模型栏多了个新名字——Composer。实力相当炸裂：据官方说法，Composer仅需30秒就能完成复杂任务，比同行快400%

来自主题: AI资讯

8900 点击 2025-10-30 09:14

ChatGPT千亿tokens，干掉麦肯锡5000名顾问

魔幻啊魔幻。全球顶级咨询公司麦肯锡，居然收到了OpenAI最近给Tokens消耗大客户颁发的奖牌。麦肯锡自己还怪自豪的，第一时间就把奖牌po到了领英上。

来自主题: AI资讯

7488 点击 2025-10-21 16:42

递归语言模型登场！MIT华人新作爆火，扩展模型上下文便宜又简单

目前，所有主流 LLM 都有一个固定的上下文窗口（如 200k, 1M tokens）。一旦输入超过这个限制，模型就无法处理。即使在窗口内，当上下文变得非常长时，模型的性能也会急剧下降，这种现象被称为「上下文腐烂」（Context Rot）：模型会「忘记」开头的信息，或者整体推理能力下降。

来自主题: AI资讯

8077 点击 2025-10-17 16:12

谷歌月Tokens消耗量领跑全球了：1300000000000000（别数了是千万亿）

1.3千万亿，一个令人咂舌的数字。这就是谷歌每月处理的Tokens用量。据谷歌“宣传委员”Logan Kilpatrick透露，这一数据来自谷歌对旗下各平台的内部统计。那么在中文世界里，1.3千万亿Tokens约2.17千万亿汉字。换算成对话量，一本《红楼梦》的字数在70-80万左右，相当于一个月内所有人和谷歌AI聊了近30亿本《红楼梦》的内容。

来自主题: AI资讯

9503 点击 2025-10-10 23:21