AI资讯新闻榜单内容搜索-Token

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Token
ICML 2026 | 打破「回音室」效应!人大孟澄团队&华为提出集成剪枝视角下的MoE新架构

ICML 2026 | 打破「回音室」效应!人大孟澄团队&华为提出集成剪枝视角下的MoE新架构

ICML 2026 | 打破「回音室」效应!人大孟澄团队&华为提出集成剪枝视角下的MoE新架构

近年来,Mixture-of-Experts(MoE)已经成为大模型扩展的重要架构之一。相比稠密 Transformer,MoE 通过稀疏激活机制,在每个 token 上只调用少量专家,从而在控制计算成本的同时扩大模型容量。然而,一个长期存在的问题是:专家越多,并不意味着专家真的学得越 “专”。

来自主题: AI技术研报
7443 点击    2026-05-23 09:56
首个三模式大语言模型:4倍token吞吐量,长文本秒级时代要来了?

首个三模式大语言模型:4倍token吞吐量,长文本秒级时代要来了?

首个三模式大语言模型:4倍token吞吐量,长文本秒级时代要来了?

英伟达提出了全球首个三模式的大语言模型系列,只需简单更改注意力模式 / 掩码,即可在自回归、扩散和自推测解码之间切换。一个模型,三种解码模式,没有额外的草稿模型,没有架构变更。最快的模式 token 吞吐量能提升 4 倍。

来自主题: AI技术研报
9040 点击    2026-05-22 15:33
Agent 的下半场,是账单|对话 OpenClacky 李亚飞

Agent 的下半场,是账单|对话 OpenClacky 李亚飞

Agent 的下半场,是账单|对话 OpenClacky 李亚飞

让 AI 来管理代码的话,每次读 500 行反而比读 1000 行更费 Token,而且人工编排流程真不如让大模型自己定,「很多的事儿,还是很反直觉的」

来自主题: AI资讯
8654 点击    2026-05-21 10:14
一夜告别Token账单!端侧AGI真来了

一夜告别Token账单!端侧AGI真来了

一夜告别Token账单!端侧AGI真来了

Agent不再只住在云端——联想携手此芯科技,把190 TOPS本地AI算力装进手掌大小的AI主机,让每个人都能拥有一座7×24小时运行的私人Token工厂。

来自主题: AI资讯
7288 点击    2026-05-21 10:13
从卖token到卖结果,这些公司开始让AI背KPI了

从卖token到卖结果,这些公司开始让AI背KPI了

从卖token到卖结果,这些公司开始让AI背KPI了

自从黄仁勋在 GTC 上大手一挥,鼓励企业把 token 消耗量算进工程师的 KPI,魔幻的事情就一天比一天多了。

来自主题: AI资讯
8339 点击    2026-05-19 15:32
LLM近期重大架构进化一览:从Gemma 4到DeepSeek V4

LLM近期重大架构进化一览:从Gemma 4到DeepSeek V4

LLM近期重大架构进化一览:从Gemma 4到DeepSeek V4

过去一段时间,很多人对大模型都有一个明显感受:token 总是不够用。

来自主题: AI技术研报
7005 点击    2026-05-19 15:32
字节会师何恺明!开源连续扩散语言模型Cola DLM

字节会师何恺明!开源连续扩散语言模型Cola DLM

字节会师何恺明!开源连续扩散语言模型Cola DLM

大语言模型真的只能走“预测下一个token”的路子吗?

来自主题: AI技术研报
9983 点击    2026-05-19 10:31