AI资讯新闻榜单内容搜索-Token

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Token

token级，精准控制生成长度：3B模型击败GPT 5.4、Claude

token级，精准控制生成长度：3B模型击败GPT 5.4、Claude

token级，精准控制生成长度：3B模型击败GPT 5.4、Claude

LenVM将长度建模提升到token级别，开辟可扩展价值预训练的新维度——3B开源模型精确长度控制全面击败GPT-5.4、Claude-Opus-4-6等顶级闭源模型；相同token预算下推理准确率提升10倍（63% vs 6%）；沿模型规模、数据量、采样数三轴无饱和scaling的value pretraining

来自主题: AI技术研报

6192 点击 2026-05-08 14:06

英伟达力荐，小团队两个月开源一款「光速级」智能体推理引擎

英伟达力荐，小团队两个月开源一款「光速级」智能体推理引擎

英伟达力荐，小团队两个月开源一款「光速级」智能体推理引擎

智能体时代的核心是算力。

来自主题: AI技术研报

9144 点击 2026-05-08 10:23

大模型价格战背后，真正稀缺的不是Token

大模型价格战背后，真正稀缺的不是Token

大模型价格战背后，真正稀缺的不是Token

Anthropic在四月初发布Mythos，距离现在已经近一个月。行业内对于它的讨论，更多的关注点在于“它有多强”，但我更想聊聊它的“发布方式”。

来自主题: AI资讯

9255 点击 2026-05-08 09:53

只看图片就能学会压缩Token！浙大&阿里新框架多轮VQA压缩率90%，精度不掉｜CVPR 2026

只看图片就能学会压缩Token！浙大&阿里新框架多轮VQA压缩率90%，精度不掉｜CVPR 2026

只看图片就能学会压缩Token！浙大&阿里新框架多轮VQA压缩率90%，精度不掉｜CVPR 2026

多轮视觉问答，正在成为LVLM推理效率的“照妖镜”。

来自主题: AI技术研报

8727 点击 2026-05-08 09:52

Token需求狂飙千倍，22亿热钱涌向这家AGI Infra头号玩家

Token需求狂飙千倍，22亿热钱涌向这家AGI Infra头号玩家

Token需求狂飙千倍，22亿热钱涌向这家AGI Infra头号玩家

近日，这家公司宣布此前已再获超7亿元融资。这个融资规模，稳稳位居国内AI原生基础设施企业第一梯队，也是国内底层AI赛道成长速度最惊人的新锐企业之一。

来自主题: AI资讯

10074 点击 2026-05-07 15:31

号称1200万token上下文的模型来了，数据亮眼但疑点重重

号称1200万token上下文的模型来了，数据亮眼但疑点重重

号称1200万token上下文的模型来了，数据亮眼但疑点重重

当地时间 5 月 5 日，迈阿密一家名为 Subquadratic 的公司走出隐身模式。CTO Alexander Whedon 在 X 上把首款模型 SubQ 称作“a major breakthrough in LLM intelligence”（LLM 智能领域的重大突破），

来自主题: AI资讯

7549 点击 2026-05-07 12:02

「魔形智能」完成数亿元 Pre-A 轮融资：加速建设“Token 超级工厂”

「魔形智能」完成数亿元 Pre-A 轮融资：加速建设“Token 超级工厂”

「魔形智能」完成数亿元 Pre-A 轮融资：加速建设“Token 超级工厂”

今日，云启种子轮领投项目「魔形智能」宣布完成数亿元人民币 Pre-A 轮融资。自成立以来，魔形智能围绕“Token 超级工厂”持续构建技术与交付能力，专注于为全球 AGI 产业提供高性能、高质量、高附加值的 Token 产品。

来自主题: AI资讯

8339 点击 2026-05-07 10:29

本地4B开源模型，把任何App当Skill用！告别token焦虑，私密性强～

本地4B开源模型，把任何App当Skill用！告别token焦虑，私密性强～

本地4B开源模型，把任何App当Skill用！告别token焦虑，私密性强～

上次给大家分享了一个 CUA 的开源项目，能让 AI Agent 直接操控电脑界面，相当于把任何 App 都变成 Agent 的 Skill。反响还不错。

来自主题: AI技术研报

7460 点击 2026-05-07 10:18

不改模型、不降质量，谷歌让Gemma 4快了3倍：本地跑大模型彻底变天

不改模型、不降质量，谷歌让Gemma 4快了3倍：本地跑大模型彻底变天

不改模型、不降质量，谷歌让Gemma 4快了3倍：本地跑大模型彻底变天

谷歌刚刚给Gemma 4家族更新了一项关键能力：Multi-Token Prediction（MTP）推测解码架构，推理速度最高提升3倍，输出质量不变。

来自主题: AI资讯

9713 点击 2026-05-06 14:56

OpenAI 「实时语音」架构首次公开

OpenAI 「实时语音」架构首次公开

OpenAI 「实时语音」架构首次公开

Realtime API 是 OpenAI 的实时语音交互接口，在 24 年的 DevDay 首次亮相，当时还是 beta，调用贵到离谱，音频输出 200 刀/百万 token：OpenAI 凌晨发布：Realtime 实时多模态 API，及其他

来自主题: AI技术研报

9857 点击 2026-05-06 09:49

上一页当前第14页,共66页下一页