AI资讯新闻榜单内容搜索-大模

ICML 2026 Spotlight| 拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

随着大模型参数规模持续扩大，推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码（Speculative Decoding, SD）通过「小模型 draft + 大模型 verify」的方式，将多个候选 token 放到一次目标模型前向中并行验证，从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报

8328 点击 2026-05-13 15:01

一家估值超5000亿美元的币圈富豪公司，秀出了性能碾压谷歌的AI医疗大模型。

来自主题: AI资讯

7132 点击 2026-05-13 10:48

谷歌周一发布报告，首次确认犯罪黑客使用AI大模型发现了一个此前未知的零日漏洞，并差点发动大规模攻击。这件事之所以炸裂，是因为安全界担心了好几年的「AI自动挖洞」，终于从理论变成了现实。而在Anthropic的Mythos模型已经找到数千个零日漏洞的背景下，这可能只是冰山一角。

来自主题: AI资讯

7321 点击 2026-05-13 10:26

随着大模型后训练（Post-training）技术的发展，强化学习（RL）在提升模型推理能力方面的表现备受瞩目。

来自主题: AI技术研报

9290 点击 2026-05-13 09:59

AI再也不是“回合制”了。Thinking Machines Lab（以下简称TML）发布首个模型，让实时交互能力成为模型原生能力。联合创始人翁荔出镜演示。

来自主题: AI资讯

9174 点击 2026-05-12 17:07

商汤最近做了一件大多数大模型公司都不舍得做的事。每 5 小时 1500 次免费调用，Token 消耗比同行低 60%，三款新产品同步上线，还把核心模型 U1 以 Apache 2.0 协议全面开源——在大模型公司普遍在想怎么收费的当下，商汤在反向操作。

来自主题: AI资讯

10551 点击 2026-05-12 16:47

2011年，Marc Andreessen写下“软件正在吞噬世界”。2026 年，Fortune用了一句话总结当前局面：“那个吃掉世界的东西，正在被吃掉。 ”

来自主题: AI资讯

9897 点击 2026-05-12 14:31

以 DeepSeek-R1、OpenAI GPT Thinking 为代表的大型推理模型，通过长达数千 token 的「思维链」在各类复杂推理任务中展现出卓越的性能。然而，这些模型普遍存在一个核心问题，即过度思考（overthinking）：

来自主题: AI技术研报

6687 点击 2026-05-12 14:31

随着语音、视频、多模态能力不断融入大语言模型（LLM），人与 AI 的交互正在越来越接近自然对话。今天的 LLM 不再只是回答问题的工具，也越来越多地出现在教育、客服、陪伴、心理健康等高度依赖情绪理解的场景中。

来自主题: AI技术研报

6369 点击 2026-05-12 14:31

当 AI 开始加速 AI，模型公司的迭代周期正在被进一步压缩，模型公司开始进入“月更时代”。

来自主题: AI资讯

8491 点击 2026-05-12 08:52