AI资讯新闻榜单内容搜索-大模型推理

推理提速4倍！莫纳什、浙大提出动态拼接，大小模型智能协作

针对「大模型推理速度慢，生成token高延迟」的难题，莫纳什、北航、浙大等提出R-Stitch框架，通过大小模型动态协作，衡量任务风险后灵活选择：简单任务用小模型，关键部分用大模型。实验显示推理速度提升最高4倍，同时保证高准确率。

来自主题: AI技术研报

7072 点击 2025-10-18 12:21

技能英伟达桌面超算，加入苹果Mac Studio快爆了：推理速度飙升至277%

英伟达桌面超算，邪修玩法来了！两台DGX Spark串联一台苹果Mac Studio，就能让大模型推理速度提升至2.77倍。

来自主题: AI资讯

7163 点击 2025-10-17 16:16

700万参数击败DeepSeek R1等，三星一人独作爆火，用递归颠覆大模型推理

来自加拿大蒙特利尔三星先进技术研究所（SAIT）的高级 AI 研究员 Alexia Jolicoeur-Martineau 介绍了微型递归模型（TRM）。这个 TRM 有多离谱呢？一个仅包含 700 万个参数（比 HRM 还要小 4 倍）的网络，在某些最困难的推理基准测试中，

来自主题: AI技术研报

9123 点击 2025-10-10 13:08

多模态推理最高加速3.2倍！华为诺亚新算法入选NeurIPS 2025

不牺牲任何生成质量，将多模态大模型推理最高加速3.2倍！华为诺亚方舟实验室最新研究已入选NeurIPS 2025。

来自主题: AI技术研报

8195 点击 2025-09-27 11:19

链式思维是幻象吗？从数据分布视角重新审视大模型推理，马斯克回复，Grok破防

思维链 (CoT) 提示技术常被认为是让大模型分步思考的关键手段，通过在输入中加入「Let’s think step by step」等提示，模型会生成类似人类的中间推理步骤，显著提升复杂任务的表现。然而，这些流畅的推理链条是否真的反映了模型的推理能力？

来自主题: AI技术研报

7148 点击 2025-08-15 12:38

字节&MAP重塑大模型推理算法优化重点，强化学习重在高效探索助力LLM提升上限

强化学习（RL）范式虽然显著提升了大语言模型（LLM）在复杂任务中的表现，但其在实际应用中仍面临传统RL框架下固有的探索难题。

来自主题: AI资讯

7923 点击 2025-08-08 11:06

超大模型推理加速2.18倍！SGLang联合美团技术团队开源投机采样训练框架

专门适用超大模型、带来2.18倍推理加速，最新投机采样训练框架开源！ SGLang团队联合美团搜推平台、Cloudsway.AI开源SpecForge。

来自主题: AI资讯

8513 点击 2025-07-27 13:22

斯坦福大模型推理课免费了，谷歌推理团队创始人主讲

如何理解大模型推理能力？现在有来自谷歌DeepMind推理负责人Denny Zhou的分享了。就是那位和清华姚班马腾宇等人证明了只要思维链足够长，Transformer就能解决任何问题的Google Brain推理团队创建者。 Denny Zhou围绕大模型推理过程和方法，在斯坦福大学CS25上讲了一堂“LLM推理”课。

来自主题: AI资讯

7987 点击 2025-07-25 16:57

面对无解问题大模型竟会崩溃？港中文&华为联合提出首个大模型推理可靠性评估基准

今年初以 DeepSeek-r1 为代表的大模型在推理任务上展现强大的性能，引起广泛的热度。然而在面对一些无法回答或本身无解的问题时，这些模型竟试图去虚构不存在的信息去推理解答，生成了大量的事实错误、无意义思考过程和虚构答案，也被称为模型「幻觉」问题，如下图（a）所示，造成严重资源浪费且会误导用户，严重损害了模型的可靠性（Reliability）。

来自主题: AI技术研报

8833 点击 2025-07-17 11:24

告别数据「噪音」，UCSD大模型推理新方法DreamPRM充当「信号放大器」，登顶MathVista测评榜

使用过程奖励模型（PRM）强化大语言模型的推理能力已在纯文本任务中取得显著成果，但将过程奖励模型扩展至多模态大语言模型（MLLMs）时，面临两大难题：

来自主题: AI技术研报

8648 点击 2025-07-12 11:58