AI资讯新闻榜单内容搜索-大模型推理

谷歌传奇“院士”：Gemini核心秘方不会公开！大模型推理还有很大降本空间！AGI太远，我更喜欢3~5年的研究，登月计划：医疗

“与AGI太过遥远的炒作相比，我非常喜欢这种 3 到 5 年的时间窗口。”“AI 现在最大的问题，已经不是不够聪明，而是太难真正落地。”这些非常务实的观点，并不是出自AI怀疑论者。相反，它出自硅谷圈内那位“工程与学术”的双修神话：

来自主题: AI资讯

8811 点击 2025-12-16 17:18

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

大模型推理的爆发，实际源于 scaling 范式的转变：从 train-time scaling 到 test-time scaling（TTS），即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法：通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗？

来自主题: AI技术研报

7822 点击 2025-11-30 09:30

无需训练、只优化解码策略，DTS框架让大模型推理准确率提升6%，推理长度缩短23%

专注推理任务的 Large Reasoning Models 在数学基准上不断取得突破，但也带来了一个重要问题：越想越长、越长越错。本文解读由 JHU、UNC Charlotte 等机构团队的最新工作

来自主题: AI技术研报

6796 点击 2025-11-22 11:31

英伟达、DeepSeek集体跟进！18个月前被忽视，如今统治AI推理

2024年，加州大学圣地亚哥分校「Hao AI Lab」提出了DistServe的解耦推理理念，短短一年多时间，迅速从实验室概念成长为行业标准，被NVIDIA、vLLM等主流大模型推理框架采用，预示着AI正迈向「模块化智能」的新时代。

来自主题: AI技术研报

8800 点击 2025-11-09 15:37

英伟达帮你省钱，让大模型推理「短而精」，速度快5倍

大模型推理到底要不要「长篇大论」？过去一年，OpenAI o 系列、DeepSeek-R1、Qwen 等一系列推理模型，把「长链思维」玩到极致：答案更准了，但代价是推理链越来越长、Token 消耗爆炸、响应速度骤降。

来自主题: AI技术研报

6600 点击 2025-11-04 16:09

港科提出新算法革新大模型推理范式：随机策略估值竟成LLM数学推理「神操作」

论文第一作者何浩然是香港科技大学博士生，研究方向包括强化学习和基础模型等，研究目标是通过经验和奖励激发超级智能。共同第一作者叶语霄是香港科技大学一年级博士。通讯作者为香港科技大学电子及计算机工程系、计

来自主题: AI技术研报

8267 点击 2025-11-01 09:24

大模型推理学习新范式！ExGRPO框架：从盲目刷题到聪明复盘

大模型在强化学习过程中，终于知道什么经验更宝贵了！来自上海人工智能实验室、澳门大学、南京大学和香港中文大学的研究团队，最近提出了一套经验管理和学习框架ExGRPO—— 通过科学地识别、存储、筛选和学习有价值的经验，让大模型在优化推理能力的道路上，走得更稳、更快、更远。

来自主题: AI技术研报

5995 点击 2025-10-23 15:42

推理提速4倍！莫纳什、浙大提出动态拼接，大小模型智能协作

针对「大模型推理速度慢，生成token高延迟」的难题，莫纳什、北航、浙大等提出R-Stitch框架，通过大小模型动态协作，衡量任务风险后灵活选择：简单任务用小模型，关键部分用大模型。实验显示推理速度提升最高4倍，同时保证高准确率。

来自主题: AI技术研报

6504 点击 2025-10-18 12:21

技能英伟达桌面超算，加入苹果Mac Studio快爆了：推理速度飙升至277%

英伟达桌面超算，邪修玩法来了！两台DGX Spark串联一台苹果Mac Studio，就能让大模型推理速度提升至2.77倍。

来自主题: AI资讯

6646 点击 2025-10-17 16:16

700万参数击败DeepSeek R1等，三星一人独作爆火，用递归颠覆大模型推理

来自加拿大蒙特利尔三星先进技术研究所（SAIT）的高级 AI 研究员 Alexia Jolicoeur-Martineau 介绍了微型递归模型（TRM）。这个 TRM 有多离谱呢？一个仅包含 700 万个参数（比 HRM 还要小 4 倍）的网络，在某些最困难的推理基准测试中，

来自主题: AI技术研报

8521 点击 2025-10-10 13:08