AI资讯新闻榜单内容搜索-模型推理

中国团队首次夺魁！无问芯穹FlightVGM获FPGA'25最佳论文，峰值算力超GPU21倍

国际可重构计算领域顶级会议 ——FPGA 2025 在落幕之时传来消息，今年的最佳论文颁发给了无问芯穹和上交、清华共同提出的视频生成大模型推理 IP 工作 FlightVGM，这是 FPGA 会议首次将该奖项授予完全由中国大陆科研团队主导的研究工作，同时也是亚太国家团队首次获此殊荣。

来自主题: AI资讯

10944 点击 2025-03-03 10:45

强化学习训练数据越多，模型推理能力就越强？新研究提出LIM方法，揭示提升推理能力的关键在于优化数据质量，而不是数据规模。该方法在小模型上优势尽显。从此，强化学习Scaling Law可能要被改写了！

来自主题: AI技术研报

7601 点击 2025-02-18 20:07

用代码训练大模型思考，其他方面的推理能力也能提升。

来自主题: AI技术研报

6146 点击 2025-02-18 10:40

最新大语言模型推理测试引众议，DeepSeek R1常常在提供错误答案前就“我放弃”了？？ Cursor刚刚参与了一项研究，他们基于NPR周日谜题挑战（The Sunday Puzzle），构建了一个包含近600个问题新基准测试。

来自主题: AI技术研报

7569 点击 2025-02-14 17:41

o1背后的推理原理，斯坦福和伯克利帮我们总结好了！

来自主题: AI资讯

8078 点击 2025-01-20 15:18

Falcon 方法是一种增强半自回归投机解码框架，旨在增强 draft model 的并行性和输出质量，以有效提升大模型的推理速度。Falcon 可以实现约 2.91-3.51 倍的加速比，在多种数据集上获得了很好的结果，并已应用到翼支付多个实际业务中。

来自主题: AI技术研报

8383 点击 2025-01-08 14:38

大模型的的发布固然令人欣喜，但是各类测评也是忙坏了众多 AI 工作者。大模型推理的幻觉问题向来是 AI 测评的重灾区，诸如 9.9>9.11 的经典幻觉问题，各大厂家恨不得直接把问题用 if-else 写进来。

来自主题: AI技术研报

9300 点击 2024-12-30 10:39

o1不是通向大模型推理的唯一路径！ MIT的新研究发现，在测试时对大模型进行训练，可以让推理水平大幅提升。

来自主题: AI技术研报

4131 点击 2024-11-12 13:17

改进KV缓存压缩，大模型推理显存瓶颈迎来新突破—— 中科大研究团队提出Ada-KV，通过自适应预算分配算法来优化KV缓存的驱逐过程，以提高推理效率。

来自主题: AI技术研报

5570 点击 2024-11-02 19:10

AI coding 是模型推理能力增加之后的下一个竞争高地，除了模型厂商、AI Labs 之外，这个领域的参与者也有着 Cursor 这样的初创团队。

来自主题: AI资讯

7735 点击 2024-11-01 10:35