AI资讯新闻榜单内容搜索-小模型

AI奥数大奖出炉，英伟达摘桂冠！14B破解34题暴击DeepSeek R1

AIMO2最终结果出炉了！英伟达团队NemoSkills拔得头筹，凭借14B小模型破解了34道奥数题，完胜DeepSeek R1。

来自主题: AI资讯

6039 点击 2025-04-14 11:42

学术写作通常需要花费大量精力查询文献引用，而以ChatGPT、GPT-4等为代表的通用大语言模型（LLM）虽然能够生成流畅文本，但经常出现“引用幻觉”（Citation Hallucination），即模型凭空捏造文献引用。这种现象严重影响了学术论文的可信度与专业性。

来自主题: AI技术研报

7084 点击 2025-04-11 10:20

2025年斯坦福HAI报告重磅发布，456页深度剖析全球AI领域的最新趋势：中美顶级模型性能差距缩至0.3%，以DeepSeek为代表的模型强势崛起，逼近闭源巨头；推理成本暴降，小模型性能飙升，AI正变得更高效、更普惠。

来自主题: AI资讯

8278 点击 2025-04-08 16:45

多模态，性能超 GPT-4o Mini、Gemma 3，还能在单个 RTX 4090 上运行，这个小模型值得一试。

来自主题: AI资讯

3957 点击 2025-03-18 19:11

7B小模型+3.8万条训练数据，就能让音频理解和推断评测基准MMAU榜单王座易主？

来自主题: AI技术研报

2795 点击 2025-03-17 10:52

都说通用大模型轻松拿捏翻译，结果有人来掀桌了。

来自主题: AI技术研报

4936 点击 2025-03-13 11:30

32B小模型在超硬核「时间线索」推理谜题中，一举击败了o1、o3-mini、DeepSeek-R1，核心秘密武器便是GRPO，最关键的是训练成本暴降100倍。

来自主题: AI技术研报

9240 点击 2025-03-09 10:32

随着 DeepSeek-R1 的流行与 AI4Math 研究的深入，大模型在辅助形式化证明写作方面的需求日益增长。作为数学推理最直接的应用场景，形式化推理与验证（formal reasoning and verification），也获得持续关注。

来自主题: AI技术研报

4696 点击 2025-03-09 10:31

动辄百亿、千亿参数的大模型正在一路狂奔，但「小而美」的模型也在闪闪发光。

来自主题: AI技术研报

9513 点击 2025-02-27 16:51

只刷逻辑益智题，竟能让 AI 数学竞赛水平大幅提升？

来自主题: AI技术研报

6137 点击 2025-02-25 14:32