AI资讯新闻榜单内容搜索-R1

刚刚，全球首个混合推理模型Claude 3.7降世！最强编程大脑暴击DeepSeek R1

就在刚刚，Anthropic祭出首个混合推理Claude 3.7 Sonnet，堪称扩展思考模式的最强模型。在最新编码测试中，新模型暴击o3-mini、DeepSeek R1，AI编码王者出世了。

来自主题: AI资讯

10597 点击 2025-02-25 08:53

DeepSeek-R1背后关键——多头潜在注意力机制（MLA），现在也能轻松移植到其他模型了！

来自主题: AI技术研报

7545 点击 2025-02-24 16:53

自 OpenAI 发布 o1-mini 模型以来，推理模型就一直是 AI 社区的热门话题，而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未有的高峰。

来自主题: AI技术研报

9559 点击 2025-02-24 14:40

随着AI工具越来越普及，类似Deep Researh这样的工具越来越好用，科学研究成果呈现爆炸式增长。以arXiv为例，仅2024年10月就收到超过24,000篇论文提交。

来自主题: AI技术研报

10900 点击 2025-02-24 10:09

国内首个生态环境“AI报告评审专家”已完成土壤污染状况调查报告领域的前期训练，启动上线试运行。日前，无锡市梁溪生态环境局已完成DeepSeek-R1“满血版”大模型本地化部署，通过AI与生态环境业务深度融合，

来自主题: AI资讯

8607 点击 2025-02-24 08:51

DeepSeek的横空出世引发大模型算力逻辑的质疑，英伟达股价一度暴跌。然而，黄仁勋却在最新访谈中表示，市场对DeepSeek的理解“完全搞反了”。

来自主题: AI资讯

8067 点击 2025-02-23 11:33

DeepSeek啥都开源了，就是没有开源训练代码和数据。现在，开源RL训练方法只需要用1/30的训练步骤就能赶上相同尺寸的DeepSeek-R1-Zero蒸馏Qwen。

来自主题: AI技术研报

9709 点击 2025-02-22 21:30

OpenAI o1和DeepSeek-R1靠链式思维（Chain-of-Thought, CoT）展示了超强的推理能力，但这一能力能多大程度地帮助视觉推理，又应该如何细粒度地评估视觉推理呢？

来自主题: AI技术研报

9855 点击 2025-02-22 21:27

不到10美元，3B模型就能复刻DeepSeek的顿悟时刻了？来自荷兰的开发者采用轻量级的RL算法Reinforce-Lite，把复刻成本降到了史上最低！同时，微软亚研院的一项工作，也受DeepSeek-R1启发，让7B模型涌现出了高级推理技能。

来自主题: AI技术研报

7459 点击 2025-02-22 15:50

DeepSeek-R1及其蒸馏版本模型突破了AI Reasoning和大规模AI性能的新基准，其中DeepSeek-R1-Zero和DeepSeek-R1，已经在推理和问题求解上树立了新的标准。本次研究聚焦于如何利用已有的机器进行模型部署，使用这些先进的模型进行开发和研究。

来自主题: AI技术研报

11715 点击 2025-02-21 18:06