AI资讯新闻榜单内容搜索-DeepSeek-R

DeepSeek-R2为什么还没发？

全网翘首以盼的DeepSeek-R2，再次被曝推迟！据The Information报道，由于DeepSeek CEO梁文锋始终对R2的表现不满意，因此R2迟迟未能发布。此外，他们还援引两位国内知情人士的消息称，R2研发进程缓慢可能是由于缺少英伟达H20芯片。

来自主题: AI资讯

10551 点击 2025-06-27 16:46

连不上Gemini CLI，试下DeepSeek-R1接入Claude code

这两天Google推出了Gemini-CLI这个编程工具，功能和Claude Code基本一致，结果根本排不上队，登录一下很快闪退，和下图一样，使用感受令人不愉悦。很多人都在等着体验这个新工具，但现实是您可能要等很久才能轮到。

来自主题: AI技术研报

10642 点击 2025-06-27 11:00

7B小模型超越DeepSeek-R1：模仿人类教师，弱模型也能教出强推理LLM | Transformer作者团队

Thinking模式当道，教师模型也该学会“启发式”教学了—— 由Transformer作者之一Llion Jones创立的明星AI公司Sakana AI，带着他们的新方法来了！

来自主题: AI技术研报

10814 点击 2025-06-25 10:55

英伟达笑到最后！训练2000步，1.5B逆袭7B巨兽，Scaling真来了

强化学习可以提升LLM推理吗？英伟达ProRL用超2000步训练配方给出了响亮的答案。仅15亿参数模型，媲美Deepseek-R1-7B，数学、代码等全面泛化。

来自主题: AI技术研报

8394 点击 2025-06-22 16:32

坏了！R1的秘密被Deepmind发现了！「啊哈时刻」首次被披露，现已可量化！

自年初起，DeepSeek-R1、OpenAI o3、Qwen3等推理模型相继问世，展现出令人惊叹的智能水平，但它们为什么突然变得这么聪明？东京大学联合Google DeepMind的研究者们终于找到了答案。

来自主题: AI资讯

7766 点击 2025-06-21 13:01

大模型全员0分！谢赛宁领衔华人团队，最新编程竞赛基准出炉，题目每日更新禁止刷题

好夸张…… 参赛大模型全军覆没，通通0分。谢赛宁等人出题，直接把o3、Gemini-2.5-pro、Claude-3.7、DeepSeek-R1一众模型全都难倒。

来自主题: AI资讯

10897 点击 2025-06-19 11:03

刚刚，LMArena最新模型榜单出炉！DeepSeek-R1网页编程能力赶超了Claude Opus 4

在开源模型领域，DeepSeek 又带来了惊喜。

来自主题: AI资讯

10338 点击 2025-06-17 11:31

性能比肩DeepSeek-R1，MiniMax仅花380万训出推理大模型性价比新王｜开源

国产推理大模型又有重磅选手。MiniMax开源MiniMax-M1，迅速引起热议。

来自主题: AI技术研报

9078 点击 2025-06-17 11:06

别再信“LRM无需优化提示词”了，你至少输掉23%的性能，以R1为例

还记得DeepSeek-R1发布时AI圈的那波狂欢吗？"提示工程已死"、"再也不用费心写复杂提示了"、"推理模型已经聪明到不再需要学习提示词了"......这些观点在社交媒体上刷屏，连不少技术大佬都在转发。再到最近，“提示词写死了”......现实总是来得这么快——乔治梅森大学的研究者们用一个严谨得让人无法反驳的实验，狠狠打了所有人的脸！

来自主题: AI技术研报

9592 点击 2025-06-12 11:59

1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet，不用GPU也能运行

1.93bit量化之后的 DeepSeek-R1（0528），编程能力依然能超过Claude 4 Sonnet？

来自主题: AI技术研报

7929 点击 2025-06-10 15:28