AI资讯新闻榜单内容搜索-Deep

野生DeepSeek火了，速度碾压官方版，权重开源

没等来 DeepSeek 官方的 R2，却迎来了一个速度更快、性能不弱于 R1 的「野生」变体！这两天，一个名为「DeepSeek R1T2」的模型火了！这个模型的速度比 R1-0528 快 200%，比 R1 快 20%。除了速度上的显著优势，它在 GPQA Diamond（专家级推理能力问答基准）和 AIME 24（数学推理基准）上的表现均优于 R1，但未达到 R1-0528 的水平。

来自主题: AI资讯

10139 点击 2025-07-04 22:18

DeepSeek-R2！？神秘模型惊现竞技场，真实身份引网友猜测

DeepSeek-R2，终于要来了？大模型竞技场秘密上线了一个叫steve的神秘模型，在对话中透露自己来自DeepSeek。不过，网友们并不满足于知道steve的厂商，开始讨论起了steve的具体身份。

来自主题: AI资讯

9271 点击 2025-07-04 13:14

DeepSeek对“王一博案”道歉？假新闻！

近日，一则消息在网络上引发热议。有媒体称，“DeepSeek就AI模型违规关联王一博与‘李爱庆腐败案’，作出道歉。”

来自主题: AI资讯

10103 点击 2025-07-04 11:41

刚刚，全球AI人才榜单首次曝光，华人撑起半边天，DeepSeek无人上榜

7月3日，2025全球数字经济大会上，一份重磅榜单面向全球首次揭晓。

来自主题: AI资讯

8515 点击 2025-07-04 11:02

推理AI致命弱点，大模型变「杠精」！被带偏后死不悔改

DeepMind新研究揭示了当与推理无关的想法，被直接注入到模型的推理过程中时，它们却难以恢复，而且越大的模型越难恢复。

来自主题: AI技术研报

9452 点击 2025-07-04 10:36

Meta-Think ≠ 记套路，多智能体强化学习解锁大模型元思考泛化

最近，关于大模型推理的测试时间扩展（Test time scaling law ）的探索不断涌现出新的范式，包括① 结构化搜索结（如 MCTS），② 过程奖励模型（Process Reward Model ）+ PPO，③ 可验证奖励（Verifiable Reward）+ GRPO（DeepSeek R1）。

来自主题: AI技术研报

9778 点击 2025-07-04 09:44