AI资讯新闻榜单内容搜索-DeepSeek

DeepSeek新论文来了！联手清华、北大，优化智能体大模型推理

「DeepSeek V4 来了！」这样的消息是不是已经听烦了？总结来说，这篇新论文介绍了一个名为「DualPath」的创新推理系统，专门针对智能体工作负载下的大语言模型（LLM）推理性能进行优化。具体来讲，通过引入「双路径 KV-Cache 加载」机制，解决了在预填充 - 解码（PD）分离架构下，KV-Cache 读取负载不平衡的问题。

来自主题: AI技术研报

9269 点击 2026-02-27 11:35

DeepSeek V4逼近，美国慌了！被曝绕过英伟达优先国内，绝密参数已泄露

最近，炸裂消息一个接一个。首先，DeepSeek V4将在一周内上线。第二，它跳过英伟达，把访问权限首先给了某国内芯片厂商。另外，Anthropic因为蒸馏事件，也被群嘲了。

来自主题: AI资讯

10284 点击 2026-02-26 20:20

DeepSeek V4 更多细节曝光，最快下周发布

科技账号 Legit 率先披露，V4 的轻量版本代号为「sealion-lite（海狮轻量版）」，目前已在至少一家推理服务商处展开内测，相关方均签署了严格的保密协议。

来自主题: AI资讯

10154 点击 2026-02-26 10:37

DeepSeek连更GitHub，华尔街回想起被支配的恐惧：“DeepSeek第二时刻”要来了

DeepSeek员工节后一上班，美国AI圈又要抖三抖了（doge）。就从十几个小时前开始，DeepSeek的GitHub仓库突然一阵猛更新，Merge了一堆PR：维护者主要是mowentian——DeepSeekMoE等论文的署名作者之一Huang Panpan。他这一干活不要紧，大洋彼岸“V4来了？？？”的紧张神经，又被瞬间挑了起来。

来自主题: AI资讯

10511 点击 2026-02-25 10:37

Anthropic指控中国大模型“使诈”，马斯克凶猛炮轰，海外网友贴脸开骂

今天，美国大模型独角兽Anthropic连续发布多则推文、博客，指控DeepSeek、月之暗面和MiniMax三家中国AI实验室，正对Claude进行“工业级规模的蒸馏攻击”。

来自主题: AI资讯

9556 点击 2026-02-24 18:59

字节Seed用化学思想搞AI，把DeepSeek-R1的脑回路拆成了分子结构

字节Seed都开始用化学思想搞大模型了——深度推理是共价键、自我反思是氢键、自我探索是范德华力？！

来自主题: AI技术研报

10485 点击 2026-02-24 15:37

刚刚，Anthropic深夜大点名，这三家中国公司进行蒸馏攻击？！

刚刚， Anthropic 发推称，DeepSeek、Moonshot AI和MiniMax三家国内的 AI 公司对Claude进行大规模的蒸馏攻击。OK， A 社你真的很讨厌中国公司了。简单说就是：这三家公司用大量假账号，疯狂地向 Claude 提问，然后拿 Claude 的回答去训练自己的模型。

来自主题: AI资讯

9933 点击 2026-02-24 09:17

从AlphaGo到DeepSeek R1，推理的未来将走向何方？

机器之心编译如果把人生看作一个开放式的大型多人在线游戏（MMO），那么游戏服务器在刚刚完成一次重大更新的时刻，规则改变了。自 2022 年 ChatGPT 惊艳亮相以来，世界已经发生了深刻变化。在

来自主题: AI技术研报

10314 点击 2026-02-20 12:38

一个模型统一所有离线任务！微软用671B大模型重构广告推荐「推理大脑」

近日，微软Bing Ads与DKI团队发表论文《AdNanny: One Reasoning LLM for All Offline Ads Recommendation Tasks》，宣布基于DeepSeek-R1 671B打造了统一的离线推理中枢AdNanny，用单一模型承载所有离线任务。这标志着从维护一系列任务特定模型，转向部署一个统一的、推理中心化的基础模型，从

来自主题: AI技术研报

9877 点击 2026-02-18 13:29

刚刚，DeepSeek V4基准测试泄露！疑似明天发布，全场惊呼新王归来

DeepSeek V4，据说明天就要上线了？这是首个匹敌顶尖闭源模型的开源模型，被网友评为「一鲸落万物生」。泄露的基准测试显示，它在SWE-bench Verified上取得了83.7%，已经超越Opus 4.5和GPT-5.2！

来自主题: AI资讯

10644 点击 2026-02-16 20:04