AI资讯新闻榜单内容搜索-DeepSee

DeepSeek、GPT、Qwen，所有大模型架构图都有，Karpathy：宝藏画廊！

最近几年，大模型赛道好不热闹。

来自主题: AI技术研报

6876 点击 2026-03-17 08:50

英伟达叫板DeepSeek？怒投260亿美元，要打造最强开源模型

据 2025 年的一份财务文件显示，英伟达将在未来五年内投入 260 亿美元用于构建开源人工智能模型。据《WIRED》杂志报道，英伟达高管证实了这一此前从未被报道过的消息。

来自主题: AI资讯

9540 点击 2026-03-14 08:40

独家｜梁文锋将携DeepSeek V4撞上姚顺雨

我们独家获悉，外界千呼万唤的DeepSeek-V4将于4月正式上线。作为梁文锋打磨已久的多模态大模型，DeepSeek-V4除了在Coding能力上跃升之外，还将在LTM（long term memory长期记忆）上取得突破。

来自主题: AI资讯

11041 点击 2026-03-12 17:20

ICLR 2026｜早于DeepSeek Engram，STEM已重构Transformer「记忆」

近年来，随着大语言模型规模与知识密度不断提升，研究者开始重新思考一个更本质的问题：模型中的参数应如何被组织，才能更高效地充当「记忆」。

来自主题: AI技术研报

8534 点击 2026-03-10 09:31

OpenAI测谎13款大模型：Claude 3.7封神，GPT-5.2近乎失控！

OpenAI的最新研究揭示了一个反直觉的真相：越强大的推理模型，越管不住自己的「脑子」。在CoT-Control套件测试的13款前沿模型中，DeepSeek R1控制自身思维链的成功率仅为0.1%，Claude Sonnet 4.5也只有2.7%。

来自主题: AI资讯

9435 点击 2026-03-09 15:08

DeepSeek V4下周登场，美股再次颤抖！「跳过」英伟达，便宜50倍

DeepSeek V4下周登场：原生多模态，绕过英伟达，针对国产芯片深度优化。华尔街最怕的那条逻辑可能又要重演：算力霸权松动，美股先颤抖。

来自主题: AI资讯

9383 点击 2026-03-01 16:38

春节AI大战退潮，Claude被封杀Anthropic「单挑」中美，全民养「龙虾」｜Hunt Good 周报

所有人都在等 DeepSeek，春节来，下周来，还是没来。一场为了全面「狙击」 DeepSeek，抢夺流量，但是 DeepSeek 都没出现的春节大战，就在一轮又一轮的红包奶茶里轰轰烈烈地结束了。

来自主题: AI资讯

9075 点击 2026-03-01 10:56

全球最大游戏博主「偷师」DeepSeek，爆改国产大模型干翻 ChatGPT

全球最大游戏博主 PewDiePie，又整活了。他靠着「偷师」DeepSeek、清华大学发布的技术文档，用一堆魔改显卡成功微调出一个自己的 AI 模型，而这个模型在编程基准测试中的表现，竟然超越了 GPT-4 和 Gemini 2.5 Pro。

来自主题: AI资讯

8969 点击 2026-02-28 15:34

OpenClaw深度分析：为什么突然就火了，以及对我们意味着什么

这篇文章就想从更高层的角度抽丝剥茧：OpenClaw到底做对了什么，为什么是它火，以及这跟我们有什么关系。我有一个暴论：OpenClaw火的原因，和去年这个时候DeepSeek火的原因，是高度类似的。

来自主题: AI资讯

9659 点击 2026-02-27 17:02

DeepSeek新论文来了！联手清华、北大，优化智能体大模型推理

「DeepSeek V4 来了！」这样的消息是不是已经听烦了？总结来说，这篇新论文介绍了一个名为「DualPath」的创新推理系统，专门针对智能体工作负载下的大语言模型（LLM）推理性能进行优化。具体来讲，通过引入「双路径 KV-Cache 加载」机制，解决了在预填充 - 解码（PD）分离架构下，KV-Cache 读取负载不平衡的问题。

来自主题: AI技术研报

9087 点击 2026-02-27 11:35