AI资讯新闻榜单内容搜索-Deepseek

AI三国杀！OpenAI狂卷，DeepSeek封神，却被Mistral偷了家？

中美正忙着堆算力打AI战，欧洲却突然杀出一条血路：模型落地更重要！Mistral一口气扔出Large 3和Ministral 3，全开源、能看图、能跑在大多数电子设备上，甚至断网也能用。未来，AI是巨头的专属权力，还是人人都能握在手中的智能？这一次，欧洲给出了自己的答案。

来自主题: AI资讯

6254 点击 2025-12-04 09:50

DeepSeek-V3.2被找出bug了：疯狂消耗token，答案还可能出错，研究人员：GRPO老问题没解决

DeepSeek-V3.2很强很火爆，但随着讨论的深入，还是有bug被发现了。并且是个老问题：浪费token。不少网友都提到，DeepSeek-V3.2的长思考增强版Speciale，确确实实以开源之姿又给闭源TOP们上了压力，但问题也很明显：

来自主题: AI资讯

8376 点击 2025-12-04 09:49

DeepSeekV3.2技术报告还是老外看得细

ChatGPT三岁生日这一天，硅谷热议的新模型来自DeepSeek。

来自主题: AI资讯

5961 点击 2025-12-03 12:11

迎接「万物皆可RAG」时代：最新综述展示50多种多模态组合的巨大待探索空间

大模型最广泛的应用如 ChatGPT、Deepseek、千问、豆包、Gemini 等通常会连接互联网进行检索增强生成（RAG）来产生用户问题的答案。随着多模态大模型（MLLMs）的崛起，大模型的主流技术之一 RAG 迅速向多模态发展，形成多模态检索增强生成（MM-RAG）这个新兴领域。ChatGPT、千问、豆包、Gemini 都开始允许用户提供文字、图片等多种模态的输入。

来自主题: AI技术研报

6960 点击 2025-12-03 09:54

刚刚，「欧洲的DeepSeek」发布Mistral 3系列模型，全线回归Apache 2.0

刚刚，「欧洲的 DeepSeek」Mistral AI 刚刚发布了新一代的开放模型 Mistral 3 系列模型。该系列有多个模型，具体包括：「世界上最好的小型模型」：Ministral 3（14B、8B、3B），每个模型都发布了基础版、指令微调版和推理版。

来自主题: AI资讯

8696 点击 2025-12-03 08:26

DeepSeek-V3.2｜技术报告解读

这是一篇报告解读，原文是《DeepSeek-V3.2: Pushing the Frontier of Open Large Language Models》

来自主题: AI技术研报

9126 点击 2025-12-02 10:46

DeepSeek-V3.2系列开源，性能直接对标Gemini-3.0-Pro

突袭！ChatGPT发布三周年，DeepSeek嚯一下发出两个模型：DeepSeek-V3.2和DeepSeek-V3.2-Speciale。前者聚焦平衡实用，适用于日常问答、通用Agent任务、真实应用场景下的工具调用。

来自主题: AI资讯

9781 点击 2025-12-01 21:21

Z Potentials｜独家专访美国DeepSeek背后的90后投资人，他眼中的下一代万亿美元公司在哪里？

在本次 Z Potential 独家专访中，我们邀请到了 Striker Venture Partners 合伙人、Skild AI 与 Reflection AI 的早期投资人 Brian Zhan，深度解析他在 AI 时代如何快速投出明星级别的独角兽公司。

来自主题: AI资讯

8237 点击 2025-11-30 11:49

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

大模型推理的爆发，实际源于 scaling 范式的转变：从 train-time scaling 到 test-time scaling（TTS），即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法：通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗？

来自主题: AI技术研报

8582 点击 2025-11-30 09:30

国产最强多模态宝座又易主？671B参数练就“火眼金睛”，基于DeepSeek打造

智东西11月28日报道，刚刚，快手开源其新一代旗舰多模态大模型Keye-VL-671B-A37B。该模型基于DeepSeek-V3-Terminus打造，拥有6710亿个参数，在保持基础模型通用能力的前提下，对视觉感知、跨模态对齐与复杂推理链路进行了升级，实现了较强的多模态理解和复杂推理能力。

来自主题: AI技术研报

9250 点击 2025-11-29 20:12