AI资讯新闻榜单内容搜索-deepseek

DeepSeek V3到V3.2的进化之路，一文看全

12 月 1 日，DeepSeek 一口气发布了两款新模型：DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。几天过去，热度依旧不减，解读其技术报告的博客也正在不断涌现。知名 AI 研究者和博主 Sebastian Raschka 发布这篇深度博客尤其值得一读，其详细梳理了 DeepSeek V3 到 V3.2 的进化历程。

来自主题: AI技术研报

9597 点击 2025-12-08 12:48

谷歌最强大模型付费上线，在DeepSeek开源后被吐槽太贵

奥特曼又得拉响红色警报了。刚刚，谷歌再次扔出重磅炸弹——Gemini 3 Deep Think正式上线！轻松把草图变成逼真3D场景，不仅结构还原到位，就连镂空花纹与光影都处理得明明白白。

来自主题: AI资讯

9061 点击 2025-12-06 11:19

DeepSeek-V3.2巨「吃」Token，竟然是被GRPO背刺了

DeepSeek 一发布模型，总会引起业内的高度关注与广泛讨论，但也不可避免的暴露出一些小 Bug。

来自主题: AI技术研报

7066 点击 2025-12-05 10:05

从MiniMax到DeepSeek：为何头部大模型都在押注「交错思维」？

昨日，有位推特博主晒出了国内几大开源模型在轻量级软件工程 Agent 基准测试 mini-SWE-agent 上的成绩。该基准主要测试大模型在真实软件开发任务中的多步推理、环境交互和工程化能力。

来自主题: AI技术研报

10075 点击 2025-12-04 16:25

DeepSeek V3.2爆火，Agentic性能暴涨40%解密

DeepSeek V3.2的Agentic能力大增，离不开这项关键机制：Interleaved Thinking（交错思维链）。Interleaved Thinking风靡开源社区背后，离不开另一家中国公司的推动。

来自主题: AI技术研报

8765 点击 2025-12-04 14:58

老外傻眼！明用英文提问，DeepSeek依然坚持中文思考

就在前天，DeepSeek 一口气上新了两个新模型，DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。

来自主题: AI技术研报

8837 点击 2025-12-04 11:37

AI三国杀！OpenAI狂卷，DeepSeek封神，却被Mistral偷了家？

中美正忙着堆算力打AI战，欧洲却突然杀出一条血路：模型落地更重要！Mistral一口气扔出Large 3和Ministral 3，全开源、能看图、能跑在大多数电子设备上，甚至断网也能用。未来，AI是巨头的专属权力，还是人人都能握在手中的智能？这一次，欧洲给出了自己的答案。

来自主题: AI资讯

6696 点击 2025-12-04 09:50

DeepSeek-V3.2被找出bug了：疯狂消耗token，答案还可能出错，研究人员：GRPO老问题没解决

DeepSeek-V3.2很强很火爆，但随着讨论的深入，还是有bug被发现了。并且是个老问题：浪费token。不少网友都提到，DeepSeek-V3.2的长思考增强版Speciale，确确实实以开源之姿又给闭源TOP们上了压力，但问题也很明显：

来自主题: AI资讯

8718 点击 2025-12-04 09:49

DeepSeekV3.2技术报告还是老外看得细

ChatGPT三岁生日这一天，硅谷热议的新模型来自DeepSeek。

来自主题: AI资讯

6294 点击 2025-12-03 12:11

迎接「万物皆可RAG」时代：最新综述展示50多种多模态组合的巨大待探索空间

大模型最广泛的应用如 ChatGPT、Deepseek、千问、豆包、Gemini 等通常会连接互联网进行检索增强生成（RAG）来产生用户问题的答案。随着多模态大模型（MLLMs）的崛起，大模型的主流技术之一 RAG 迅速向多模态发展，形成多模态检索增强生成（MM-RAG）这个新兴领域。ChatGPT、千问、豆包、Gemini 都开始允许用户提供文字、图片等多种模态的输入。

来自主题: AI技术研报

7438 点击 2025-12-03 09:54