AI资讯新闻榜单内容搜索-DeepSeek-R

首个多模态专用慢思考框架！超GPT-o1近7个百分点，强化学习教会VLM「三思而后行」

在文本推理领域，以GPT-o1、DeepSeek-R1为代表的 “慢思考” 模型凭借显式反思机制，在数学和科学任务上展现出远超 “快思考” 模型（如 GPT-4o）的优势。

来自主题: AI技术研报

9030 点击 2025-06-07 11:00

多模态推理新基准！最强Gemini 2.5 Pro仅得60分，复旦港中文上海AILab等出品

逻辑推理是人类智能的核心能力，也是多模态大语言模型 (MLLMs) 的关键能力。随着DeepSeek-R1等具备强大推理能力的LLM的出现，研究人员开始探索如何将推理能力引入多模态大模型(MLLMs)

来自主题: AI技术研报

9952 点击 2025-06-07 10:35

见证历史！DeepSeek跃居全球第二AI实验室，R1登顶开源王座，R2全网催更

昨晚，终于等到了DeepSeek-R1-0528官宣。升级后的模型性能直逼o3和Gemini 2.5 Pro。如今，DeepSeek真正坐实了全球开源王者的称号，并成为了第二大AI实验室。

来自主题: AI资讯

11172 点击 2025-05-30 13:08

AI仅凭“自信”学会推理，浙大校友复刻DeepSeek长思维链涌现，强化学习无需外部奖励信号

复刻DeepSeek-R1的长思维链推理，大模型强化学习新范式RLIF成热门话题。

来自主题: AI技术研报

9980 点击 2025-05-29 15:10

新版DeepSeek R1你得这样用，太爽啦~

哈喽，大家好，我是袋鼠帝昨天下午下班后，DeepSeek R1更新了然而他们就只是悄悄在微信群里面发布了这个消息。

来自主题: AI资讯

9479 点击 2025-05-29 11:50

刚刚，新版DeepSeek-R1正式开源！直逼o3编程强到离谱，一手实测来了

新版DeepSeek-R1重磅开源，凌晨已放出权重！此次模型性能几乎与o4-mini（Medium）相当，编程实测超越Claude 4 Sonnet。网友纷纷惊叹：开源又一次胜利了。

来自主题: AI资讯

8224 点击 2025-05-29 11:44

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版，实测编程性能直逼claude 4

今天，我们正式发布 DeepSeek-R1，并同步开源模型权重。DeepSeek-R1 遵循 MIT License，允许用户通过蒸馏技术借助 R1 训练其他模型。DeepSeek-R1 上线API，对用户开放思维链输出，通过设置 `model='deepseek-reasoner'` 即可调用。

来自主题: AI资讯

10355 点击 2025-05-28 21:49

CoT推理大溃败？哈佛华人揭秘：LLM一思考，立刻就「失智」

DeepSeek-R1火了，推理模型火了，思维链（Chain-of-Thought，CoT）火了！

来自主题: AI技术研报

9378 点击 2025-05-21 15:28

可靠的Agent该用哪个模型，LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究，说当前最先进的LLM在多轮对话中表现会大幅下降，平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型（包括Claude 3.7-Sonnet、Deepseek-R1等）在多轮对话中的表现差异，还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报

9497 点击 2025-05-20 10:16

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

大型推理模型（如 OpenAI-o1、DeepSeek-R1）展现了强大的推理能力，但其静态知识限制了在复杂知识密集型任务及全面报告生成中的表现。为应对此挑战，深度研究智能体 WebThinker 赋予 LRM 在推理中自主搜索网络、导航网页及撰写报告的能力。

来自主题: AI技术研报

8655 点击 2025-05-16 11:04